阿里云为什么对大模型持续乐观?

来源: 农发行双鸭山市分行建立“两周一学”学习机制

责任编辑: 慕瀚

发布时间: 2024-09-22 00:29:30

0

0

在大模型行业集体迷茫之际,阿里云却在2024云栖大会上释放了诸多积极信号。

大模型走红快两年,目前的发展状态和此前业界的预期还有较大差距,一些大模型公司开始出现战略摇摆。但阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中表示,过去22个月,AI发展的速度超过任何历史时期。

一方面是大模型技术快速迭代以及技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

另一方面,模型推理成本指数级下降,已经远远超过摩尔定律。以通义千问为例,一年来,通义千问API在阿里云百炼上的调用价格下降了97%以上,百万Tokens调用花费最低已经降到了3毛钱,未来还有继续下降的趋势。

吴泳铭给当下大模型发展状态的定义是“AGI变革的早期阶段”,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。在他看来,全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。

从2024云栖大会上的一系列发布来看,阿里云对大模型的乐观不只停留在口号上,而是要继续实打实投入。

阿里云和同行态度的强烈反差,背后是彼此对大模型应用落地前景认知的差异导致的。

大模型的想象空间不只在手机屏幕

大模型太多,应用却太少是当下整个行业面临的问题,大模型要跑起来、更要用起来,需要走好落地应用“最后一公里”。

从各家基础模型公司和应用层公司的探索来看,目前大模型的落地应用分为B端和C端两个方向。

在B端场景中,大模型目前已经在金融、工业、教育、医疗、政务等行业中得到应用,对研发设计、生产制造、经营管理、营销服务业务环节带来一些助力。但整体来看,很多企业对大模型的应用还在探索阶段,大模型依然面临落地难、落地成本高的问题。

C端场景的边际成本更低,被大模型从业者寄予了更多期待。AI助理被认为是大模型时代的超级应用,无论是以月之暗面为代表的大模型创业公司,还是腾讯、字节跳动、百度等互联网大厂,都相继推出了AI助理类应用。但豆包、Kimi等多个AI助手应用的表现还没达到人们的高预期,产品形态依然在演进,暂时看不到移动互联网时代超级应用爆发的势头。

很多从业者对大模型的落地应用感到迷茫,一个重要的原因是他们把对大模型应用落地的场景局限在手机屏幕上。

吴泳铭在2024云栖大会上给出了不一样的答案。在他看来,AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

正因为如此,我们更应该跳出移动互联网的视角来看AI大模型的未来。很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

吴泳铭表示,AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

这样的变革已经在一些行业发生,比如汽车行业。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

在吴泳铭看来,机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

从这个角度来看,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。AI大模型的价值也不仅仅局限在商业领域,更重要的是将给社会生活带来巨大改变。

这是一个更大的历史机遇,也值得更多从业者积极投入、提前布局。能够抓住这个历史机遇的企业,将释放出比移动互联网高速增长时代更大的价值。

强大的基建才能催生AI新未来

在颠覆式的新浪潮下,坚定的技术乐观派才会真正走在时代前面,引领变革的发生。

在吴泳铭看来,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,很多人会在迟疑中错过。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高。业界先进的模型参数规模和数据规模仍在持续增长,巨头之争已经从千亿模型向万亿模型发展。

比如,GPT-4模型具有1.8万亿参数,在约 13万亿个Token上进行了训练,算力需求相当于在大约2.5万张A100加速卡上运行90~100天。Meta在原有1.6万张A100卡集群基础上又建设两个具有约2.5万张H100加速卡集群,用来加速LLaMA3的训练。由此可见,万卡已经成为未来先进大模型训练的新起点。

尽管先进模型的门槛提升至几十上百亿美金,但头部大厂在投入上未曾迟疑。在海外,谷歌、微软、亚马逊、英伟达、Meta、苹果和xAI,每年在前沿技术上的投资高达 4000 亿美元,大部分资金都投向大模型和AI基础设施。

国内大厂中,阿里云投入压强最高,AI基础设施、基础模型、对外投资全覆盖。本届云栖上,吴泳铭表示,“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。”

过去一年,阿里云从以CPU为主导的传统计算体系,加速向以GPU为主导的AI计算体系演进,新增算力超50%都是AI算力。阿里云CTO周靖人在演讲中表示,阿里云正在围绕AI时代树立AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

周靖人在2024云栖大会现场展示了阿里云全系列产品家族面向AI的升级:最新上线的磐久AI服务器,并提供AI算法预测GPU故障,准确率达92%;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

在模型层,阿里云也持续饱和式投入,几乎保持以月为周期迭代基础模型。大会现场,阿里云宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,同时还发布了开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

其中,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

今年,大部分大模型厂商都试图通过降低大模型的使用门槛来推动大模型在更多行业落地。得益于基础设施的强大,阿里云在降低企业和开发者使用成本方面也是最积极也是最激进的厂商之一。

今年5月,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long价格直降97%,1块钱即可买200万tokens,相当于5本《新华字典》的文字量。降价后,Qwen-Long价格约为GPT-4价格的1/400,击穿全球底价。

本次云栖大会上,阿里云再次宣布百炼平台上的三款通义千问主力模型大幅降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus同等规模较行业价格低84%。

同时,阿里云还在持续坚持开源模型路线。通义大模型一年多来坚持全尺寸、全模态开源,多次登上HuggingFace开源榜首,同时,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,受到开源社区众多开发者的追捧。

从模型服务到AI云服务,阿里云持续投入的强度堪称“中国卷王”,无论行业如何争论,反正开源闭源全覆盖,从底层基础设施到上层的大模型平台和模型社区全栈建设,布局的广度和深度,甚至全球无出其右。

阿里云的乐观和信心来自坚定的信念。少有人知道的是,阿里云从2018年便投入大模型研发,因此能够在ChatGPT掀起新一轮AI浪潮后迅速站稳国内基模第一的身位,而在前年云栖大会上,阿里云即提出MaaS模型即服务的理念,此后引领了全球云厂商面向AI时代的MaaS变革。

如今,阿里云看到的路是,只有提前布局,打造更强的基建,才能让所有人都能用上最先进的大模型,让企业和开发者以最低的成本使用AI,让整个行业更快拨云见日。

新闻热榜

1

何冰娇提交退役申请

2

64万吨锑化镓出口管制,美日韩半导体业巨震

3

迪庆州2名干部接受审查调查

4

周五美国WTI原油收跌1.9%

5

揭秘哈密瓜价格下滑背后:菜贩子透露的四个残酷现实

6

上海一公交驶入河道

7

个体工商户数达1.25亿

8

卡塔尔首相与约旦副首相通电话讨论加沙停火谈判进展

9

汪顺跳水像牛蛙下锅

10

全国生态日“小手拉大手”,镇江市“生态文明第一课”火热开讲

11

今年超50家银行解散

12

中国霹雳舞奥运首秀

13

到嘴的鸭子飞了?富士康前脚回国,后脚印度马上对苹果反垄断调查

14

昌樟高速改扩建二期项目实现全幅贯通

15

张继科祝贺樊振东

16

在社会上,居然存在着一种极为荒谬的说法,说很多女干部跟领导存在不正当关系。可这纯

17

也门南部发生汽车炸弹爆炸事件已造成19人死亡

18

2110岁!世界树龄最长罗汉松在长沙浏阳

19

驻南苏丹使馆提醒在南中国公民注意防范感染猴痘病毒

20

金融监管总局首批两会建议提案回复亮相!

21

开发区全面推进取水口信息比对工作,1893眼井信息关联完毕

22

江旻憓告别全职击剑

23

科目二考试中途熄火

24

断骨增高致终身伤残

25

以官员:以军在加沙地带的作战已“基本结束”

26

中国驻南苏丹使馆提醒在南中国公民注意防范感染猴痘病毒

27

扎卢日内否认自己参与了北溪管道袭击事件!这个态度很明确

28

“数字化背景下刑事附带民事诉讼疑难问题”学术研讨会召开

29

金门撞船事件,台当局的交代来了?台检方称海巡正常操作不予起诉

30

1998年,98岁的黄火青想帮丁盛解决党籍军籍问题,提高生活待遇?

31

广州花都:开局即冲刺,跑好基层社工部“第一棒”

32

日本葡萄为什么这么受欢迎,这三点,你做到位了吗?

33

天气预报#一起关注天气变化

34

世界上最贵的收费站,美国仅用四千万拿下,世界工程七大奇迹之一

35

苏丹外交部:快速支援部队袭击村庄造成85人死亡

36

蓬安县应急管理局开展迎峰度夏电力保供和安全生产工作情况调研

37

安徽省蚌埠市人大常委会原副主任汤春义接受审查调查

38

最高人民法院党组成员、政治部主任李成林参加王佳佳法官遗体告别仪式并看望慰问家属

39

6千万粉网红被查

40

新闻日历巴拿马运河船舶通行上限9月再提升

20

揭秘哈密瓜价格下滑背后:菜贩子透露的四个残酷现实

20

美国总统大选辩论将于9月10日在费城举行

20

王毅外长到访前,泰国总理突然下台,中方军机已到位

20

上迪有演职人员中暑

20

中老缅泰同意加大力度联手打击网赌电诈等跨境犯罪

20

携手共建美丽家园

20

高盛称选民正在转而支持哈里斯

20

巴勒斯坦怒火中烧!阿巴斯将亲赴加沙,怒斥美国为地区‘瘟疫’

20

多地买新房不限价

热门攻略

1

运城水投:压实责任加快进度高效务实推进项目建设

2

水利部启动2024年夏秋季引江济太应急调水

3

中国科大新任6位党委常委

4

如皋市人民法院:多措并举守护古城历史文脉“根与魂”

5

尼日利亚中部至少20名大学生遭绑架

6

目前我国终身不婚人群仍是少数

7

美调查记者:美国可能因兴奋剂丑闻被禁止举办洛杉矶奥运会

8

赖岳谦:美国无条件支持以色列不管以色列怎么做都会支持

9

日本民间团体提出访华申请,向中方提出三大要求,真是白日做梦

10

商务部:继续放宽外资市场准入,引导更多优质外资进入资本市场长期投资

11

涉及16名干部!云南一地发布最新人事任免!

12

刘翔含金量还在提升

13

优化市场环境提升发展质效

14

市场监管总局:重点领域反垄断监管执法已罚没金额超过25亿元

15

美国共和党副总统候选人万斯所乘飞机出现紧急情况迫降

16

4中国人尼泊尔坠机

17

视频|英国奥运赛艇冠军回医院上班同事热烈欢迎

18

市政府召开常务会议开展专题学法研究政务公开生态环保文旅产业高质量发展等工作张新伟主持

19

这一次"

20

拜登表示加沙停火谈判人员将在多哈停留

20

奥委会谈游泳队杂音

20

"俄罗斯人在克林基附近变得更加活跃,乌克兰人撤退到新的阵地

20

根本不用大陆出手?赖清德先收到致命噩耗,最后“底牌”也没用了

20

8月17日凌晨,国际传来7个坏消息和3个好消息,局势发生很多变化

20

担任执旗手参加世锦赛开幕式,中国国家剑道队台胞队员苏郁程:手举国旗,越走越有力量!

20

以军再发撤离令要求加沙北部巴勒斯坦民众撤离

20

法国一小型民用飞机坠海1人死亡

20

女实习医生被奸杀引发全国抗议,印度30万医护人员走上街头

20

哈里斯白宫梦碎了?重大出轨丑闻曝出,关键时刻,特朗普发声炮轰

20

今年超50家银行解散

20

蜜雪辟谣闭店3808家

20

法国专家:美国运动员的药物滥用时间久程度深

20

西班牙媒体:中国高校崛起,西班牙大学坚守软科排名

20

美国的火车是内燃机,我国高铁却用电!哪个更先进?

20

尼日利亚中部至少20名大学生遭绑架

20

关键时刻,警惕美国动向!全球经济面临重大考验!

20

潘展乐这段先别播

20

潘展乐解散粉丝群

20

香港特区政府强烈谴责彭定康恶意诋毁终审法院判决

20

将学校阳光锻炼时间增加至2小时!市南区下半年教育工作持续发力

20

涉嫌严重违纪违法!云南2名局长主动投案,接受审查调查

20

黑龙江省委批准,齐忠彦被开除党籍

20

新闻两则

20

广德开展全国生态日手工主题活动

20

澜沧江-湄公河合作第九次外长会在泰国举行

20

王皓逐渐咆哮化

20

联想杨元庆AI是未来趋势但大模型不应成为唯一的追逐目标

20

市见义勇为英模健康休养团赴老君山开展健康休养活动

热门游戏

  • 1
    欧洲疾控中心:欧洲地区猴痘新毒株感染输入病例或增多

    射击枪战 /热度:75520

    点击下载

    打头骨老师当庭翻供

  • 2
    俄罗斯法院再次延长4名音乐厅恐袭案嫌疑人羁押期限

    射击枪战 /热度:21741

    点击下载

    穆罕默德·阿莫西:中国在中东的角色和该地区的三个地缘问题

  • 3
    近东救济工程处:以军发布新撤离令后加沙居民已“无处可去”

    射击枪战 /热度:28885

    点击下载

    马来西亚发布莎阿南市空难调查报告机组人员操作失误致飞机坠毁

  • 4
    崩坏3 安徽交控集团高质量发展取得新成效新突破

    射击枪战 /热度:90263

    点击下载

    国台办回应台公布恶性撞船事件“调查结论”

  • 5
    原神 “无废城市”是什么?怎么建?这场论坛上都有了解读

    射击枪战 /热度:75043

    点击下载

    澜沧江—湄公河合作第九次外长会在泰国举行

  • 6
    出发吧麦芬 三分钟看完今日要闻,8月17日新闻摘要

    射击枪战 /热度:55526

    点击下载

    “K粉女王”长袖善舞,无良医生贪财害命,好莱坞明星之死牵出犯罪网络

  • 7
    永劫无间手游 腹部抽脂无生育能力

    射击枪战 /热度:72636

    点击下载

    长荣酒店国旗事件引众怒!长荣集团承认错了!长荣:再给一次机会

  • 8
    向僵尸开炮 拜登披露退选内幕

    射击枪战 /热度:54380

    点击下载

    男子在日本靖国神社前举横幅抗议对来往游客和当地日本人表示强烈不满

  • 9
    鸣潮 海淀“零碳办会”展示生态建设成果

    射击枪战 /热度:64934

    点击下载

    以钉钉子精神抓好改革决策部署落实|“静·语”午间沙龙

  • 10
    艾塔纪元 南海开渔首日广东逾两万艘渔船出海海事部门多举措护航

    射击枪战 /热度:10420

    点击下载

    1.8万拍下1.3亿厂房

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 赛事直播 | 游戏设计大赛 | 游戏声音设计论坛 |