阿里云为什么对大模型持续乐观?

来源: 题目抗议者呼吁抵制苹果产品,声援冲突区人权

责任编辑: 翟玟

发布时间: 2024-09-22 17:36:19

0

0

在大模型行业集体迷茫之际,阿里云却在2024云栖大会上释放了诸多积极信号。

大模型走红快两年,目前的发展状态和此前业界的预期还有较大差距,一些大模型公司开始出现战略摇摆。但阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中表示,过去22个月,AI发展的速度超过任何历史时期。

一方面是大模型技术快速迭代以及技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

另一方面,模型推理成本指数级下降,已经远远超过摩尔定律。以通义千问为例,一年来,通义千问API在阿里云百炼上的调用价格下降了97%以上,百万Tokens调用花费最低已经降到了3毛钱,未来还有继续下降的趋势。

吴泳铭给当下大模型发展状态的定义是“AGI变革的早期阶段”,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。在他看来,全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。

从2024云栖大会上的一系列发布来看,阿里云对大模型的乐观不只停留在口号上,而是要继续实打实投入。

阿里云和同行态度的强烈反差,背后是彼此对大模型应用落地前景认知的差异导致的。

大模型的想象空间不只在手机屏幕

大模型太多,应用却太少是当下整个行业面临的问题,大模型要跑起来、更要用起来,需要走好落地应用“最后一公里”。

从各家基础模型公司和应用层公司的探索来看,目前大模型的落地应用分为B端和C端两个方向。

在B端场景中,大模型目前已经在金融、工业、教育、医疗、政务等行业中得到应用,对研发设计、生产制造、经营管理、营销服务业务环节带来一些助力。但整体来看,很多企业对大模型的应用还在探索阶段,大模型依然面临落地难、落地成本高的问题。

C端场景的边际成本更低,被大模型从业者寄予了更多期待。AI助理被认为是大模型时代的超级应用,无论是以月之暗面为代表的大模型创业公司,还是腾讯、字节跳动、百度等互联网大厂,都相继推出了AI助理类应用。但豆包、Kimi等多个AI助手应用的表现还没达到人们的高预期,产品形态依然在演进,暂时看不到移动互联网时代超级应用爆发的势头。

很多从业者对大模型的落地应用感到迷茫,一个重要的原因是他们把对大模型应用落地的场景局限在手机屏幕上。

吴泳铭在2024云栖大会上给出了不一样的答案。在他看来,AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

正因为如此,我们更应该跳出移动互联网的视角来看AI大模型的未来。很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

吴泳铭表示,AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

这样的变革已经在一些行业发生,比如汽车行业。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

在吴泳铭看来,机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

从这个角度来看,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。AI大模型的价值也不仅仅局限在商业领域,更重要的是将给社会生活带来巨大改变。

这是一个更大的历史机遇,也值得更多从业者积极投入、提前布局。能够抓住这个历史机遇的企业,将释放出比移动互联网高速增长时代更大的价值。

强大的基建才能催生AI新未来

在颠覆式的新浪潮下,坚定的技术乐观派才会真正走在时代前面,引领变革的发生。

在吴泳铭看来,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,很多人会在迟疑中错过。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高。业界先进的模型参数规模和数据规模仍在持续增长,巨头之争已经从千亿模型向万亿模型发展。

比如,GPT-4模型具有1.8万亿参数,在约 13万亿个Token上进行了训练,算力需求相当于在大约2.5万张A100加速卡上运行90~100天。Meta在原有1.6万张A100卡集群基础上又建设两个具有约2.5万张H100加速卡集群,用来加速LLaMA3的训练。由此可见,万卡已经成为未来先进大模型训练的新起点。

尽管先进模型的门槛提升至几十上百亿美金,但头部大厂在投入上未曾迟疑。在海外,谷歌、微软、亚马逊、英伟达、Meta、苹果和xAI,每年在前沿技术上的投资高达 4000 亿美元,大部分资金都投向大模型和AI基础设施。

国内大厂中,阿里云投入压强最高,AI基础设施、基础模型、对外投资全覆盖。本届云栖上,吴泳铭表示,“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。”

过去一年,阿里云从以CPU为主导的传统计算体系,加速向以GPU为主导的AI计算体系演进,新增算力超50%都是AI算力。阿里云CTO周靖人在演讲中表示,阿里云正在围绕AI时代树立AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

周靖人在2024云栖大会现场展示了阿里云全系列产品家族面向AI的升级:最新上线的磐久AI服务器,并提供AI算法预测GPU故障,准确率达92%;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

在模型层,阿里云也持续饱和式投入,几乎保持以月为周期迭代基础模型。大会现场,阿里云宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,同时还发布了开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

其中,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

今年,大部分大模型厂商都试图通过降低大模型的使用门槛来推动大模型在更多行业落地。得益于基础设施的强大,阿里云在降低企业和开发者使用成本方面也是最积极也是最激进的厂商之一。

今年5月,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long价格直降97%,1块钱即可买200万tokens,相当于5本《新华字典》的文字量。降价后,Qwen-Long价格约为GPT-4价格的1/400,击穿全球底价。

本次云栖大会上,阿里云再次宣布百炼平台上的三款通义千问主力模型大幅降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus同等规模较行业价格低84%。

同时,阿里云还在持续坚持开源模型路线。通义大模型一年多来坚持全尺寸、全模态开源,多次登上HuggingFace开源榜首,同时,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,受到开源社区众多开发者的追捧。

从模型服务到AI云服务,阿里云持续投入的强度堪称“中国卷王”,无论行业如何争论,反正开源闭源全覆盖,从底层基础设施到上层的大模型平台和模型社区全栈建设,布局的广度和深度,甚至全球无出其右。

阿里云的乐观和信心来自坚定的信念。少有人知道的是,阿里云从2018年便投入大模型研发,因此能够在ChatGPT掀起新一轮AI浪潮后迅速站稳国内基模第一的身位,而在前年云栖大会上,阿里云即提出MaaS模型即服务的理念,此后引领了全球云厂商面向AI时代的MaaS变革。

如今,阿里云看到的路是,只有提前布局,打造更强的基建,才能让所有人都能用上最先进的大模型,让企业和开发者以最低的成本使用AI,让整个行业更快拨云见日。

新闻热榜

1

台立院昨天开启新的会期,"

2

"以色列邀请媒体来

3

34岁科学家心梗逝世

4

因猫咪离世服药轻生

5

鼓干劲、强信心!朱坚和率队到广西路建集团调研

6

阿根廷罗卡将军镇附近发生6.0级地震

7

当地时间9月19日,欧洲议会通过了两项决议:一是以425票赞成、131票反对、6

8

卜宪群、史丹等9人新当选为中国社科院学部委员

9

泽连斯基可开心了。乌克兰总统泽连斯基周日将访问宾夕法尼亚州的一家弹药厂,该工厂正

10

阿根廷罗卡将军镇附近发生6.0级地震

11

深中通道自通车以来,通行车流量达200万辆次,日均10万辆#旅行大玩家#深中通道#深中大桥

12

前民主党副主席图尔西谈她是如何上了希拉里·克林顿的“黑名单”

13

青年与城市的双向奔赴——记者探访成都多个青年发展项目丨奋力谱写中国式现代化四川新篇章

14

“与时间赛跑”:瑞典治理黑帮暴力殊不易

15

辟谣上海高达剩半身

16

黎巴嫩寻呼机爆炸事件已致9死约2800伤

17

台风“贝碧嘉”登陆上海浦东新台风生成未来路径类似

18

杨伟民:如何做出一个好规划?从一个县区规划说起

19

晚退2时收半天房费

20

马斯克未在收购推特调查中作证美证交会或实施制裁

21

外卖被盗抓获1只猫

22

台风贝碧嘉将登陆

23

印度竟想同时踩着中美俄三强上位,但却已经失去未来

24

时间很珍贵不要浪费

25

2024数字百强市发布,威海入选!

26

中国摩博会摩友之夜感受和重庆天气一样的气氛吧

27

乌克兰女性的“新婚之夜”,居然有这种尴尬的习俗?你能接受吗?

28

沈阳市举行不明原因肺炎培训与应急演练

29

你看路边这么大的雨,他们还在加固树木

30

美国终于同意五常增设2个位子但莫迪失望的是?美国拒绝印度

31

订婚强奸二审再延期

32

芬兰总统呼吁将俄罗斯踢出“五常”,美国务院发言人:整点现实的

33

美国电轨车上一幕,女孩随手一个举动,妈妈三年抬不起头!

34

河北衡水探索“1+N”工作机制助企业发展

35

不再留面子!中国一改之前外交措辞,当着一百多国面怒斥美国不义

36

非洲原始部落野人的食物很猎奇

37

游客捡800万龙涎香

38

抱紧美国大腿菲律宾对“堤丰”系统撤离时间一变再变

39

列车员被质疑有花臂

40

中国银行东明支行开展征信宣传进房企活动

20

币圈大事件!“前华人首富”赵长鹏即将出狱

20

小孩姐气跑4名医生

20

艺联八方兴泰安!山东省第七届农民戏剧展演月泰安分会场开幕

20

苏丹新一轮霍乱疫情已致370人死亡

20

江西新余致39死火灾调查报告公布

20

最新消息!两分钟看完今日要闻,9月22日新闻摘要!

20

巴西一美式橄榄球队三名成员在交通事故中丧生

20

特朗普抱着5岁孙女登台很讨喜,非裔竞选伙伴深陷丑闻后“消失”

20

中拉青年以对话推动文明互鉴

热门攻略

1

女子求职被骗12.7万

2

山姆月饼疑吃出牙齿

3

十字路口的反思!3000多黎巴嫩鲜活的生命看清这个世界的三大真相

4

伊朗举行阅兵式伊朗总统点名以色列和美国

5

伊朗举行阅兵式伊朗总统点名以色列和美国

6

中国将派员赴日本展开核污水检测,强化监督与数据可信性

7

缅甸严重洪灾已致384人死亡89人失踪

8

室内外消防给水管道的设计要点

9

下周,长沙这里将有交通管制

10

美国加州超50名高中生,集体零元购一家超市!

11

激发服务业发展新动能

12

阿根廷罗卡将军镇附近发生6.0级地震

13

2024年枣庄市全国科普日主场活动启动仪式在滕州举行

14

“九二一”地震25周年台湾举办防灾演练等活动

15

建立经常性和集中性相结合的纪律教育机制有哪些要求?

16

俄媒:俄中央核试验场负责人称已为恢复核试验做好准备

17

俄罗斯又有一个大型军火库被袭击后爆炸。那场面如同核弹爆炸,普京此次损失惨重。乌克

18

以色列被质疑发起民用设备攻击,美国不愿被认作幕后操纵者

19

基辛格预测:美国已搞垮4个世界老二,第5个国家老美却毫无办法

20

江苏盱眙:深化“三提三知”,“广场议事”促和谐

20

一起来看今日要闻,9月22日新闻摘要

20

广州气温断崖式下降

20

【工作动态】旗委组织部召开2024年度通辽市对科左后旗绩效考核指标运行情况调度会

20

【瀍河动态】一览瀍河动态

20

第21届中国—东盟博览会举行在即进境展品全部运抵广西南宁

20

俄军猛烈轰炸乌克兰三分之二电力被毁未来将面临怎样困难

20

国际和平日纪念活动首次下沉地市级举办,潍坊收获满满

20

高质量发展看山西国企:华新燃气集团党委召开新提拔任用领导干部廉政谈话会

20

北京丰台与香港建立长效交流机制,共建供应链生态圈

20

退休人员,感恩国家的两副对联,太有才了!

20

三晋之声合唱团百姓演唱会#国庆吃喝玩乐节#群众歌咏大合唱

20

国网湖南电力:40支队伍全力保障第三届旅发大会顺利召开

20

山东河湖有了“管家”,不仅仅颜值高了

20

汪汪队教会了孩子台湾腔

20

被评定为烈士

20

这是扣翻倒地!这牛厉害了

20

巴哈马总理:中国脱贫事业为“全球南方”提供了很好借鉴

20

法国34岁小总理“让位”73岁老翁,表现僵硬似拜登情商也堪忧

20

红色奔驰被货车顶着疯狂行驶,真相令人震惊!

20

俄罗斯若使用核武器,中国持何立场?外交部给出答案

20

高途佳品停播

20

以军闯入半岛电视台约旦河西岸办事处要求其关闭45天

20

打击走私普法宣传活动在广西南宁举行

20

捷克反对党在地方选举中获胜

20

日本核污水影响下,我国要进口其海鲜吗?

20

冲突加剧以色列连续第二天对黎巴嫩发动“最猛烈空袭”

20

快讯,瓦格纳在克拉斯诺达尔总部,将近10年的莫尔基诺行政大楼遭到乌克兰攻击后被完全烧毁,没有人员伤亡

20

苏丹新一轮霍乱疫情已致370人死亡

热门游戏

  • 1
    四月份广东省养老金发了两份吗?#养老金#广东省#知识分享

    射击枪战 /热度:96262

    点击下载

    郑钦文退赛

  • 2
    中国残奥金牌破600枚

    射击枪战 /热度:58145

    点击下载

    安徽省委发布《意见》强调完善“府检联动”工作机制

  • 3
    全市司法行政系统学习贯彻党的二十届三中全会精神暨“规范化正规化数字化”建设推进会召开

    射击枪战 /热度:87082

    点击下载

    “90后”陆正韵,出任兰溪市副市长

  • 4
    崩坏3 广东省东莞市政协原党组副书记、副主席钟淦泉接受审查调查

    射击枪战 /热度:14315

    点击下载

    兄妹团的成员们中秋快乐祝全国家人们中秋快乐#乡村#接地气#振兴乡村#中秋#中秋节

  • 5
    原神 县长秘书下乡做驻村书记

    射击枪战 /热度:32927

    点击下载

    “90后”陆正韵,出任兰溪市副市长

  • 6
    出发吧麦芬 河南淅川:污水管疏通了居民心情舒畅了

    射击枪战 /热度:17574

    点击下载

    两岸科技创新中心企业服务平台在北京集中挂牌

  • 7
    永劫无间手游 一只狗狗不想跑步,僵硬的四肢满脸的反抗,狗狗:太累了!

    射击枪战 /热度:38954

    点击下载

    北京电控王海鹏:算力互联,深化“北方算力服务走廊”建设

  • 8
    向僵尸开炮 河南男子与猪办婚礼

    射击枪战 /热度:26340

    点击下载

    聚焦全生命周期保障我国妇幼健康服务“提质增效”

  • 9
    鸣潮 为创业偷猪仔50头

    射击枪战 /热度:07986

    点击下载

    诸旖任上海市徐汇区委常委、统战部部长

  • 10
    艾塔纪元 前华人首富赵长鹏确认即将出狱!此前被判4个月监禁,身家超2300亿元

    射击枪战 /热度:33487

    点击下载

    普京签令!梅德韦杰夫获新职

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 游戏文化探索 | 游戏声音制作技巧 | 游戏系统解析 |