Scaling Law递减,堆砌数据、算力拼AI模型已行不通?大厂正在找出路

  分析指出,相比传统的堆砌计算能力和数据的训练方法,被称为“测试时计算”(Test-time Compute)的新方法更有助于提高AI模型的预测能力,这种方法能够让AI模型在回答问题前,有更多时间和计算资源进行“思考”。专家指出,如果测试时计算成为扩展AI系统的下一步,对专注于高速推理的AI芯片的需求可能会大幅增加。

  作者:赵雨荷

Scaling Law递减,堆砌数据、算力拼AI模型已行不通?大厂正在找出路

  来源:硬AI

  迈向超级智能系统的AI实验室正意识到,可能需要改换道路。分析指出,相比传统的堆砌计算能力和数据的训练方法,被称为“测试时计算”(Test-time Compute)的新方法更有助于提高AI模型的预测能力。

  据TechCrunch报道,多位AI投资者、创始人和CEO透露,近年来AI实验室用于提升模型能力的“AI扩展定律”(AI scaling laws)正显示出边际收益递减的迹象。他们的观点与近期的报告一致,这些报告表明顶尖AI实验室中的模型提升速度已不如以往。

  现在,几乎所有人都开始承认,仅通过增加计算能力和数据量来预训练大型语言模型,并指望其变成某种全知全能模型的道路,是行不通的。这也许听起来显而易见,但扩展定律曾是开发ChatGPT、提升其性能的关键因素,也可能影响了许多CEO大胆预测通用人工智能(AGI)将在几年内到来的信心。

  OpenAI和Safe Super Intelligence的联合创始人Ilya Sutskever上周对媒体表示,“所有人都在寻找扩展AI模型的新方式”。本月早些时候,Andreessen Horowitz联合创始人Marc Andreessen在一档播客中提到,当前AI模型似乎都趋向于能力的上限。

  不过,有AI领域的CEO、研究人员和投资者已经开始宣称,行业正进入扩展定律的新纪元:“测试时计算”(Test-time Compute)被认为是一项特别有前景的新方法,能够让AI模型在回答问题前,有更多时间和计算资源进行“思考”。

  “我们正看到一种新扩展定律的出现,”微软CEO纳德拉(Satya Nadella)周二在微软Ignite大会上说,他指的是支持OpenAI o1模型的测试时计算研究。

  此外,Andreessen Horowitz合伙人、Mistral的董事会成员、曾是Anthropic天使投资人的Anjney Midha在接受媒体采访时表示,“我们现在正处于扩展定律的第二纪元,也就是测试时扩展。”

  AI扩展定律失效?

  自2020年以来,OpenAI、谷歌、Meta和Anthropic等公司取得的AI模型快速进步,主要归功于一个关键判断:在AI模型的预训练阶段使用更多的计算资源和数据。

  在这一阶段,AI通过分析大量数据集中的模式来识别和存储信息。当研究人员为机器学习系统提供充足的资源时,模型通常在预测下一个词或短语方面表现更好。

  第一代AI扩展定律让工程师通过增加GPU的数量和数据量来提升模型性能。尽管这种方法可能已经达到瓶颈,但它已经改变了整个行业的版图。几乎每家大型科技公司都押注AI,而为这些公司提供GPU的英伟达如今已成为全球市值最高的上市公司。

  然而,这些投资是基于扩展能够持续发展的预期而做出的。毕竟,扩展定律并不是自然、物理、数学或政府制定的法律,它并未被任何人或事物保证会以相同的速度继续下去。即便是著名的摩尔定律,也在运行了较长时间后逐渐失效。

  Anyscale联合创始人、前CEO Robert Nishihara在对媒体表示,

“如果你只投入更多的计算资源和数据,模型越做越大,回报会逐渐递减,要维持扩展定律的运行并保持进步的速度,我们需要新思路。”

“当你已经阅读了100万条Yelp评论,再读更多评论可能不会带来太大增益,但那是预训练。关于后训练的方法还相对不成熟,还有很大的改进空间。”

  尽管如此,AI模型开发者可能仍会继续追求更大的计算集群和更大的数据集进行预训练,而这些方法可能仍有一定的提升空间。例如,马斯克最近完成了一台拥有10万GPU的超级计算机Colossus,用于训练xAI的下一代模型。

  但趋势表明,仅通过现有策略使用更多GPU无法实现指数级增长,因此新的方法开始获得更多关注。

  测试时计算:AI行业的下一大赌注

  当OpenAI发布其o1模型的预览版时,就宣布这属于独立于GPT的新系列模型。

  OpenAI主要通过传统的扩展定律(即在预训练阶段使用更多数据和更多计算能力)改进了其GPT模型。但据称,这种方法现在的增益已不再显著。o1模型框架依赖于一个新概念——测试时计算(test-time compute),之所以这样命名,是因为计算资源是在接收到提示后(而不是之前)才使用的。分析认为,这种技术在神经网络背景下的探索还不多,但已经表现出潜力。

  一些人已经将测试时计算视为扩展AI系统的下一种方法。

  Andreessen Horowitz的Midha表示,

许多实验表明,即使“预训练”的扩展定律可能正在放缓,“测试时”扩展定律——即在推理过程中为模型提供更多计算资源——仍然可以显著提升性能。

  著名AI研究员Yoshua Bengio则表示,

“OpenAI的新‘o系列’进一步推动了[连贯思维],需要更多计算资源,也因此需要更多能源,我们因此看到了一种新的计算扩展形式:不仅仅是更多的训练数据和更大的模型,还包括花费更多时间‘思考’答案。”

  例如,在10到30秒的时间里,OpenAI的o1模型会多次重新提示自己,将一个复杂的问题分解为一系列更小的问题。现负责OpenAI o1工作的Noam Brown尝试开发可以击败人类的扑克AI系统,在最近的一次演讲中,Brown表示,他注意到人类扑克玩家在出牌前会花时间考虑不同的情景。2017年,他引入了一种方法,让模型在出牌前“思考”30秒。在此期间,AI会模拟不同的子游戏,推演不同场景可能的结果以确定最佳行动。最终,这种AI的预测表现比他以前的方法提升了7倍。

  需要注意的是,Brown在2017年的研究并未使用神经网络,因为当时它们尚未普及。然而,上周麻省理工学院的研究人员发表了一篇论文,表明测试时计算显著提高了AI模型在推理任务上的表现。

  目前尚不清楚测试时计算如何大规模推广。这可能意味着AI系统在解决难题时需要非常长的“思考”时间,可能是数小时甚至数天。另一种方法可能是让AI模型同时在许多芯片上“思考”问题。

  Midha表示,如果测试时计算成为扩展AI系统的下一步,对专注于高速推理的AI芯片的需求可能会大幅增加,这对Groq或Cerebras等专注于快速AI推理芯片的初创公司来说是好消息。如果找到答案与训练模型同样需要大量计算资源,那么AI领域的“挖掘工具”提供商将再次受益。

  无论AI研究的前沿情况如何,用户可能在一段时间内感受不到这些变化的影响。不过,AI开放商将不遗余力地继续快速推出更大、更智能、更快的模型,这意味着多家领先的科技公司可能会调整其推动AI边界的方法。

  本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

标签:

相关推荐

  • 央行国际司:防止外汇市场形成单边一致性预期并自我实现,坚决防范汇率超调风险

    央行国际司:防止外汇市场形成单边一致性预期并自我实现,坚决防范汇率超调风险

      11月22日,中国人民银行国际司负责人刘晔在国新办举行的国务院政策例行吹风会上表示,人民币汇率将在合理均衡水平上保持基本稳定,这主要是受到一系列稳定因素的支撑,包括我国的国际收支保持平稳,外汇市场投资者更加成熟,交易行为更加理性,市场韧性也显著增强,而且近期出台的一揽子宏观政策明显改善了市场预期,经济回稳向好态势进一步巩固和增强。  刘晔指出,当然,影...

    2024/11/22
  • 橡胶停割期“悄然逼近”,终端消费能否“持续升温”?

    橡胶停割期“悄然逼近”,终端消费能否“持续升温”?

      来源:天然橡胶  橡胶期货合约近期出现震幅变宽趋势,17700至17200附近波动,由于停割期临近,近期橡胶现货价格坚挺。  国内产区即将逐步进入停割季,原料价格受到一定支撑,RU表现相对偏强。青岛地区库存止跌回升使得供应端压力增加。  昨日泰国胶水报收68.0泰铢/公斤,环比上日上涨0.5泰铢/公斤;泰国杯胶报收57.95泰铢/...

    2024/11/22
  • 夏威夷食品的魅力,买零食的独特体验买零食夏威夷食品夏威夷果是零食吗诺贝尔物理学奖

    夏威夷食品的魅力,买零食的独特体验买零食夏威夷食品夏威夷果是零食吗诺贝尔物理学奖

    夏威夷食品,以其独特的口感和丰富的营养价值,早已成为美食爱好者的心头好,夏威夷果、椰子糖、热带水果等,每一款都蕴含着夏威夷的热情与风味,在探索异国风味的旅途中,购买夏威夷食品不仅是一次味蕾的盛宴,更是一次文化的交流与体验。夏威夷食品的独特魅力健康零食的选择:夏威夷食品购买夏威夷食品的途径如何挑选优质的夏威夷食品夏威夷食品的美味搭配夏威夷食品:文化与旅游的完美...

  • 金华银行嘉兴分行被罚款35万元:因违规办理银行承兑汇票业务

    金华银行嘉兴分行被罚款35万元:因违规办理银行承兑汇票业务

      11月22日金融一线消息,据国家金融监督管理总局嘉兴监管分局行政处罚信息公开表显示,金华银行股份有限公司嘉兴分行因违规办理银行承兑汇票业务,被罚款35万元;钱某琴(时任金华银行嘉兴分行公司业务部客户经理)被警告。...

    2024/11/22
  • 人民银行国际司:持续加大金融支持外贸稳定发展力度

    人民银行国际司:持续加大金融支持外贸稳定发展力度

      转自:证券时报  证券时报网讯,11月22日,在国新办举行的国务院政策例行吹风会上,人民银行国际司负责人刘晔表示,人民银行持续优化跨境贸易人民币结算环境,提高跨境贸易便利化水平。今年前三个季度,货物贸易人民币跨境收付金额8.9万亿,同比增长约15%,占同期货物贸易本外币跨境收付金额比重高达26.5%,同比提高2.1个百分点。跨境人民币业务服务实体经济能...

    2024/11/22
  • 台湾美食探秘,枣夹夏威夷果的独特魅力台湾食品 枣夹夏威夷果台湾枣的功效寒露

    台湾美食探秘,枣夹夏威夷果的独特魅力台湾食品 枣夹夏威夷果台湾枣的功效寒露

    台湾美食探秘,枣夹夏威夷果独具魅力。台湾食品中,枣夹夏威夷果是一道特色美食,以台湾枣和夏威夷果为主要原料,口感独特。台湾枣具有丰富的营养价值,而夏威夷果则带来浓郁的口感。在寒露时节,品尝这道美食更是一种享受。台湾美食文化丰富多彩,枣夹夏威夷果的独特魅力值得一试。台湾美食的独特韵味台湾,一个美食的天堂,汇聚了中华美食的精髓与西方烹饪的创新,从繁华的夜市到精致的...

  • 坐看云起时?信创ETF基金(562030)标的指数本轮累涨67%!国家数据基础设施建设迎大消息!

    坐看云起时?信创ETF基金(562030)标的指数本轮累涨67%!国家数据基础设施建设迎大消息!

      今日(11月22日),信创板块接着奏乐接着舞!截至发稿,拓尔思、三六零涨停封板,星环科技-U涨超14%,云从科技、致远互联、用友网络等个股大幅跟涨。  热门ETF方面,重仓软件开发行业的信创ETF基金(562030)场内价格盘中上探1.82%,现涨1.62%,冲击日线4连阳!  拉长时间来看,信创ETF基金(562030)标的指数(中证信创指数)自...

    2024/11/22
  • 王仁果:沛华集团酒业投资实践,坚持“四个要素”和“五个坚定”

    王仁果:沛华集团酒业投资实践,坚持“四个要素”和“五个坚定”

    专题:2024酒业创新与投资大会  2024年11月22日,AIIC2024酒业创新与投资大会在海南·海口正式开幕,上海沛华集团有限公司董事长王仁果出席活动并发表主旨演讲。  从投融资市场角度观察,白酒行业一直受到资本的青睐。  今年6月,王仁果控股的上海沛华实业集团有限公司收购了茅台镇天长帝酒厂,成为古恒酒业的控股股东。  王仁果曾经作为地产行业...

    2024/11/22
  • 夏威夷果果仁,绿色食品的独特魅力夏威夷果果仁绿色食品夏威夷果果仁绿色食品能吃吗郑钦文

    夏威夷果果仁,绿色食品的独特魅力夏威夷果果仁绿色食品夏威夷果果仁绿色食品能吃吗郑钦文

    夏威夷果果仁是一种绿色食品,具有独特魅力。它富含营养,口感香脆,深受人们喜爱。夏威夷果果仁是可食用的,其绿色天然的属性也让它备受关注。郑钦文等专家也对其营养价值和健康功效给予了高度评价。夏威夷果果仁是一种健康、美味的绿色食品选择。夏威夷果,又称澳洲坚果,以其独特的魅力在食品界独树一帜,它不仅是一种绿色食品,更是一种健康、美味的营养来源。一、夏威夷果的起源与特...

  • 吴晓求:中国央行的功能有一点开始向美联储的功能靠近

    吴晓求:中国央行的功能有一点开始向美联储的功能靠近

    专题:国际金融论坛(IFF)第21届全球年会  11月22日-23日,国际金融论坛(IFF)第21届全球年会在香港举行,主题为“世界大变局:构建国际合作新未来”。中国人民大学原副校长、国家金融研究院院长吴晓求出席并演讲。  吴晓求谈到,从9月24号到现在,我国都在采取一系列的政策来维持中国经济的稳定,最核心的是要扩张,通过市场机制,通过有效的政策让消费...

    2024/11/22
返回顶部
微信号复制成功
微信号: 12345678990
点击下方按钮