英伟达须要新故事

黄仁勋以为,从前一年全天下年夜少数人对Scaling Law的懂得都错了,这是真的吗?文|《财经》研讨员 吴俊宇 编纂|谢丽容“从前一年,全天下年夜少数人对Scaling Law(范围定律)的懂得都错了。”3月19日,英伟达开创人黄仁勋在GTC(Nvidia GPU Technology Conference)2025年夜会提到,Scaling Law正变得更有韧性,算力耗费现实在减速。现在AI推理算力需要量可能是2024年的100倍。Scaling Law即范围化法令,指年夜模子机能由算力、模子、数据范围决议。它在2020年被AI创业公司OpenAI前结合开创人伊利亚·苏茨克维尔(Ilya·Sutskever)提出。这是从前三年年夜模子练习的奠定实践。2022年之后,中美科技公司年夜模子的开展都基于这一实践:买更多的算力芯片,是晋升模子机能的最直接办段。Scaling Law是英伟达2022年之后高增加的叙事基本。但从前一年,Scaling Law放缓摇动了这一基本——堆算力看起来变得不经济,这让市场质疑,能否另有须要购置更多英伟达的芯片?往年1月,质疑到达高峰。由于中国年夜模子创业公司DeepSeek宣布论文称,“用2048张英伟达H800芯片跟558万美元练习本钱”练习出DeepSeek-V3,这款模子跟OpenAI旗下主力模子GPT-4o机能濒临。DeepSeek优化了算法构造,而不是堆砌芯片数目。投资者担心,英伟达芯片销量会受影响。1月27日,英伟达股价一度单日下跌17%,市值蒸发近6000亿美元(报道详见)。随后一个月,英伟达股价逐步反弹。不外,投资者对英伟达的信念并不动摇。英伟达2月26日颁布2025财年(英伟达2025财年是2024年1月末至2024年1月末)财报,昔时营收1304.9亿美元,同比增加114.2%;净利润728.8亿美元,同比增加148.5%。这是一份亮眼的事迹讲演。但财报颁布后,英伟达股价仍鄙人跌。2025年1月至今(停止3月20日),英伟达股价下跌约14.3%。让投资者重拾信念,英伟达须要用新故事压服客户。英特尔曾用摩尔定律(半导体芯片晶体管密度每18个月翻一番,机能也随之倍增)压服客户按期洽购芯片。摩尔定律因而也被称为“钟摆定律”。黄仁勋从新说明了Scaling Law,将其称为“最终摩尔定律”——晋升推理效力,用单元时光、动力发生更多Token(词元,年夜模子推理算力计量单元,每个字符、标点都是一个Token)。此中有两个重点:其一,单个用户每秒天生Token数目。其二,单元电力下天生的Token数目。黄仁勋表露了将来的芯片演退路线图,称这会“每年像时钟一样定时更新一次”——每两年一次架构演进,每一年都有新的产物,每次都市有成倍的效力晋升。也就是说,“买的越多,就免得越多。买的越多,就赚得越多。”从新界说Scaling LawScaling Law底本是OpenAI前结合开创人伊利亚2020年在论文中提出的实践。这一实践影响了年夜模子工业尔后三年的开展门路——年夜型科技公司(如亚马逊、微软、谷歌、阿里、字节跳动、腾讯等)因而都抉择鼎力出奇观,用万卡、十万卡练习更年夜的模子。但在2024年11月,伊利亚公然反思,从前堆砌算力的暴力手腕奄奄一息,须要寻觅更高效的替换计划。最直接的案例是,马斯克旗下创业公司xAI用20万枚英伟达H100/H200系列芯片练习模子,算力范围是上一代模子的10倍,模子机能却只晋升了不到20%。与此同时,得益于芯片、模子、算法优化,推理算力本钱正以每年10倍的速率降落(微软CEO萨提亚·纳德拉、OpenAI开创人萨姆·奥尔特曼观念)。因而,晋升推理效力被以为是新的优化偏向。2024年9月来,OpenAI o1跟DeepSeek-R1这两款推理模子的呈现象征着市场技巧的偏向有所改变——年夜模子竞争核心从练习走向推理。国际市场调研机构IDC 2025年讲演猜测,2027年“练习+推理”的算力年夜盘中,73%将是推理算力,26%是练习算力。这跟从前练习算力占比超越70%,推理算力缺乏30%的格式截然相反。英伟达的叙事逻辑也要重写——2025年之前是堆砌芯片数目晋升模子机能,2025年之后是晋升推理效力、下降推理本钱。这也是黄仁勋在GTC 2025从新说明Scaling Law的中心起因。黄仁勋以为,从前一年全天下年夜少数人对Scaling Law的懂得都错了。现在的推理效力并不高,用户须要花太长时光等候模子呼应。将来须要晋升推理效力。10倍的Token数目跟10倍的盘算速率,象征着盘算量还将增添100倍。

Related Posts

Comments are closed.