上周,全球顶尖AI公司的领导人齐聚达沃斯,但是所有目光却都投向了东方。
在世界经济论坛的小组讨论和非正式会谈中,科技高管们强调,美国及其盟友需要建设更多数据中心,并在监管方面取得适当平衡,以在AI发展领域保持对中国的领先优势。
“我们在模型方面可能领先一年以上,”Alphabet公司总裁兼首席投资官露丝·波拉特在活动中表示。但她补充说:“美国保持优势并非定局”。
然而这种说法可能过于乐观。就在达沃斯同期,一家鲜为人知的中国人工智能初创公司DeepSeek(深度求索)发布了名为R1的新型开源模型,能够模仿人类的推理方式。该公司表示,R1在数学任务和一般知识等多项行业基准测试中,表现不亚于甚至超过了领先的美国公司,但成本却低得多。周末,DeepSeek在备受关注的AI排行榜Chatbot Arena上排名攀升,马克·安德森等科技界知名人士将其称为“AI的斯普特尼克时刻”。
现在,R1发布的冲击波迅速蔓延至美国,科技行业正试图理解DeepSeek是如何做到这一点的,并试图验证这家初创公司是否真的用那么低的成本实现了这一突破。业内已经开始质疑它是否借助西方技术构建其聊天机器人,从而规避了开发大型语言模型的巨额成本。
在旧金山,AI高管和员工正在紧急分析DeepSeek的技术。据知情人士透露,OpenAI的部分员工正试图弄清楚DeepSeek究竟如何开发出这样的模型,这些知情人士因涉及私密事务而要求匿名。另一位知情人士表示,公司认为必须认真对待中国公司的发展,因为这为创新和改进现有模型提供了机会。据知情人士透露,OpenAI的CEO萨姆·奥尔特曼最近向员工表示,这次发布标志着该公司正面临重大的格局转变。
“DeepSeek R1是一个令人印象深刻的模型,”奥尔特曼在X上首次公开回应时写道,“我们当然会提供更好的模型,而有一个新的竞争对手确实令人振奋!”
据知情人士透露,同样专注于开源AI模型的Meta已成立内部团队,专门分析DeepSeek的构建方式和功能。知情人士称,该公司还组建了类似的特别小组来评估其他主要竞争对手,包括OpenAI的GPT-4模型和谷歌的Gemini模型。
DeepSeek的出现一夜之间颠覆了硅谷对AI的诸多假设,包括开发成本、技术路线以及美国的领先优势。自ChatGPT两年前掀起全球AI热潮以来,业界一直认为,打造更优秀的人工智能主要依赖于两个方面:大规模投资英伟达等厂商生产的先进芯片,以及建设更多容纳这些芯片的大型数据中心。
本文由未来学人编译,原文作者:Rachel Metz,审校排版:从林,点击查看原文链接
翻译作品,原文版权归原作者所有。未来学人仅提供翻译服务,不对原文内容或观点进行任何修改或代表。如有侵权,请联系我们删除。