去年,OpenAI在旧金山举办了一场盛大的新闻发布会,推出了多款新产品和工具,包括备受关注的GPT商店。
然而,今年的活动将采取更加低调的形式。日前,OpenAI宣布将DevDay会议从重磅发布会变为一系列路演式的开发者互动环节。该公司同时确认,不会在DevDay上发布其下一代旗舰模型,而是将重心放在更新API和开发者服务上。
“我们不打算在DevDay上宣布新模型,”OpenAI的一位发言人,“我们将更多地致力于向开发者介绍现有产品,并分享开发者社区的成果与故事。”
今年的OpenAI DevDay活动将于10月1日在旧金山、10月30日在伦敦和11月1日在新加坡举行。各场活动均包括研讨会、分组讨论、产品演示以及与OpenAI产品和工程团队的互动,届时还会有开发者代表发表演讲。报名费用为450美元,学生和部分开发者可通过奖学金计划免费参与,报名截止日期为8月15日。
最近几个月,OpenAI在生成式AI领域采取了更加稳健的策略,专注于优化和微调其工具的性能,同时训练GPT-4o和GPT-4o mini的后续版本。该公司致力于提升模型的整体性能并减少过去频繁出现的错误,但在某些基准测试中,OpenAI似乎在生成式AI领域逐渐失去技术领先地位。
其中一个原因可能是,高质量训练数据的获取正在变得愈加困难。OpenAI的模型与大多数生成式AI模型一样,都是基于海量网络数据进行训练。然而,越来越多的内容创作者因担忧数据被抄袭或缺乏合理的归属和报酬,选择限制数据的访问。
根据Originality.AI的数据,全球前1000大网站中已有超过35%对OpenAI的网络爬虫设置了屏蔽。此外,麻省理工学院的“数据溯源计划”研究显示,约25%的“高质量”数据已经从用于训练AI模型的主要数据集中被限制。
AI研究机构Epoch AI预言,如果这一限制趋势持续,开发者将在2026年至2032年之间耗尽训练生成式AI模型所需的数据。这一状况,加上对版权诉讼的担忧,迫使OpenAI不得不与出版商和各类数据经纪人签订昂贵的许可协议。
据报道,OpenAI开发了一种推理技术,旨在提高其模型在特定问题(尤其是数学问题)上的回答质量。该公司的首席技术官米拉·穆拉蒂(Mira Murati)还承诺,未来将推出“博士级”智能模型,这也是一个相当高的承诺,带来了巨大的压力。报道称,OpenAI在训练模型和吸引高薪研究人员方面正在耗费数十亿美元。
OpenAI依然面临许多争议,包括使用受版权保护的数据进行训练、员工签订限制性保密协议,以及对安全研究人员的有效排挤等。产品发布周期的放缓可能会加剧一种观点,即OpenAI在追求更强大的生成式AI技术时,已降低了AI安全工作的优先级。
本文采用AI编译,模型训练:讯鸟云服,原文作者:Kyle Wiggers,审校排版:从林,点击查看原文链接
翻译作品,原文版权归原作者所有。未来学人仅提供翻译服务,不对原文内容或观点进行任何修改或代表。如有侵权,请联系我们删除。