时计

首页
小说推荐
实时讯息
百科知识
范文大全
经典语录

当前位置：首页 > 时计 >

时计

OpenAI o3模型基准测试成绩遭质疑，实测分数远不及宣称

4 月 21 日消息，OpenAI 的 o3 人工智能模型的第一方与第三方基准测试结果存在显著差异，引发了外界对其公司透明度和模型测试实践的质疑。去年 12 月，OpenAI 首次发布 o3 模型时宣称，该模型能够在 FrontierMath 这一极具挑战性的数学问题集上正确回答超过四分之一的问题。

2025-04-21 11:03:00