OpenAI最强o3 模型被曝造假,提前获取FrontierMath测试题库的特权访问权
时间:2025年01月21日 10:40
【OpenAI最强o3 模型被曝造假,提前获取FrontierMath测试题库的特权访问权】比特时代报道,一位名为“Meemi”的 Epoch AI 承包商在LessWrong 论坛透露,OpenAI 不仅为 FrontierMath 基准测试提供资金支持,还获得了测试题库的特权访问权。而这或许也是 o3 的成绩在短时间内获得极大提高的重要原因。
本表明 o3 在高级数学推理方面有巨大斯坦福大学数学博士生 Carina Hong 声称,在 Epoch AI 的安排下,OpenAI 拥有对 FrontierMath 的特权访问权。进步的成绩单,却在承包商的爆料后迎来了风评反转。面对争议,Epoch AI 副主任兼联合创始人之一 Tamay Besiroglu 很快在 X 平台承认了此事。
据悉,FrontierMath 是一个分量极重的高级数学推理能力评估基准。它由 Epoch AI 联手 60 多位顶级数学家共同打造,参与者包括多位菲尔兹奖得主和国际数学奥林匹克竞赛的资深命题人。
本分分类: 快讯
版权声明:本文由入驻比特时代实名用户小雪收集发布,不代表比特时代立场,如有侵权/不实内容请联系本站管理员进行核实处理!本文链接:https://www.btc38.com/newsflash/9648.html