在我看来,这个结果最重要的收获是,我们的 @OpenAI 国际数学奥林匹克(IMO)金牌模型也是我们最好的竞争编码模型。🧵
Sheryl Hsu
Sheryl Hsu12 小时前
1/n 我很高兴地分享,我们的 @OpenAI 推理系统在全球顶级编程比赛之一——2025年国际信息学奥林匹克(IOI)中获得了足够高的分数,赢得了金牌 🥇🥇,在所有AI参与者中名列第一! 👨‍💻👨‍💻
在IMO之后,我们对IMO金模型进行了全面评估,发现除了竞争数学之外,它在许多其他领域,包括编码,都是我们最好的模型。因此,大家决定在系统中使用完全相同的IMO金模型,不做任何更改,用于IOI。
IOI支架涉及从几个不同的模型中进行采样,然后使用另一个模型和启发式方法选择提交的解决方案。该系统获得了金牌,在人类中排名第六。IMO金牌模型确实是我们采样的所有模型中表现最好的。
明确来说,这个系统使用了支架,尽管比去年使用的支架要轻一些。它只是决定了从通用模型中提交哪些样本。我对明年感到乐观,我们会相信模型本身能够比我们能想到的任何支架做得更好。
我没有参与这项工作。非常恭喜 @sherylhsu02, @alexwei_, @bminaiev 和 oleg murk,以及 @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky,还有许多其他人取得的这个成果!
75.97K