一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

在我看来，这个结果最重要的收获是，我们的 @OpenAI 国际数学奥林匹克（IMO）金牌模型也是我们最好的竞争编码模型。🧵

在IMO之后，我们对IMO金模型进行了全面评估，发现除了竞争数学之外，它在许多其他领域，包括编码，都是我们最好的模型。因此，大家决定在系统中使用完全相同的IMO金模型，不做任何更改，用于IOI。

IOI支架涉及从几个不同的模型中进行采样，然后使用另一个模型和启发式方法选择提交的解决方案。该系统获得了金牌，在人类中排名第六。IMO金牌模型确实是我们采样的所有模型中表现最好的。

明确来说，这个系统使用了支架，尽管比去年使用的支架要轻一些。它只是决定了从通用模型中提交哪些样本。我对明年感到乐观，我们会相信模型本身能够比我们能想到的任何支架做得更好。

我没有参与这项工作。非常恭喜 @sherylhsu02, @alexwei_, @bminaiev 和 oleg murk，以及 @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky，还有许多其他人取得的这个成果！

75.97K