Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En mi opinión, la conclusión más importante de este resultado es que nuestro modelo de oro de la Olimpiada Internacional de Matemáticas (@OpenAI IMO) también es nuestro mejor modelo de codificación competitiva. 🧵

hace 12 horas
1/n Estoy emocionado de compartir que nuestro sistema de razonamiento de @OpenAI obtuvo una puntuación lo suficientemente alta como para alcanzar el oro 🥇🥇 en una de las principales competiciones de programación del mundo - la Olimpiada Internacional de Informática (IOI) 2025 - ¡quedando en primer lugar entre los participantes de IA! 👨💻👨💻

Después del IMO, realizamos evaluaciones completas del modelo de oro del IMO y descubrimos que, además de ser competitivo en matemáticas, también era nuestro mejor modelo en muchas otras áreas, incluyendo la codificación. Así que la gente decidió tomar el mismo modelo de oro del IMO, sin ningún cambio, y usarlo en el sistema para el IOI.
El andamiaje de IOI involucró muestreo de varios modelos diferentes y luego usar otro modelo y un heurístico para seleccionar soluciones para la presentación. Este sistema logró una medalla de oro, ocupando el 6° lugar entre los humanos. El modelo de oro de IMO realmente fue el mejor de todos los modelos de los que muestreamos.
Para ser claros, este sistema utilizó andamiaje, aunque un andamiaje más ligero que el del año pasado. Solo decidió qué muestras de modelos de propósito general enviar. Soy optimista de que el próximo año nos sentiremos seguros de que el modelo en sí puede hacerlo mejor que cualquier andamiaje que podamos idear.
No estuve involucrado en este trabajo. ¡Grandes felicitaciones a @sherylhsu02, @alexwei_, @bminaiev y oleg murk, así como a @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky y muchos, muchos otros por este resultado!
75.97K
Populares
Ranking
Favoritas