Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meiner Meinung nach ist die wichtigste Erkenntnis aus diesem Ergebnis, dass unser @OpenAI Internationaler Mathematik-Olympiade (IMO) Goldmodell auch unser bestes Wettbewerbs-Coding-Modell ist. 🧵

12. Aug., 02:00
1/n Ich freue mich, mitteilen zu können, dass unser @OpenAI-Reasoning-System hoch genug bewertet wurde, um Gold 🥇🥇 in einem der weltweit führenden Programmierwettbewerbe - der Internationalen Olympiade in Informatik (IOI) 2025 - zu erreichen und den ersten Platz unter den KI-Teilnehmern zu belegen! 👨💻👨💻

Nach dem IMO haben wir vollständige Bewertungen des IMO-Goldmodells durchgeführt und festgestellt, dass es neben der wettbewerbsfähigen Mathematik auch unser bestes Modell in vielen anderen Bereichen war, einschließlich Codierung. Daher beschlossen die Leute, dasselbe IMO-Goldmodell ohne Änderungen zu verwenden und es im System für IOI einzusetzen.
Das IOI-Gerüst bestand darin, Proben aus einigen verschiedenen Modellen zu entnehmen und dann ein anderes Modell sowie eine Heuristik zu verwenden, um Lösungen zur Einreichung auszuwählen. Dieses System erzielte eine Goldmedaille und belegte den 6. Platz unter den Menschen. Das IMO-Goldmodell schnitt tatsächlich am besten von all den Modellen ab, aus denen wir Proben entnommen haben.
Um klarzustellen, dieses System verwendete eine Struktur, wenn auch eine leichtere als im letzten Jahr. Es entschied nur, welche Proben von allgemeinen Modellen eingereicht werden sollten. Ich bin optimistisch, dass wir im nächsten Jahr zuversichtlich sein werden, dass das Modell selbst besser abschneiden kann als jede Struktur, die wir uns ausdenken könnten.
Ich war nicht an dieser Arbeit beteiligt. Herzlichen Glückwunsch an @sherylhsu02, @alexwei_, @bminaiev und Oleg Murk, sowie an @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky und viele, viele andere zu diesem Ergebnis!
113,93K
Top
Ranking
Favoriten