Trvá nám několik měsíců, než proměníme hranice experimentálního výzkumu v produkt. Pokrok je však tak rychlý, že několik měsíců může znamenat velký rozdíl ve schopnostech.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19. 7. 2025
So, all the models underperform humans on the new International Mathematical Olympiad questions, and Grok-4 is especially bad on it, even with best-of-n selection? Unbelievable!
128,78K