Det tar oss noen måneder å gjøre den eksperimentelle forskningsfronten om til et produkt. Men fremgangen går så raskt at noen måneder kan bety en stor forskjell i evner.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19. juli 2025
So, all the models underperform humans on the new International Mathematical Olympiad questions, and Grok-4 is especially bad on it, even with best-of-n selection? Unbelievable!
128,78K