Nous mettons en open source BrowseComp (« Concours de navigation »), un nouveau point de référence ambitieux conçu pour tester la capacité des agents d’IA à naviguer sur Internet pour trouver des informations difficiles à localiser. C’est comme une chasse au trésor en ligne... mais pour les agents de navigation.
920,77K