Economía del Token LRM: un informe sobre la eficiencia del razonamiento en LLMs (sobre un conjunto de problemas que la mayoría de ellos pueden resolver con una precisión cercana a 1.0). Muchos hallazgos interesantes, pero primero lo primero: La V3.1 está a la par con Sonnet 4. Es mucho menos balbuceante que 0528.
2,69K