Abbiamo valutato molti modelli di base su valutazioni basate sulla perplessità e Kimi k2.5 si è dimostrato il più forte! Dopo di che, facciamo un pre-addestramento continuo e un RL ad alta potenza di calcolo (un aumento di scala 4x). La combinazione della forte base, CPT e RL, e i campionatori di inferenza e RL di Fireworks rendono Composer-2 di livello frontier. È stato un errore non menzionare la base Kimi nel nostro blog fin dall'inizio. Risolveremo questo per il prossimo modello.