Es genial ver cómo esto se une, un trabajo increíble encabezado por @brendanh0gan, en general, una receta increíblemente detallada de lo que se necesita para crear un modelo especializado para tareas OOD donde los modelos de frontera realmente luchan papel/pesos/datos/código en el hilo de Brendan :)
Brendan Hogan
Brendan Hogan13 ago, 22:42
Presentamos qqWen: nuestro proyecto de código abierto (código + pesos + datos + informe técnico detallado) para el ajuste fino de pila completa (preentrenamiento + SFT + RL) una serie de modelos (1.5b, 3b, 7b, 14b y 32b) para un lenguaje de programación financiera de nicho llamado Q ¡Todos los detalles a continuación!
18.31K