Дуже круто бачити, як це поєднується, неймовірна робота, очолювана @brendanh0gan, загалом неймовірно детальний рецепт того, що потрібно, щоб створити спеціалізовану модель для завдань OOD, де фронтирні моделі справді борються Папір/Ваги/Дані/Код у потоці Брендана :)
Brendan Hogan
Brendan Hogan13 серп., 22:42
Представляємо qqWen: наш повністю відкритий проект (код+ваги+дані+детальний технічний звіт) для повного налаштування стека (pretrain+SFT+RL) серії моделей (1.5b, 3b, 7b, 14b та 32b) для нішевої фінансової мови програмування під назвою Q Всі подробиці нижче!
18,32K