DApp Store | Centrum Web3 pro události a hry

Explore the Momentum ecosystem and earn $1.015M in rewards

Populární témata

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+15,09 %

Boopa-3,37 %

PORK-80,07 %

will brown

odměna za hackování @primeintellect

will brown repostoval/a

samsjaPřed 2 h

Plná podpora SFT byla do systému Prime-RL přidána za jeden den společností @mikasenghaas

1,47K

will brownPřed 3 h

Mám-li být upřímný, dnes příliš mnoho pozornosti internetu. Vyšel nový článek. Seznam TBPN je k dispozici. Oznámeno jako panelista na workshopu Neurips. Ta věc s Donaldovou lodí

5,65K

will brownPřed 3 h

Mnoho implementací matematického ověřování má jedny z nejprokletějších věcí, jaké jste kdy viděli

3,92K

will brown repostoval/a

clem 🤗Před 7 h

Vítejte v @MorganStanley na @huggingface!

7,48K

will brownPřed 9 h

je skvělé vidět, jak se to spojilo, neuvěřitelná práce v čele s @brendanh0gan, celkově neuvěřitelně podrobný recept na to, co je potřeba k vytvoření specializovaného modelu pro úkoly OOD, kde hraniční modely opravdu bojují Papír/Gramáže/Data/Kód v Brendanově vlákně :)

Brendan HoganPřed 9 h

představujeme qqWen: náš plně open-source projekt (kód + váhy + data + podrobná technická zpráva) pro kompletní jemné doladění (předškolení + SFT + RL) řadu modelů (1.5b, 3b, 7b, 14b a 32b) pro specializovaný finanční programovací jazyk zvaný Q Všechny podrobnosti níže!

13,13K

will brown repostoval/a

Brendan HoganPřed 9 h

49,66K

will brown13. 8. 02:19

Sluch hlásí, že 5 je větší než 4.5 o cca 0,5

18,61K

will brown12. 8. 13:25

Miluji vystřelit hluboký výzkumný dotaz, jít dělat nějaké jiné věci na 15 minut a pak se vrátit k "Mohl byste objasnit následující body?"

41,44K

will brown repostoval/a

Mika Senghaas12. 8. 11:23

Přechod z VLLM V0 na V1 způsobil pád našeho asynchronního školení RL! Přečtěte si, jak jsme to opravili Nedávno jsme migrovali z verze v0 na verzi 1 v rámci většího refaktoringu služby Prime-RL, aby byla snadněji použitelná, výkonnější a přirozeně asynchronní. Potvrdili jsme správnou dynamiku tréninku při mnoha menších bězích, ale při pokusu o reprodukci běhu ve větším měřítku, který před refaktorem probíhal bez problémů, jsme narazili na zeď. Konkrétně trénování DeepSeek-R1-Distill-Qwen-1.5B na jednootáčkových matematických problémech z naší matematické datové sady INTELLECT-2 v 8k kontextu s dvoustupňovým zpožděním mimo politiku by fatálně zhroutilo zhruba 400 kroků do trénování

38,09K

will brown12. 8. 11:11

Kombinace novosti a rozhořčení je mízou této platformy. rádi se rozčilujeme nad věcmi kolem Groka. Milujeme hloupé politické argumenty. Milujeme podivné brouky. Milujeme toho divného psího chlápka. Platforma zemře, až bude dosaženo světového míru a zprávy se přestanou dít

4,19K

Top

Hodnocení

Oblíbené

Co je v trendu on-chain

Populární na X

Nejvyšší finanční vklady v poslední době

Nejpozoruhodnější