Läste artikeln om Hierarchical Reasoning Model just nu och tänkte att @ylecun faktiskt kan ha rätt om autoregressiva modeller...
1,88K