MLfinal

MLfinal 用二元运算表构造监督学习任务，观察小型 Transformer 如何从符号样本里学到隐藏代数结构。这个项目的重点不是单纯分类准确率，而是训练过程里“先记忆、后泛化”的现象。

项目概览

MLfinal 用二元运算表构造监督学习任务，让模型从形如 a ∘ b = c 的符号样本中学习隐藏运算规则。实验对象包括模加法、模减法、模除法、多项式型模运算，以及对称群上的乘法与共轭相关运算。

这个项目最有意思的地方在于：模型并不只是背答案。随着训练步数增加，它可能先表现为过拟合，随后验证准确率突然上升，呈现类似 grokking 的泛化现象。

为什么这个任务值得看

二元运算表任务表面上是离散符号预测，实质上在问模型能不能学到背后的代数结构。
如果模型只记忆训练样本，它在未见过的组合上会失败；如果模型学到了结构，它就能在验证集上泛化。