内容目录
文章来源于互联网:田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
一个非常简单的更改,就能提高 LLM 推理能力。
-
论文标题:Training Large Language Models to Reason in a Continuous Latent Space -
论文地址:https://arxiv.org/pdf/2412.06769
-
在语言模式下,该模型作为标准语言模型运行,自回归生成下一个 token。 -
在潜在模式下,它直接利用最后一个隐藏状态作为下一个输入嵌入。这个最后的隐藏状态代表当前的推理状态,称为连续思维。
文章来源于互联网:田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式