强化学习推理新范式:连续隐空间技术的深度解析与实践2024年末,MetaFAIR团队在arXiv上公开了一项名为连续隐空间推理(ContinuousChain-of-Thought,简称CoCoT)的研究成果。这项技术通过直接在连续隐空间中运行推...admin666ssIT技术2026-04-160