行业资讯腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜索增强推理学习方式 作者: AI小助手 / 2026-02-18 过去几年,大语言模型的能力提升主要依赖参