探索大脑中语言理解机制，香港理工大学研究登Science子刊

首页 » 探索大脑中语言理解机制，香港理工大学研究登Science子刊

编辑 | 萝卜皮

当前的大型语言模型 (LLMs) 依赖单词预测作为其骨干预训练任务。尽管单词预测是语言处理的重要机制，但人类语言理解发生在多个层面，涉及单词和句子的整合以实现对话语的充分理解。

香港理工大学的研究人员通过使用下一句预测（Next Sentence Prediction，NSP）任务对语言理解进行建模，从而研究话语级理解的机制。

该团队表明，NSP 预训练增强了模型与大脑数据的一致性，尤其是在右半球和多需求网络中，突出了非经典语言区域对高级语言理解的贡献。NSP 可以使模型更好地捕捉人类理解性能并更好地编码上下文信息。

另外，在模型中包含不同的学习目标会产生更加类似于人类的表征，并且研究 LLMs 预训练任务的神经认知合理性可以揭示语言神经科学中的突出问题。

该研究以「Predicting the next sentence (not word) in large language models: What model-brain alignment tells us about discourse comprehension」为题，于 2024 年 5 月 23 日发布在《Science Advances》。

近期生成式人工智能（AI）的进步使 LLMs 成为焦点。LLMs 的卓越性能源于大规模文本数据上的预训练及将词汇和意义表示为高维向量（或「嵌入」）。越来越多的神经认知研究探索了模型嵌入如何捕获语言处理中的大脑活动，并且，LLMs 的兴起使科学家能更系统、明确地测试语言学习和表征的神经机制。

研究者倡导通过「表示一致性」连接计算模型与大脑研究，促进 AI 与神经认知领域知识交流。实现模型-大脑一致性（Greater model-brain alignment）需借助线性回归等方法建立模型嵌入与脑信号间的联系。现有研究检验不同模型嵌入与大脑数据的一致性度，以探索语言模型的哪些计算特性与大脑处理机制相关。

两个主要原则是：语境信息在理解过程中的表征，以及词预测作为语言理解核心过程。尽管进展显著，研究存在差距：LLMs 的词预测任务与人类追求基于统计理解多层话语的目标不同；且自然语言处理与语言神经科学界沟通不足。

香港理工大学研究团队的课题旨在利用 LLMs 探讨话语理解，这是结合两领域新发现的领域。

话语理解对人类交流和知识获取至关重要，涉及跨句子的意义构建。BERT 模型中的下一句预测（NSP）任务旨在增强模型理解句间关系的能力，可能映射到人脑处理和理解话语的方式。然而，关于支撑话语理解的大脑网络及其半球分工仍有许多未知，特别是右半球的作用尚待明确。

综合来看，研究旨在通过 LLMs 和 NSP 任务，促进对人类话语理解神经机制的深入理解。