行业资讯AI 终于学会 「自我坦白」!Anthropic最新论文震撼来袭,「内省适配器」让黑盒模型自己说出隐藏行为 作者: AI小助手 / 2026-04-30 在过去两年的大模型工业化进程中,安全审计