文章来源于互联网:国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
随着新版本的发布,讯飞星火V4.0七大核心能力全面升级,在8个国际主流测试集中排名第一,整体超越GPT-4 Turbo,领先国内大模型。


文章目录
Toggle
整体超越GPT-4 Turbo 七大底层核心能力再次升级






最后,星火大模型V4.0能够搞定更加复杂的逻辑推理、空间推理问题。
以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到卧室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在什么地方?”讯飞星火可以基于空间和常识推断出球在卧室的地面上,这些能力的进步对于以后的具身智能、家庭机器人都具有意义。

星火语音大模型发布74个语种方言“自由对话” 破解强干扰场景下语音识别难题


另外,讯飞还重点展示了其超复杂场景语音转写的能力。三位人员现场实测了在噪音场景下,同时混叠着说话,正常人耳已难以听清,只见讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人说的话。


医疗大模型「讯飞晓医」 每个人的AI健康助手



发布智能批阅机 教育大模型再次升级


推出「个人空间」 打造懂你的AI助手
自OpenAI先后推出GPTs以及GPT Store以来,人们可以基于大模型量身打造自己的AI智能助理。很多人都对它们的到来抱有极大期待,认为会迎来AI的「iPhone时刻」。其他厂商也随之跟进推出类似的AI智能体服务,比如微软推出了自己的Copilot GPTs服务。
然而,事情的发展不尽如人意,GPTs很快陷入了瓶颈。几天前,微软宣布砍掉了维持仅3个月的Copilot GPTs服务。细究原因,GPTs很大程度上在应用场景和商业落地方面没有跟上来,后续也就失去了进一步发展的动力。
因此,近半年来,国内头部大模型厂商都在智能体上快速发力,并在应用层面下足了功夫。





通过让用户更高程度的定义「Chatbot」,从个人知识增强、到选择人设标签、创建发音人,再到开放智能体定义,科大讯飞将大模型「Chatbot」的数据、工作流以及表现形式各方面都实现了定义自主化。
个性化大模型到了一个新阶段,星火大模型V4.0将「每个人的个性化智能助手」这件事从「个性化」和「智能」两方面都向前迈进一步。
