文章来源于互联网:昆仑万维「天工4.0」携超强o1/4o霸气上线!强推理+实时语音,免费无限体验
2024 年 12 月中旬,前 OpenAI 首席科学家 Ilya Sutskever 在 NeurIPS 大会上发表了一个惊人的观点:Scaling law 正在放缓,预训练时代即将结束,未来的研究方向将更加注重推理能力的提升。
如果 Ilya 的预测为真,那我们现在其实正在经历一场大模型发展路线的范式转移。
在国内,不少从业者也观察到了类似趋势。昆仑万维董事长兼 CEO 方汉曾提到,「从目前的情况来看,训练的 Scaling Law 其实还是有所放缓的,但是基于慢思考的、推理的 Scaling Law 又开始涌现。」
与此同时,国内外很多公司都在加码多模态。因为随着大模型应用范围的扩大,单一模态的局限性正变得愈发明显,只有实现多模态融合,用户才能获得更丰富的体验。
不过,在国内,能做到两条线齐头并进的公司还非常少。
昆仑万维就是其中之一。2024 年 11 月,机器之心报道了这家公司的两个大模型 —— 天工大模型 4.0 o1(Skywork o1)和天工大模型 4.0 4o(Skywork 4o)。
但令人意外的是,2025 年第一周刚过完,这两个模型就一起上线了!而且是全量上线,免费用。
打开天工 web 端网站,由 Skywork o1 加持的各项功能就会出现在眼前。o1 的提升主要体现在推理能力方面,在数学、代码、中文逻辑推理等问题中表现突出。
可以看到,在拿到一个提示后,Skywork o1 不会立马给出答案,而是一步一步去推导正确答案。与之前的「快思考」模型相比,这种「慢思考」的模式更适合去解决现实世界的复杂问题。
天工 web 端地址:https://www.tiangong.cn/ (点开立即体验 Skywork o1)
Skywork 4o 则有着拟人的语音对话能力,而且延迟低、可打断、音色逼真、情感丰富…… 利用这一模型,天工技术团队打造了实时语音对话 AI 助手 Skyo,通过天工 APP 的 Skyo 入口对外开放。
Skywork o1 表现如何?
当大模型学会复杂推理,一些原本很难解决的数学、代码等问题往往会迎刃而解。Skywork o1 的表现就证明了这一点。
在数学相关的基准测试中,Skywork o1 Preview 在包含数十道数学竞赛级别难度的测试问题的 AMC-23 中达到了 SOTA,在 AIME-24 和由国际数学奥林匹克等高难度数学竞赛题组成的 OlympiadBench 也取得了不错的成绩,仅次于 OpenAI 的 o1-mini。
-
语音输入(Speech Query)与语音编码(Speech Encoder):用户通过语音表达自己的问题或请求,这些语音被系统接收,作为对话的起点。系统利用语音编码器将接收到的语音信号转换为语义表示。 -
适配转换(Adapter):语音的语义表示通过适配模块的模态对齐被调整为大语言模型(LLM)能够理解的格式,为语音与文本语义的无缝对接提供支持。 -
大语言模型(LLM):经过适配的语音信息被输入到核心智能模型(LLM),模型通过多模态的处理能力理解语音意图,并生成相应的解决方案或回答。 -
语音输出(Speech Token):系统支持直接输出语音 token(Speech Token),通过扩散模型将这些 token 还原为真实语音,实现从语音输入到语音输出的端到端交互。 从体验效果中我们能感觉到,Skyo基本能做到「像和真人一样说话聊天」的效果,两个影响体验的关键因素——响应速度和回复的自然流畅程度——都优化得非常好。由此可见,端到端建模的方式确实存在明显优势,它让 Skyo 不再仅仅是一个语音转录后进行理解问答的工具,而是成为了声音领域的智能专家。 2025 年,大模型竞争进入 Next Level 这段时间,关于 2025 年 AI 趋势的分析多了起来,大家不约而同地提到了一些关键词,比如推理时间计算、AI 智能体、空间智能、AI 应用…… 显然,大模型的竞争即将进入 Next Level。 IBM 发布的 2025 年 AI 趋势分析。 当然,并不是所有的企业都可以继续走下去。除了算力这种拦路虎,技术路线的环环相扣也是一个重要因素。比如要想做好 AI 智能体,模型的推理能力要足够强;要想做好空间智能和 AI 应用,多模态能力至关重要。毕竟,现实生活中的很多需求都是多模态而不是纯文字的,模型对真实物理世界的感知也要建立在强大的多模态理解能力之上。 在众多做大模型的国内公司中,昆仑万维是模型能力较为全面的一家。这些能力彼此增益,帮助昆仑万维实现了模型能力的快速迭代,也让他们在潜在应用的探索中拥有更高的自由度。 截至目前,昆仑万维已经在应用领域取得了不少成果,比如推出了最懂金融、学术的天工 AI 搜索,AI 音乐创作平台 Mureka,AI 短剧平台 SkyReels,AI 社交产品 Linky 等。对于这样的成绩,昆仑万维创始人周亚辉在朋友圈发文表示,「昆仑万维 24 年的 AI 战略我自己也打满分,原因是足够差异化,找到了自己小而大美的空间。」 更重要的是,这些已经取得的技术、产品成果让昆仑万维在实现其长期目标 —— 通用人工智能(AGI)的道路上,显得尤为坚定和有信心。 2024 年初,昆仑万维发布了新使命 —— 实现通用人工智能,让每个人更好地塑造和表达自我。 周亚辉认为,AGI 时代也可以叫做机器人时代。AGI 时代的标志是机器人开始真正进入人类社会,进入到人们工作和生活的方方面面的场景中。 不过,要想进入这个时代,需要解决空间智能大模型的构建、运动控制技术的改进、机器人的保值增值能源能耗这三大问题。目前,对推理大模型和多模态大模型的研究正逐步为这些技术难题提供解决方案。这些研究可能是通往 AGI 时代的必经之路。 未来一年,我们期待昆仑万维在 AI 领域的发展能够带给大家更多的惊喜。