跳至内容
让AI知识触手可及
首页
AI知识
AI资讯
AI问答
Search
搜索
登录/注册
首页
»
「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」
文章来源于互联网:
「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」
ChatGPT 要进化了?
本月初,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片,勾起了大家强烈的好奇心。
「四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?」奥特曼在回应网友时也在暗示,惊喜马上就来。
据科技媒体 The Information 报道,传说中的「草莓」真的要来了!
两位参与该项目的人士表示,OpenAI 计划最早在今年秋天推出代号为 「草莓」(之前称为 Q*,发音为 Q Star)的新
人工智能
,作为
聊天机器人
的一部分(可能集成在 ChatGPT 内)。「草莓」 可以解决它以前从未见过的数学问题(这是当今的
聊天机器人
无法准确做到的),并且训练后还可以解决涉及编程的问题,但它并不局限于回答技术问题。
据 The Information 报道,OpenAI 正在开发新旗舰 LLM,代号「Orion」。该模型旨在改进去年年初推出的现有旗舰 LLM——GPT-4。
而「草莓」旨在改进即将推出的「Orion(猎户座)」,并且 OpenAI 已经向安全监管人员展示了「草莓」模型。较小版本的「草莓」可以以
聊天机器人
的形式推出。
知情人士表示:OpenAI 正在使用较大版本的「草莓」来生成用于训练 Orion 的数据。这种
人工智能
生成的数据被称为「合成数据」。这意味着「草莓」可以帮助 OpenAI 克服获取足够高质量数据的限制,以便利用现实世界的数据(例如从互联网上提取的文本或图像)训练新模型。
当给予额外的「思考」时间时,「草莓」可以回答用户更主观的问题,例如产品营销策略。
OpenAI 推出「草莓」是为了保持对话式
人工智能
或大型
语言模型
的霸主地位。该技术还将对未来完成多步骤任务的智能体产品产生影响。 OpenAI 希望在智能体领域开辟更多收入机会。
为什么「草莓」对「Orion」如此重要
「草莓」最重要的应用之一是为下一代旗舰大
语言模型
Orion 生成高质量的训练数据。该代号此前从未被报道过。
简单来说,「草莓」 可以生成更高质量的训练数据。智能体初创公司 Minion AI 的首席执行官、GitHub Copilot 的前首席架构师 Alex Graveley 表示,使用「草莓」生成更高质量的训练数据可以帮助 OpenAI 减少其模型生成的错误(也称为幻觉)数量,他还指出之所以能够做到这一点,是因为「训练数据中的歧义性较少」。
这里不得不提一下,OpenAI CEO 山姆・奥特曼在五月份的一次活动中曾说道:「我们觉得我们已经为下一个模型提供了足够的(数据),我们做了各种各样的实验,包括生成合成数据。」下一个模型可能指的就是「Orion」。
OpenAI 内部也在推动通过一种称为蒸馏(distillation)的过程来简化和缩小「草莓」。
现在还不能确定基于「草莓」的最终的产品将会是什么样子,但一个显而易见的想法是将「草莓」的推理能力融入到 ChatGPT。其结果是答案可能会更准确,但可能会更慢。
这意味着「草莓」可能不太适合用户期望立即得到响应的需求,但非常适合对时间不太敏感的用例。
或许我们可以想象,在不久的将来,ChatGPT 用户可以根据自身对时间的敏感程度来打开或关闭「草莓」。
今年夏天,OpenAI 已经向安全监管人员展示了「草莓」模型。此次演示可能是 OpenAI 努力向政策制定者提高透明度的一部分。
鉴于今年早些时候,Ilya Sutskever 等几位安全负责人的离职,对 OpenAI 来说,技术透明将尤其重要。
参考链接:
https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=ks2jbm
https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=ks2jbm
文章来源于互联网:
「草莓」即将上线,OpenAI新旗舰大模型曝光,代号「猎户座」
AI浪潮下,10年后的顶尖高校拼什么? 丨GAIR 2025
20
12 月
2025
中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025
20
12 月
2025
首创ACE具身研发范式,大晓机器人构建具身智能开放新生态
19
12 月
2025
上海市规划资源局与商汤大装置联合打造,“云宇星空大模型(专业版)”正式发布
19
12 月
2025
泡沫之下,人工智能产业化还有哪些方向值得「押注」? 丨GAIR 2025
19
12 月
2025
对话张进:当 AI 不再只靠「看见」去理解世界丨GAIR 2025
18
12 月
2025
硅基生命的「成年礼」:上海具身智能的入世大考与万亿生态突围
18
12 月
2025
GDPS 2025|宇树、智元首次同台,上海如何以「应用」领跑具身智能竞赛?
18
12 月
2025
港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理任务
17
12 月
2025
对话Noitom Robotics CEO戴若犁:没有人比我更适合解决机器人的数据问题 | GAIR 2025
16
12 月
2025
对话英诺王建明:机器人目前面临的核心问题是数据 | GAIR 2025
12
12 月
2025
IDCC 2025:全球进入算力效能竞争期,商汤大装置给出中国式解决方案
12
12 月
2025
IDC MarketScape:商汤科技位居中国AI咨询服务市场领导者类别
11
12 月
2025
金融智能体进入规模落地期 蚂蚁数科被评综合领导者
11
12 月
2025
铭凡 MINISFORUM 联合 AMD 带来两款 AI 旗舰产品
10
12 月
2025
全部资讯
最新提问
我要提问
🎉🎉🎉AI问答功能上线喽!!
2024-11-30
Dongming
安装pytorch的时候提示拒绝访问
2024-11-30
7083
已经成功安装pytorch,但是import时提示"找不到指定的模块"
2024-11-30
7083
Pytorch安装后不能使用的问题
2024-11-30
7083
YOLO模型训练时提示报错
2024-11-30
7083
YOLO的安装使用报错问题
2024-11-30
7083
有哪些GPU云环境可以使用
2024-11-27
Dongming
No posts found
公众号
菜单
首页
AI知识
AI资讯
AI问答
滚动至顶部
wpDiscuz
0
0
希望看到您的想法,请您发表评论
x
(
)
x
|
回复
Insert