跳至内容
让AI知识触手可及
首页
AI知识
AI资讯
AI问答
Search
搜索
登录/注册
首页
»
「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资
文章来源于互联网:
「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资
又一位 DeepMind 高级研究科学家离开了谷歌,创建了自己的初创公司。
在近日召开的英伟达 GTC 的一个小组讨论会上,谷歌 DeepMind 高级研究科学家、
RT-2
作者
Pete Florence
以 Generalist AI 联合创始人兼首席执行官的身份出席。
人工智能浪潮的来临让英伟达这家公司获得了巨大的财务成功,与此同时,NVentures 也成为一家格外活跃的风险投资公司。但目前我们无从得知 Pete Florence 的公司获得了多少来自英伟达的投资。
「我们基本上仍处于隐秘状态,」Pete Florence 在 GTC 讨论会上表示,暂时无法具体说明自己的初创公司在做什么。但答案也很明显了,公司将专注于机器人技术。
因为他在回答「如果他的初创公司获得巨大成功,世界会变成什么样子」问题时,是这么说的:
「我们的目标是制造能做任何事情的机器人。想象一下,在这个世界上,体力劳动的边际成本将趋于 0。」
「让通用机器人成为现实」
Florence 表示,自己创办这家公司的使命是「
让通用机器人成为现实
」。
根据其领英个人资料,Florence
一年前离开了 DeepMind
。他加入了 DeepMind 前同事的行列 —— 选择一条喜欢的赛道,创办自己的公司。
在加入谷歌之前,他在麻省理工学院获得了计算机科学博士学位,师从 Russ Tedrake。Tedrake 教授在机器人学领域有着显著的成就和广泛的影响力,研究领域包括机器人动力学分析、控制器设计和仿真等。
4 年多的谷歌 DeepMind 生涯中,Pete Florence 参与了很多项具备里程碑意义的机器人和大模型研究,其中最具代表性的有
PaLM-E
、RT-2。
随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密,人工智能正在越来越多地走向现实世界,因此具身智能相关的研究也正受到越来越多的关注。在这一领域,谷歌始终处于比较前沿的位置。(参考内容:《
大模型正在重构机器人,谷歌 Deepmind 这样定义具身智能的未来
》)
PaLM-E 是一种多模态具身视觉语言模型(VLM),2023 年 3 月发布。该模型集成了参数量 540B 的 PaLM 和参数量 22B 的视觉 Transformer(ViT),使用文本和来自机器人传感器的多模态数据(比如图像、机器人状态、场景环境信息等)作为输入,输出以文本形式表示的机器人运动指令,进行端到端的训练。PaLM-E 实现了对具身任务的决策方案预测,不涉及机器人动作的实际控制,需要依赖低级别的现成策略或规划器来将决策方案「翻译」为机器人动作。
RT-2 是全球第一个控制机器人的视觉 – 语言 – 动作(VLA)模型。这个模型让机器人不仅能解读人类的复杂指令,还能看懂眼前的物体(即使这个物体之前从未见过),并按照指令采取动作。比如,你让机器人拿起桌上「已灭绝的动物」。它会抓起眼前的恐龙玩偶。RT-2 被认为是机器人制造和编程方式的重大飞跃。
只需要像对话一样下达命令,它就能在一堆图片中辨认出霉霉,并送给她一罐可乐。
这些研究让谷歌 DeepMind 机器人团队始终保持着技术领先性,本月,团队有发布了用于控制机器人的新模型,这些模型的论文中还 4 次引用了 Florence 的成果。
核心团队来自 OpenAI、波士顿动力、DeepMind
在 Pete Florence 之外,这家公司的其他核心成员都来自知名科技公司。
同为谷歌 DeepMind 机器人团队前成员的 Kamyar Ghasemipour,也加入了 Generalist AI 成为创始成员。
OpenAI 前工程负责人 Evan Morikawa,曾领导过 ChatGPT、GPT-4、DALL・E 和 API 上线,从 OpenAI 离职后加入了这家初创公司。
团队成员还有前波士顿动力高级机器人科学家 Andrew Barry 和 Deep Mind 研究科学家 Andy Zeng。Andrew Barry 的个人主页显示,他担任的职位是联合创始人和 CTO。Andy Zeng 的社交媒体则没有透露更多信息。
参考链接:
https://techcrunch.com/2025/03/19/a-key-deepmind-robotics-researcher-left-google-and-nvidia-has-already-backed-his-stealth-startup/
文章来源于互联网:
「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资
港中文李鸿升团队论文 MindVLA-U1:VLA 不再输给 VA,语言真正进入自动驾驶决策
25
5 月
2026
CVPR 2026 视频模型趋势梳理:不止生成下一帧,更要理解下一步
25
5 月
2026
CVPR 2026 自动驾驶与协作智能梳理:模型正在走向可控真实世界
25
5 月
2026
一封律师函引发的GitHub风暴:拓竹为何惹毛了全球极客?
25
5 月
2026
代码驱动的视觉感知:为什么说「看得懂代码」才是大模型攻克理科题的真正钥匙 |CVPR 2026
25
5 月
2026
“声智融合、智启未来”全场景语音AI技术与产业发展战略研讨会在北京大学成功召开,开启语音交互的未来生活方式
24
5 月
2026
贝塔无限连续完成种子轮、种子+轮数亿元融资,以系统工程重构消费级具身智能
24
5 月
2026
智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速
24
5 月
2026
万字长谈丨同济工智院华先胜:工程智能,是 AI 的「成人礼」
24
5 月
2026
复旦可信具身智能研究院&上海交大:给自动驾驶装上可检索的「空间记忆」丨CVPR 2026
24
5 月
2026
万字长谈丨同济工智院华先胜:工程智能,是 AI 的「成人礼」
24
5 月
2026
阿里云为什么「重构自己」?
24
5 月
2026
DeepSeek组建Harness团队,非「超能力者」不要?中国AI开启「做产品」的关键一跳
24
5 月
2026
Anthropic 花 3 亿美金买下 API「修路工」,打响连接层暗战
24
5 月
2026
谷歌掀桌,一口气甩出16个AI王炸
24
5 月
2026
全部资讯
最新提问
我要提问
🎉🎉🎉AI问答功能上线喽!!
2024-11-30
Dongming
安装pytorch的时候提示拒绝访问
2024-11-30
7083
已经成功安装pytorch,但是import时提示"找不到指定的模块"
2024-11-30
7083
Pytorch安装后不能使用的问题
2024-11-30
7083
YOLO模型训练时提示报错
2024-11-30
7083
YOLO的安装使用报错问题
2024-11-30
7083
有哪些GPU云环境可以使用
2024-11-27
Dongming
No posts found
公众号
菜单
首页
AI知识
AI资讯
AI问答
滚动至顶部