文章来源于互联网:物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代
我们都没预料到,AI 领域的 2025 年是这样开始的。




-
一方面是 DeepSeek 拥有大量的 GPU,据称有超过一万块,而 Scale AI 的 CEO Alexandr Wang 甚至表示可能达到 5 万块。 -
另一方面,DeepSeek 只从中国排名前三的大学招聘人才,这意味着 DeepSeek 与阿里巴巴和腾讯具有同等的竞争力。

-
这个模型非常出色,与 OpenAI 两个月前发布的版本相当,当然也有可能不如 OpenAI 和 Anthropic 尚未发布的新模型。 -
从目前来看,研究方向仍主要由美国公司主导,DeepSeek 模型属于对 o1 版本的「快速跟进」,但 DeepSeek 的研发进度非常迅猛,比预期更快地迎头赶上,他们并没有抄袭或作弊,最多只是逆向工程。 -
DeepSeek 主要是在培养自己的人才,而不是依赖美国培养的博士,这大大扩展了人才库。 -
与美国公司相比,DeepSeek 在知识产权许可、隐私、安全、政治等方面受到的约束较少,围绕错误地使用那些不想被训练的数据的担忧也较少。诉讼更少,律师更少,也更少顾虑。


-
开源 AI 仅落后于闭源 AI 不到 6 个月 -
中国正在主导开源 AI 竞赛 -
我们正进入大语言模型强化学习的黄金时代 -
蒸馏模型非常强大,我们将在手机上运行高智能 AI

