文章来源于互联网:又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒



说实话,这画风有宫崎骏老爷子的味道。Vidu 读懂了提示词,小女孩切菜动作一气呵成,就是手指和刀具在不经意间仍有变形。



在 DiT 论文发布两个月前,清华大学的朱军团队提交了一篇论文 ——《All are Worth Words: A ViT Backbone for Diffusion Models》。这篇论文提出了用 Transformer 替代基于 CNN 的 U-Net 的网络架构 U-ViT。这是「Vidu」最重要的技术基础。
文章目录
Toggle《当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律》
《专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型》
《国内公司有望做出Sora吗?这支清华系大模型团队给出了希望》
参考链接:
文章来源于互联网:又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒




























