文章来源于互联网:万亿token!史上最大多模态数据集诞生
开源多模态大模型或将开始腾飞。

-
数据集地址:https://github.com/mlfoundations/MINT-1T -
论文地址:https://arxiv.org/abs/2406.11271 -
论文标题:MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens






文章来源于互联网:万亿token!史上最大多模态数据集诞生
