文章来源于互联网:智源开源多模态向量模型BGE-VL:多模态检索新突破
BGE 系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型 BGE-VL,进一步扩充了原有生态体系。BGE-VL 在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。BGE-VL 借助大规模合成数据 MegaPairs 训练而成。这一设计具备以下两大核心优势:
-
优异的可扩展性:MegaPairs 结合多模态表征模型、多模态大模型和大语言模型,在海量图文语料库中高效挖掘多模态三元组数据。其算法能够以极低成本持续生成多样化且高质量的多模态三元组。本次发布的版本涵盖 2600 万条样本,为多模态检索模型的训练提供了大规模、高价值的数据支持。
-
卓越的数据质量:相较于传统多模态数据,MegaPairs 仅需 1/70 的数据量即可实现更优的训练效果。利用该合成数据,智源训练了多模态检索模型 BGE-VL,显著提升了多个主流多模态检索基准的性能。
-
论文地址:https://arxiv.org/abs/2412.14475
-
项目主页:https://github.com/VectorSpaceLab/MegaPairs
-
模型地址:https://huggingface.co/BAAI/BGE-VL-MLLM-S1








文章来源于互联网:智源开源多模态向量模型BGE-VL:多模态检索新突破