文章来源于互联网:不让视觉语言模型「盲猜」,性能竟直接提升一倍?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
团队的共同一作林之秋(Zhiqiu Lin)是卡内基梅隆大学的博士研究生,由Deva Ramanan教授指导,专注于视觉-语言大模型的自动评估与优化。团队的马紫晛(Zixian Ma)是华盛顿大学的博士研究生,由Ranjay Krishna教授指导,专注于视觉-语言大模型的评测以及与人的交互。

-
📄论文链接: https://arxiv.org/abs/2410.14669 -
🌍网站: https://huggingface.co/datasets/BaiqiL/NaturalBench
文章来源于互联网:不让视觉语言模型「盲猜」,性能竟直接提升一倍?







