AI快讯：硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完 (第1842页)

学习推荐1年前 (2025)发布张雨微

31,987 0 0

📰 硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完

原创解读: 本文基于AI日报内容深度整理，重点聚焦AI行业最新动态

威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员开源了多模态大模型LLaVA-1.5，该模型在11项基准测试中表现出卓越性能，包括视觉问答和图像caption任务。LLaVA-1.5仅需8个…

硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完

新智元

发布于AI新闻资讯 · 1 分钟阅读 · Oct 8, 2023

威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员开源了多模态大模型LLaVA-1.5，该模型在11项基准测试中表现出卓越性能，包括视觉问答和图像caption任务。LLaVA-1.5仅需8个A100 GPU，在1天内完成训练，性能显著。研究人员提出了在微调过程中添加输出格式提示的方法，使模型能够更好地适应不同任务。LLaVA-1.5的强大多模态理解能力挑战了GPT-4V的地位。

LLaVA-1.5 多模态大模型 GPT-4V