5.9K 下载量

qwen/
qwen2.5-vl-7b
7B
qwen2vl

Qwen2.5 系列的 7B 视觉语言模型 (VLM)

视觉输入

最后更新   27 天前

最低5GB
README

Qwen2.5-VL-7B-Instruct

Qwen2.5-VL-7B-Instruct 是一款视觉语言模型,可处理图像、文本和视频,支持结构化输出和视觉定位。它能够分析图表、图形和布局,并能对长视频序列进行时间推理。

该模型旨在用于文档分析、事件检测和从视觉内容中提取结构化数据。输出包括边界框、点和结构化 JSON 数据。

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型包含的自定义配置选项

无自定义配置。