← 所有模型

27.2K 下载量

qwen/qwen2.5-vl-7b

qwen/

qwen2.5-vl-7b

7B

qwen2vl

来自 Qwen2.5 系列的 7B 视觉语言模型 (VLM)

视觉输入

最后更新于 5 月 17 日

在 LM Studio 中使用模型

最低要求最低 5GB

README

Qwen2.5-VL-7B-Instruct

Qwen2.5-VL-7B-Instruct 是一款视觉语言模型，可处理图像、文本和视频，支持结构化输出和视觉定位。它能够分析图表、图形和布局，并能够对长时间视频序列进行时间推理。

该模型旨在用于文档分析、事件检测和从视觉内容中提取结构化数据。输出包括边界框、点和结构化 JSON 数据。

来源

此模型使用的底层模型文件

基于

🤗lmstudio-community/Qwen2.5-VL-7B-Instruct-GGUF→

GGUF

当您下载此模型时，LM Studio 会选择最适合您机器的来源（您可以覆盖此设置）

配置

此模型附带的自定义配置选项

无自定义配置。