关于 LM Studio

API 更新日志

系统要求

离线操作

在本地运行大型语言模型

概述

管理聊天

下载大型语言模型

与文档聊天

导入模型

预设

API

用户界面

高级

关于 LM Studio

API 更新日志

系统要求

离线操作

在本地运行大型语言模型

概述

管理聊天

下载大型语言模型

与文档聊天

导入模型

预设

API

用户界面

高级

与文档聊天

您可以将文档文件（.docx、.pdf、.txt）附加到 LM Studio 中的聊天会话。

这将为您通过应用程序聊天的LLM提供额外的上下文。

术语

检索：识别长源文档中的相关部分
查询：检索操作的输入
RAG：检索增强生成*
上下文：LLM的“工作记忆”。通常限制在几千字**

* 在此上下文中，“生成”指的是LLM的输出。

** 较新的LLM的一个最新趋势是支持更大的上下文大小。

上下文大小以“token”（标记）衡量。一个token通常约等于四分之三个单词。

RAG 与完整文档“上下文内”

如果文档足够短（即，如果它符合模型的上下文长度），LM Studio 将把文件内容完整地添加到对话中。这对于支持较长上下文大小的模型（例如 Meta 的 Llama 3.1 和 Mistral Nemo）特别有用。

如果文档非常长，LM Studio 将选择使用“检索增强生成”，通常称为“RAG”。RAG 意味着尝试从非常长的文档（或多个文档）中提取相关部分，并将其提供给模型以供参考。这种技术有时效果非常好，但有时需要一些调整和实验。

RAG 成功秘诀

在您的查询中提供尽可能多的上下文。提及您期望在相关源材料中出现的术语、思想和词语。这通常会增加系统为LLM提供有用上下文的机会。一如既往，实验是找到最佳方法的途径。

本页内容

术语

RAG 与完整文档“上下文内”

RAG 成功秘诀