LM Studio 0.3.23

2025-08-12

📣 提示:LM Studio 现已免费用于工作!阅读更多 https://lm-studio.cn/blog/free-for-work

LM Studio 0.3.23 现已作为稳定版发布。此版本专注于可靠性改进、低配设备的性能优化以及若干错误修复。


提高 openai/gpt-oss 聊天内工具调用(tool calling)的可靠性

现在,工具名称在发送给模型之前会进行统一格式化。此前,名称中带有空格的工具会干扰 gpt-oss 并导致工具调用失败。现在工具名称会被转换为 snake_case(蛇形命名法)。

此外,我们还解决了一些此前可能导致聊天中出现解析错误的错误。您可能会注意到工具调用可靠性有了显著提升。

通过聊天补全接口(Chat Completions endpoint)获取 gpt-oss 的推理内容

与 0.3.22 版本相比,这是一个行为上的变化。

  • message.content 将不再包含推理内容或 <think> 标签。
  • 推理内容现在位于 choices.message.reasoning(非流式)和 choices.delta.reasoning(流式)中。
  • 这与 o3-mini 的行为保持一致。

强制将 MoE 专家权重置于 CPU 或 GPU

在此版本中,我们添加了一项高级模型加载设置,可将所有 MoE 专家权重放置在 CPU 或 GPU(默认)上。

undefined

开启此选项可强制将 MoE 专家权重置于 CPU。请在显存(VRAM)较低的机器上尝试此操作。

如果您没有足够的显存将整个模型加载到 GPU 专用内存中,这将非常有益。在这种情况下,请尝试在高级加载设置中开启“强制将模型专家权重置于 CPU”选项。

如果您可以将整个模型加载到 GPU 内存中,最好坚持将专家权重也放置在 GPU 上(这是默认选项)。

这使用了与 llama.cpp--n-cpu-moe 相同的底层技术。

请记住,您可以为每个模型设置持久化配置。请参阅 文档以获取更多信息

LM Studio 0.3.23 - 完整版本说明

通过应用内更新或从 https://lm-studio.cn/download 升级。

版本 3

  • [llama.cpp][MoE] 添加通过高级加载设置中的“强制将模型专家权重置于 CPU”将专家权重加载到 CPU/GPU RAM 的功能
  • 在提供给模型之前对工具名称进行规范化(替换空格、特殊字符)

版本 2

  • 修复下载官方精选模型时,“完成下载”按钮有时不起作用的问题
  • 修复扩展包(如 Harmony)的“修复”按钮不起作用的问题
  • 修复向 /v1/chat/completions 发送某些包含工具的请求时出现的“无法读取未定义的属性(读取 'properties')”错误
  • 修复自动更新 harmony 时出现的 Error: EPERM: operation not permitted, unlink 错误

版本 1

  • 通过错误修复显著提升聊天内工具调用的可靠性
  • 修复部分旧对话无法在应用中加载的错误
  • 修复在非流式模式下通过 OpenAI 兼容 API 使用时,工具调用有时会失败的错误
  • 修复模型在 v1/chat/completions 中不输出思考标签的问题
    • 针对 gpt-oss:
      • message.content 将不包含推理内容或特殊标签
      • 这与 o3-mini 的行为保持一致。
      • 推理内容将位于 choices.message.reasoning(stream=false)和 choices.delta.reasoning(stream=true)中
  • 修复导致在搭载 AMD+NVIDIA GPU 的机器上出现应用功能问题的“TypeError: Invalid Version”错误
  • 修复用户模式下 MCP 插件芯片名称不渲染的错误
  • 修复点击时搜索结果会刷新的错误

资源