LM Studio 0.3.15:RTX 50系列GPU和API中改进的工具使用
LM Studio 0.3.15 现已作为稳定版本发布。此版本包括对 NVIDIA RTX 50系列GPU (CUDA 12) 的支持,用户界面改进,包括新的系统提示编辑器界面。此外,我们改进了API对工具使用的支持 (tool_choice
参数),并添加了一个新选项,可以将每个生成的片段记录到API服务器日志中。
LM Studio 现在支持在 Windows 和 Linux 上使用我们的 llama.cpp
引擎的 RTX 50系列GPU (CUDA 12.8)。此更改使RTX 50系列GPU上的首次模型加载时间按预期快速。对于配备 RTX 50系列GPU的机器,如果 NVIDIA 驱动程序版本兼容,LM Studio 将自动升级到 CUDA 12。
最低驱动程序版本为
如果您拥有 RTX 50系列GPU 且驱动程序版本兼容,LM Studio 将自动升级到 CUDA 12。如果您拥有 RTX 50系列GPU 且驱动程序版本不兼容,LM Studio 将继续使用 CUDA 11。您可以通过 Ctrl + Shift + R
管理此设置。
系统提示是自定义模型行为的强大方式。它们可能只有几个词,有时也可能长达数页。LM Studio 0.3.15 引入了更大的视觉空间来编辑更长的提示。您仍然可以在侧边栏中使用迷你提示编辑器。
类似 OpenAI 的 REST API 现在支持 tool_choice
参数,该参数允许您控制模型如何使用工具。tool_choice
参数可以接受三个值:
"tool_choice": "none"
- 模型不会调用任何工具"tool_choice": "auto"
- 模型决定是否调用工具"tool_choice": "required"
- 强制模型只输出工具 (仅限 llama.cpp 引擎)我们还修复了 LM Studio 的 OpenAI 兼容模式中的一个错误,该错误导致在适当情况下,分块的 "finish_reason" 未设置为 "tool_calls"。
预设 是一种将系统提示和模型参数打包在一起的便捷方式。
从 LM Studio 0.3.15 开始,您可以将您的预设与社区共享,并通过网络 ☁️ 下载其他用户制作的预设。您还可以点赞和派生他人制作的预设。
在 设置 > 通用 > 启用发布和下载预设 中启用此功能。启用后,当您在侧边栏中右键单击预设时,将看到一个新的“发布”按钮。这将允许您将您的预设发布到社区。
在 https://lm-studio.cn/login 获取您的用户名并开始分享您的预设!您无需账户即可下载预设,仅在发布时需要。
此功能目前处于预览阶段,我们正在征集所有人的反馈。如果您有任何建议或问题,请告诉我们:[email protected]。
**Build 11** - Llama 4 prompt template fixes to improve tool call reliability **Build 10** - Preview: Add the ability to publish and download presets from the community (head to Settings to enable) - Add `tool_choice` parameter support to OpenAI-like REST API - `"tool_choice": "none"` - Model will not call any tools - `"tool_choice": "auto"` - Model decides whether or not to call tools - `"tool_choice": "required"` - Forces model to only output tools (llama.cpp engines only) - Added an option to log each generated fragment to API server logs - Fixed the erroneous "Client disconnected. Stopping generation..." message when using the API server - Fixed a front end error when using the preset selection in the developer page - Fix for GLM prompt template - Fix Llama 4 prompt template bug "Unknown ArrayValue filter: trim" when using tools **Build 9** - Fix: Ensure OpenAI-like REST API chunk "finish_reason" is "tool_calls" when appropriate - Fixes "N/A" token count in system prompt editor when model is loaded **Build 8** - Experimental feature behind flag in Chat Appearance, smooth autoscroll latest chat message to top **Build 7** - [CUDA12] Fix incorrect VRAM capacity showing on Hardware page on some machines - Fix Llama 4 crashes when using GPU settings: priority order, limit offload to dedicated GPU memory - [GGUF] Fixed bug where top-k sampling parameter could not be set to 0 - [MLX] Removed the checkbox from top-k sampling parameter **Build 6** - Chat terminal message styling updates - Conversation font scale introduced in chat Appearance tab - Conversation font weight introduced in chat Appearance tab **Build 5** - [CUDA] CUDA 12 engine auto-upgrade if driver is compatible and *any* GPU is 50-series and above - [MLX] Add top-k sampler **Build 4** - New: CUDA 12 support in LM Studio's llama.cpp engines (Windows/Linux) - Dramatically faster first-time model load times on RTX 50-series GPUs - Initial compatibility requirements: - NVIDIA driver version: - Windows: 551.61 or newer - Linux: 550.54.14 or newer - At least one GPU of the following: - GeForce RTX 5090, RTX 5080, RTX 5070 Ti, or RTX 5070 - Datacenter GPU with Hopper or Blackwell micro-architecture - App will automatically upgrade you if your machine is compatible - Check your system compatibility by running `nvidia-smi` in terminal - Added support for sorting models by last load time in the model loader (the new default) - Adds new system prompt editor UI - Adds a toggle to hide/show advanced settings while loading models - Fix Cogito jinja parsing error "Unexpected character: ~" - Fixes downloads pane resize bug **Build 3** - Fixed lms CLI sometimes not initializing properly on MacOS **Build 2** - Fixes bug where the chat sidebar labels would overflow - Fixes bug where the downloads pane would open at wrong position **Build 1** - UI touchups: - New and improved chat input box - Neatened up app action bar layout - Slimmer app sidebar - Chat sidebar segments: Context and Model