LM Studio 0.3.2

2024-08-27

版本说明

0.3.2 版本更新内容

  • 新功能:可以将模型置顶的功能回归了!
    • 在“我的模型”中右键点击一个模型并选择“置顶”,即可将其固定在列表顶部。
  • 聊天迁移对话框现已出现在聊天侧边栏中。
    • 您可以从那里迁移 0.3.0 之前版本的聊天记录。
    • 自 v0.3.1 起,系统提示词现在也会一并迁移。
    • 您的旧聊天记录不会被删除。
  • 如果没有下载任务,下载按钮上不再显示带有数字的徽章。
  • 在“发现”选项卡中添加了收起常见问题解答(FAQ)侧边栏的按钮。
  • 将默认上下文大小从 8K 减小到 4K Token,以缓解内存不足(Out of Memory)问题。
    • 您仍然可以在模型加载设置中配置所需的任何上下文大小。
  • 在模型加载设置中的 Flash Attention 选项旁添加了警告。
    • Flash Attention 仍处于实验阶段,可能并不适用于所有模型。
  • 将内置的 llama.cpp 引擎更新至 3246fe84d78c8ccccd4291132809236ef477e9ea (8月27日)

错误修复

  • Bug 修复:“我的模型”中,当模型由多个分卷文件组成时,模型大小聚合统计不正确。
  • Bug 修复:(Linux 系统)由于缺少内置嵌入模型导致 RAG 功能失败(已修复)。
  • Bug 修复:Flash Attention - KV 缓存量化默认恢复为 FP16。
    • 在 0.3.0 版本中,K 和 V 均被设置为 Q8,这在某些情况下引入了较大的延迟。
      • 与 0.3.1 相比,您可能会注意到开启 FA 时内存占用有所增加,但这与 0.2.31 版本持平。
  • Bug 修复:在某些配置下,应用会在启动时卡住(修复 + 缓解措施)。
  • Bug 修复:修复了下载面板被拖动到应用顶部栏上方的问题。
  • Bug 修复:修复了内置代码片段(服务器选项卡)中的拼写错误。

更多