5.5K 下载量

nousresearch/
hermes-4-70b
70B
llama

Nous Research 基于 Llama-3.1-70B 的混合模式推理模型

具使用进行训练

推理

上次更新13天前
README

Hermes 4

Hermes 4 70B 是 Nous Research 基于 Llama-3.1-70B 的混合模式推理模型。与 Hermes 3 相比,该模型增强了数学和科学推理能力,提供了卓越的指令遵循能力,以及精确的符合模式的输出,同时具备细致的角色扮演和创意写作能力。

该模型支持131k个token的上下文长度。

与 Hermes 3 相比有什么新变化

  • 后训练语料库:数据集规模从 1M 样本和 1.2B token 大幅增加到 约 5M 样本 / 约 60B token,融合了推理和非推理数据。
  • 混合推理模式,当模型决定进行推理时,会显式使用 <think>…</think> 片段,并且在您需要更快响应时提供选项。
  • 推理质量上乘,表达力强,改进了数学、代码、STEM、逻辑,甚至创意写作和主观响应。
  • 模式依从性 & 结构化输出:经过训练,可根据给定模式生成有效的 JSON,并修复格式错误的 objeact。
  • 更易于引导和对齐:可引导性方面有极大改进,特别是拒绝率降低。
自定义字段

模型作者定义的特殊功能

启用思考

: 布尔值

(默认=假)

控制模型在回复前是否会进行思考

保留 CoT

: 布尔值

(默认=假)

在后续请求中包含思维链

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

温度
0.6
Top K 采样
20
Top P 采样
0.95