Hermes 4

Hermes 4 70B 是 Nous Research 基于 Llama-3.1-70B 的混合模式推理模型。与 Hermes 3 相比，该模型增强了数学和科学推理能力，提供了卓越的指令遵循能力，以及精确的符合模式的输出，同时具备细致的角色扮演和创意写作能力。

该模型支持131k个token的上下文长度。

与 Hermes 3 相比有什么新变化

后训练语料库：数据集规模从 1M 样本和 1.2B token 大幅增加到 约 5M 样本 / 约 60B token，融合了推理和非推理数据。
混合推理模式，当模型决定进行推理时，会显式使用 <think>…</think> 片段，并且在您需要更快响应时提供选项。
推理质量上乘，表达力强，改进了数学、代码、STEM、逻辑，甚至创意写作和主观响应。
模式依从性 & 结构化输出：经过训练，可根据给定模式生成有效的 JSON，并修复格式错误的 objeact。
更易于引导和对齐：可引导性方面有极大改进，特别是拒绝率降低。