Llama 3.1 8B 指令微调 4bit

mlx-community

llama

Meta Llama 3.1 系列多语言大型语言模型 (LLM) 包含预训练和指令微调的生成模型,模型大小包括 8B、70B 和 405B(文本输入/文本输出)

模型信息

模型

Llama 3.1 8B 指令微调 4bit

作者

mlx-community

架构

llama

参数

8B

格式

safetensors

磁盘大小

4.53 GB

下载和运行Llama 3.1 8B 指令微调 4bit

在 LM Studio 中打开以查看下载选项

使用终端下载 llama-3.1-8b

使用 lms(LM Studio 的开发者 CLI)下载模型。

lms get llama-3.1-8b
如果您还没有安装,请运行 npx lmstudio install-cli

在您的代码中调用 llama-3.1-8b

curl https://127.0.0.1:1234/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b",
    "messages": [
      { "role": "system", "content": "Always answer in rhymes." },
      { "role": "user", "content": "Introduce yourself." }
    ],
    "temperature": 0.7,
    "max_tokens": -1,
    "stream": true
  }'

下一步:构建!🔨

了解更多