•
llama
Meta Llama 系列的最新版本,Llama 3.1 依然是多面手,并在某些方面表现出色,现在支持 8 种语言,最多可处理 128k tokens。
模型信息
模型
Meta Llama 3.1 8B
作者
Meta
架构
llama
参数
8B
格式
gguf
磁盘大小
大约 4.92 GB
使用 lms
— LM Studio 的开发者 CLI 下载模型。
lms get llama-3.1-8b
curl https://127.0.0.1:1234/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.1-8b",
"messages": [
{ "role": "system", "content": "Always answer in rhymes." },
{ "role": "user", "content": "Introduce yourself." }
],
"temperature": 0.7,
"max_tokens": -1,
"stream": true
}'
lms log stream
以查看你的提示是如何发送到 LLM 的。lmstudio.js
- LM Studio SDK 文档 (TypeScript)lms log stream
- 流式传输服务器日志lms
- LM Studio 的 CLI 文档