Hugging Face Inference Providers 通过单一路由器 API 提供兼容 OpenAI 的聊天补全能力。你只需一个令牌,即可访问许多模型(DeepSeek、Llama 等)。OpenClaw 使用的是兼容 OpenAI 的端点(仅聊天补全);对于文生图、embeddings 或语音,请直接使用 HF inference clients。Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- 提供商:
huggingface - 认证:
HUGGINGFACE_HUB_TOKEN或HF_TOKEN(需为带有 Make calls to Inference Providers 权限的细粒度令牌) - API:兼容 OpenAI(
https://router.huggingface.co/v1) - 计费:单个 HF 令牌;定价 跟随 provider 费率,并提供免费层。
入门指南
创建细粒度令牌
前往 Hugging Face Settings Tokens 并创建一个新的细粒度令牌。
选择默认模型
在 Default Hugging Face model 下拉框中,选择你想使用的模型。当你持有有效令牌时,列表会从 Inference API 加载;否则会显示一个内置列表。你的选择会保存为默认模型。你也可以稍后在配置中设置或更改默认模型:
非交互式设置
huggingface/deepseek-ai/DeepSeek-R1 设置为默认模型。
模型 ID
模型引用使用huggingface/<org>/<model> 形式(Hub 风格 ID)。下表来自 GET https://router.huggingface.co/v1/models;你的目录中可能包含更多模型。
| 模型 | 引用(请加上 huggingface/ 前缀) |
|---|---|
| DeepSeek R1 | deepseek-ai/DeepSeek-R1 |
| DeepSeek V3.2 | deepseek-ai/DeepSeek-V3.2 |
| Qwen3 8B | Qwen/Qwen3-8B |
| Qwen2.5 7B Instruct | Qwen/Qwen2.5-7B-Instruct |
| Qwen3 32B | Qwen/Qwen3-32B |
| Llama 3.3 70B Instruct | meta-llama/Llama-3.3-70B-Instruct |
| Llama 3.1 8B Instruct | meta-llama/Llama-3.1-8B-Instruct |
| GPT-OSS 120B | openai/gpt-oss-120b |
| GLM 4.7 | zai-org/GLM-4.7 |
| Kimi K2.5 | moonshotai/Kimi-K2.5 |
高级配置
模型发现与新手引导下拉框
模型发现与新手引导下拉框
模型名称、别名和策略后缀
模型名称、别名和策略后缀
- 来自 API 的名称: 当 API 返回
name、title或display_name时,模型显示名称会从 GET /v1/models 中提取;否则会根据模型 id 推导(例如deepseek-ai/DeepSeek-R1会变成 “DeepSeek R1”)。 - 覆盖显示名称: 你可以在配置中为每个模型设置自定义标签,以便它在 CLI 和 UI 中按你想要的方式显示:
-
策略后缀: OpenClaw 的内置 Hugging Face 文档和辅助工具目前将以下两个后缀视为内置策略变体:
:fastest—— 最高吞吐量。:cheapest—— 每输出 token 成本最低。
models.providers.huggingface.models,或者在model.primary中使用带后缀的形式。你也可以在 Inference Provider settings 中设置默认 provider 顺序(无后缀 = 使用该顺序)。 -
配置合并:
models.providers.huggingface.models中已有的条目(例如在models.json中)在配置合并时会被保留。因此你在那里设置的任何自定义name、alias或模型选项都会保留下来。
环境变量和守护进程设置
环境变量和守护进程设置
如果 Gateway 网关以守护进程(launchd/systemd)方式运行,请确保
HUGGINGFACE_HUB_TOKEN 或 HF_TOKEN 可供该进程访问(例如放在 ~/.openclaw/.env 中,或通过 env.shellEnv 提供)。OpenClaw 同时接受
HUGGINGFACE_HUB_TOKEN 和 HF_TOKEN 作为环境变量别名。两者任意一个都可以;如果同时设置,则 HUGGINGFACE_HUB_TOKEN 优先。配置:DeepSeek R1 + Qwen 回退
配置:DeepSeek R1 + Qwen 回退
配置:带 cheapest 和 fastest 变体的 Qwen
配置:带 cheapest 和 fastest 变体的 Qwen
配置:带别名的 DeepSeek + Llama + GPT-OSS
配置:带别名的 DeepSeek + Llama + GPT-OSS
配置:带策略后缀的多个 Qwen 和 DeepSeek
配置:带策略后缀的多个 Qwen 和 DeepSeek
相关内容
模型选择
所有提供商、模型引用和故障转移行为的概览。
模型选择
如何选择和配置模型。
Inference Providers 文档
Hugging Face Inference Providers 官方文档。
配置
完整配置参考。