Venice AI

Venice AI 提供注重隐私的推理服务：开放模型运行时不记录日志，并且提供对 Claude、GPT、Gemini 和 Grok 的匿名化代理访问。所有端点都兼容 OpenAI（/v1）。

隐私模式

模式	行为	Models
私有	提示词/响应永不存储或记录。临时存在。	Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored 等。
匿名化	通过 Venice 代理转发，并在转发前移除元数据。	Claude, GPT, Gemini, Grok

匿名化模型并非完全私有。Venice 会在转发前移除元数据，但底层提供商（OpenAI、Anthropic、Google、xAI）仍会处理请求。需要完整隐私时，请使用私有模型。

入门指南

安装插件

openclaw plugins install @openclaw/venice-provider

获取你的 API key

在 venice.ai 注册
前往 Settings > API Keys > Create new key
复制你的 API key（格式：vapi_xxxxxxxxxxxx）

配置 OpenClaw

交互式（推荐）
环境变量
非交互式

openclaw onboard --auth-choice venice-api-key

提示输入 API key（或复用现有的 VENICE_API_KEY），列出可用的 Venice 模型，并设置你的默认模型。

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

验证设置

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

模型选择

默认：venice/kimi-k2-5（私有、推理、视觉）。
最强匿名化选项：venice/claude-opus-4-6。

openclaw models set venice/kimi-k2-5
openclaw models list --all --provider venice

你也可以运行 openclaw configure，并选择 Model/auth provider > Venice AI。

用例	模型	原因
通用聊天（默认）	`kimi-k2-5`	强大的私有推理能力，并支持视觉
最佳整体质量	`claude-opus-4-6`	Venice 最强的匿名化选项
隐私 + 编码	`qwen3-coder-480b-a35b-instruct`	具备大上下文的私有编码模型
快速 + 低成本	`qwen3-4b`	轻量推理模型
复杂私有任务	`deepseek-v3.2`	强推理能力；工具调用已禁用
无内容限制	`venice-uncensored`	无内容限制

内置目录（38 个模型）

私有模型（26）— 完全私有，不记录日志

模型 ID	名称	上下文	说明
`kimi-k2-5`	Kimi K2.5	256k	默认、推理、视觉
`kimi-k2-thinking`	Kimi K2 Thinking	256k	推理
`llama-3.3-70b`	Llama 3.3 70B	128k	通用
`llama-3.2-3b`	Llama 3.2 3B	128k	通用
`hermes-3-llama-3.1-405b`	Hermes 3 Llama 3.1 405B	128k	通用，工具已禁用
`qwen3-235b-a22b-thinking-2507`	Qwen3 235B Thinking	128k	推理
`qwen3-235b-a22b-instruct-2507`	Qwen3 235B Instruct	128k	通用
`qwen3-coder-480b-a35b-instruct`	Qwen3 Coder 480B	256k	编码
`qwen3-coder-480b-a35b-instruct-turbo`	Qwen3 Coder 480B Turbo	256k	编码
`qwen3-5-35b-a3b`	Qwen3.5 35B A3B	256k	推理、视觉
`qwen3-next-80b`	Qwen3 Next 80B	256k	通用
`qwen3-vl-235b-a22b`	Qwen3 VL 235B（视觉）	256k	视觉
`qwen3-4b`	Venice Small (Qwen3 4B)	32k	快速、推理
`deepseek-v3.2`	DeepSeek V3.2	160k	推理，工具已禁用
`venice-uncensored`	Venice Uncensored (Dolphin-Mistral)	32k	无内容限制，工具已禁用
`mistral-31-24b`	Venice Medium (Mistral)	128k	视觉
`google-gemma-3-27b-it`	Google Gemma 3 27B Instruct	198k	视觉
`openai-gpt-oss-120b`	OpenAI GPT OSS 120B	128k	通用
`nvidia-nemotron-3-nano-30b-a3b`	NVIDIA Nemotron 3 Nano 30B	128k	通用
`olafangensan-glm-4.7-flash-heretic`	GLM 4.7 Flash Heretic	128k	推理
`zai-org-glm-4.6`	GLM 4.6	198k	通用
`zai-org-glm-4.7`	GLM 4.7	198k	推理
`zai-org-glm-4.7-flash`	GLM 4.7 Flash	128k	推理
`zai-org-glm-5`	GLM 5	198k	推理
`minimax-m21`	MiniMax M2.1	198k	推理
`minimax-m25`	MiniMax M2.5	198k	推理

匿名化模型（12）— 通过 Venice 代理

模型 ID	名称	上下文	说明
`claude-opus-4-6`	Claude Opus 4.6（通过 Venice）	1M	推理、视觉
`claude-sonnet-4-6`	Claude Sonnet 4.6（通过 Venice）	1M	推理、视觉
`openai-gpt-54`	GPT-5.4（通过 Venice）	1M	推理、视觉
`openai-gpt-53-codex`	GPT-5.3 Codex（通过 Venice）	400k	推理、视觉、编码
`openai-gpt-52`	GPT-5.2（通过 Venice）	256k	推理
`openai-gpt-52-codex`	GPT-5.2 Codex（通过 Venice）	256k	推理、视觉、编码
`openai-gpt-4o-2024-11-20`	GPT-4o（通过 Venice）	128k	视觉
`openai-gpt-4o-mini-2024-07-18`	GPT-4o Mini（通过 Venice）	128k	视觉
`gemini-3-1-pro-preview`	Gemini 3.1 Pro（通过 Venice）	1M	推理、视觉
`gemini-3-pro-preview`	Gemini 3 Pro（通过 Venice）	198k	推理、视觉
`gemini-3-flash-preview`	Gemini 3 Flash（通过 Venice）	256k	推理、视觉
`grok-41-fast`	Grok 4.1 Fast（通过 Venice）	1M	推理、视觉

由 Grok 支持的 Venice 模型（grok-41-fast 和类似模型）会获得与原生 xAI provider 相同的工具 schema 兼容补丁，因为它们共享相同的上游工具调用格式。

模型发现

上面的内置目录是一个由清单支持的种子列表。运行时，OpenClaw 会从 Venice /models API 刷新它；如果 API 不可访问，则回退到种子列表。/models 端点是公开的（列出模型不需要认证），但推理需要有效的 API key。

DeepSeek V4 重放行为

如果 Venice 暴露了 DeepSeek V4 模型，例如 deepseek-v4-pro 或 deepseek-v4-flash，当 Venice 省略助手消息中必需的 reasoning_content 重放字段时，OpenClaw 会填充该字段，并从请求载荷中移除 thinking/ reasoning/reasoning_effort（Venice 会拒绝这些模型上的 DeepSeek 原生 thinking 控制）。此重放修复独立于原生 DeepSeek provider 自身的 thinking 控制。

流式传输和工具支持

功能	支持
流式传输	所有模型
函数调用	大多数模型；按模型在上文标注处禁用
视觉/图像	上文标记为“视觉”的模型
JSON 模式	通过 `response_format`

定价

Venice 使用基于积分的系统。匿名化模型的成本大致等同于直接 API 定价加上一小笔 Venice 费用。请参阅 venice.ai/pricing 了解当前价格。

使用示例

# Default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

故障排查

API key 未被识别

echo $VENICE_API_KEY
openclaw models list | grep venice

确认 key 以 vapi_ 开头。

模型不可用

运行 openclaw models list --all --provider venice 查看当前可用的模型；随着 Venice 添加或停用模型，目录会发生变化。

连接问题

Venice API 位于 https://api.venice.ai/api/v1。确认你的网络允许通过 HTTPS 访问该主机。

更多帮助：故障排查和常见问题。

高级配置

Config file example

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Model selection

选择提供商、模型引用和故障转移行为。

Venice AI 主页和账户注册。

API documentation

Venice API 参考和开发者文档。

Pricing

当前 Venice 积分费率和套餐。

​隐私模式

​入门指南

​模型选择

​内置目录（38 个模型）

​模型发现

​DeepSeek V4 重放行为

​流式传输和工具支持

​定价

​使用示例

​故障排查

​高级配置

​相关内容

Model selection

Venice AI

API documentation

Pricing

隐私模式

入门指南

模型选择

内置目录（38 个模型）

模型发现

DeepSeek V4 重放行为

流式传输和工具支持

定价

使用示例

故障排查

高级配置

相关内容