Перейти к основному содержанию
Venice AI предоставляет ориентированный на приватность AI-инференс с поддержкой моделей без цензуры и доступом к крупным проприетарным моделям через их анонимизирующий прокси. Весь инференс приватен по умолчанию — без обучения на ваших данных и без логирования.

Зачем Venice в OpenClaw

  • Приватный инференс для open-source моделей (без логирования).
  • Модели без цензуры, когда они нужны.
  • Анонимизированный доступ к проприетарным моделям (Opus/GPT/Gemini), когда важно качество.
  • OpenAI-совместимые эндпоинты /v1.

Режимы приватности

Venice предлагает два уровня приватности — это важно понимать при выборе модели:
РежимОписаниеМодели
ПриватныйПолностью приватный. Промпты/ответы никогда не сохраняются и не логируются. Эфемерный.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
АнонимныйПроксируется через Venice с удалением метаданных. Базовый провайдер (OpenAI, Anthropic, Google, xAI) видит анонимизированные запросы.Claude, GPT, Gemini, Grok
Анонимные модели не являются полностью приватными. Venice удаляет метаданные перед пересылкой, но базовый провайдер (OpenAI, Anthropic, Google, xAI) все равно обрабатывает запрос. Выбирайте приватные модели, когда требуется полная приватность.

Возможности

  • Ориентация на приватность: выбирайте между режимами «приватный» (полностью приватный) и «анонимный» (через прокси)
  • Модели без цензуры: доступ к моделям без ограничений на контент
  • Доступ к ведущим моделям: используйте Claude, GPT, Gemini и Grok через анонимизирующий прокси Venice
  • OpenAI-совместимый API: стандартные эндпоинты /v1 для простой интеграции
  • Потоковая передача: поддерживается на всех моделях
  • Вызов функций: поддерживается на выбранных моделях (проверьте возможности модели)
  • Зрение: поддерживается на моделях с возможностью зрения
  • Без жестких лимитов частоты: при экстремальном использовании может применяться ограничение по принципу добросовестного использования

Начало работы

1

Install the plugin

openclaw plugins install @openclaw/venice-provider
2

Get your API key

  1. Зарегистрируйтесь на venice.ai
  2. Перейдите в Settings > API Keys > Create new key
  3. Скопируйте свой API-ключ (формат: vapi_xxxxxxxxxxxx)
3

Configure OpenClaw

Выберите предпочитаемый способ настройки:
4

Verify setup

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Выбор модели

После настройки OpenClaw показывает все доступные модели Venice. Выбирайте исходя из своих потребностей:
  • Модель по умолчанию: venice/kimi-k2-5 для сильного приватного рассуждения и зрения.
  • Вариант с высокой производительностью: venice/claude-opus-4-6 для самого сильного анонимного пути Venice.
  • Приватность: выбирайте «приватные» модели для полностью приватного инференса.
  • Возможности: выбирайте «анонимные» модели, чтобы получать доступ к Claude, GPT, Gemini через прокси Venice.
Изменить модель по умолчанию можно в любое время:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Показать все доступные модели:
openclaw models list --all --provider venice
Также можно запустить openclaw configure, выбрать Model/auth, а затем Venice AI.
Используйте таблицу ниже, чтобы выбрать подходящую модель для вашего сценария.
Сценарий использованияРекомендуемая модельПочему
Обычный чат (по умолчанию)kimi-k2-5Сильное приватное рассуждение и зрение
Лучшее общее качествоclaude-opus-4-6Самый сильный анонимный вариант Venice
Приватность + кодингqwen3-coder-480b-a35b-instructПриватная модель для кодинга с большим контекстом
Приватное зрениеkimi-k2-5Поддержка зрения без выхода из приватного режима
Быстро + дешевоqwen3-4bЛегковесная модель рассуждения
Сложные приватные задачиdeepseek-v3.2Сильное рассуждение, но без поддержки инструментов Venice
Без цензурыvenice-uncensoredБез ограничений на контент

Поведение воспроизведения DeepSeek V4

Если Venice предоставляет модели DeepSeek V4, такие как venice/deepseek-v4-pro или venice/deepseek-v4-flash, OpenClaw заполняет обязательный плейсхолдер воспроизведения reasoning_content DeepSeek V4 в сообщениях ассистента, когда прокси его опускает. Venice отклоняет нативный управляющий параметр верхнего уровня thinking DeepSeek, поэтому OpenClaw держит это специфичное для провайдера исправление воспроизведения отдельно от нативных элементов управления мышлением провайдера DeepSeek.

Встроенный каталог (всего 41)

ID моделиНазваниеКонтекстВозможности
kimi-k2-5Kimi K2.5256kПо умолчанию, рассуждение, зрение
kimi-k2-thinkingKimi K2 Thinking256kРассуждение
llama-3.3-70bLlama 3.3 70B128kОбщее назначение
llama-3.2-3bLlama 3.2 3B128kОбщее назначение
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kОбщее назначение, инструменты отключены
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kРассуждение
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kОбщее назначение
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kКодинг
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kКодинг
qwen3-5-35b-a3bQwen3.5 35B A3B256kРассуждение, зрение
qwen3-next-80bQwen3 Next 80B256kОбщее назначение
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kЗрение
qwen3-4bVenice Small (Qwen3 4B)32kБыстрая, рассуждение
deepseek-v3.2DeepSeek V3.2160kРассуждение, инструменты отключены
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kБез цензуры, инструменты отключены
mistral-31-24bVenice Medium (Mistral)128kЗрение
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kЗрение
openai-gpt-oss-120bOpenAI GPT OSS 120B128kОбщее назначение
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kОбщее назначение
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kРассуждение
zai-org-glm-4.6GLM 4.6198kОбщее назначение
zai-org-glm-4.7GLM 4.7198kРассуждение
zai-org-glm-4.7-flashGLM 4.7 Flash128kРассуждение
zai-org-glm-5GLM 5198kРассуждение
minimax-m21MiniMax M2.1198kРассуждение
minimax-m25MiniMax M2.5198kРассуждение
ID моделиНазваниеКонтекстВозможности
claude-opus-4-6Claude Opus 4.6 (через Venice)1MРассуждение, зрение
claude-sonnet-4-6Claude Sonnet 4.6 (через Venice)1MРассуждение, зрение
openai-gpt-54GPT-5.4 (через Venice)1MРассуждение, зрение
openai-gpt-53-codexGPT-5.3 Codex (через Venice)400kРассуждение, зрение, кодинг
openai-gpt-52GPT-5.2 (через Venice)256kРассуждение
openai-gpt-52-codexGPT-5.2 Codex (через Venice)256kРассуждение, зрение, кодинг
openai-gpt-4o-2024-11-20GPT-4o (через Venice)128kЗрение
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (через Venice)128kЗрение
gemini-3-1-pro-previewGemini 3.1 Pro (через Venice)1MРассуждение, зрение
gemini-3-pro-previewGemini 3 Pro (через Venice)198kРассуждение, зрение
gemini-3-flash-previewGemini 3 Flash (через Venice)256kРассуждение, зрение
grok-41-fastGrok 4.1 Fast (через Venice)1MРассуждение, зрение

Обнаружение моделей

OpenClaw поставляет основанный на манифесте начальный каталог Venice для списка моделей в режиме только чтения. Обновление во время выполнения по-прежнему может обнаруживать модели из API Venice и откатывается к каталогу манифеста, если API недоступен. Эндпоинт /models является публичным (для списка авторизация не нужна), но для инференса требуется действительный API-ключ.

Потоковая передача и поддержка инструментов

ВозможностьПоддержка
Потоковая передачаВсе модели
Вызов функцийБольшинство моделей (проверьте supportsFunctionCalling в API)
Зрение/изображенияМодели, помеченные функцией “Vision”
Режим JSONПоддерживается через response_format

Цены

Venice использует систему на основе кредитов. Актуальные тарифы см. на venice.ai/pricing:
  • Приватные модели: как правило, ниже стоимость
  • Анонимизированные модели: сопоставимо с ценами прямого API + небольшая комиссия Venice

Venice (анонимизированный) и прямой API

АспектVenice (анонимизированный)Прямой API
КонфиденциальностьМетаданные удалены, анонимизированоПривязано к вашей учетной записи
Задержка+10-50 мс (прокси)Напрямую
ВозможностиПоддерживается большинство функцийПолный набор функций
ОплатаКредиты VeniceОплата у провайдера

Примеры использования

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Устранение неполадок

echo $VENICE_API_KEY
openclaw models list | grep venice
Убедитесь, что ключ начинается с vapi_.
Каталог моделей Venice обновляется динамически. Выполните openclaw models list, чтобы увидеть модели, доступные сейчас. Некоторые модели могут быть временно недоступны.
API Venice находится по адресу https://api.venice.ai/api/v1. Убедитесь, что ваша сеть разрешает HTTPS-подключения.
Дополнительная помощь: Устранение неполадок и FAQ.

Расширенная конфигурация

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Связанные материалы

Model selection

Выбор провайдеров, ссылок на модели и поведения при отказе.

Venice AI

Главная страница Venice AI и регистрация учетной записи.

API documentation

Справочник Venice API и документация для разработчиков.

Pricing

Актуальные кредитные тарифы и планы Venice.