Чат-завершения OpenAI

OpenClaw Gateway может обслуживать небольшой OpenAI-совместимый эндпоинт Chat Completions. Этот эндпоинт по умолчанию отключен. Сначала включите его в конфигурации.

POST /v1/chat/completions
Тот же порт, что и у Gateway (мультиплексирование WS + HTTP): http://<gateway-host>:<port>/v1/chat/completions

Когда OpenAI-совместимая HTTP-поверхность Gateway включена, она также обслуживает:

GET /v1/models
GET /v1/models/{id}
POST /v1/embeddings
POST /v1/responses

Под капотом запросы выполняются как обычный запуск агента Gateway (тот же путь кода, что и openclaw agent), поэтому маршрутизация, разрешения и конфигурация соответствуют вашему Gateway.

Аутентификация

Использует конфигурацию аутентификации Gateway. Распространенные пути HTTP-аутентификации:

аутентификация с общим секретом (gateway.auth.mode="token" или "password"): Authorization: Bearer <token-or-password>
доверенная HTTP-аутентификация с идентичностью (gateway.auth.mode="trusted-proxy"): направьте через настроенный прокси с поддержкой идентичности и позвольте ему внедрить необходимые заголовки идентичности
открытая аутентификация для приватного входа (gateway.auth.mode="none"): заголовок аутентификации не требуется

Примечания:

Когда gateway.auth.mode="token", используйте gateway.auth.token (или OPENCLAW_GATEWAY_TOKEN).
Когда gateway.auth.mode="password", используйте gateway.auth.password (или OPENCLAW_GATEWAY_PASSWORD).
Когда gateway.auth.mode="trusted-proxy", HTTP-запрос должен поступать из настроенного доверенного источника прокси; same-host loopback proxies требуют явного gateway.auth.trustedProxy.allowLoopback = true.
Внутренние вызывающие стороны на том же хосте, которые обходят прокси, могут использовать gateway.auth.password / OPENCLAW_GATEWAY_PASSWORD как локальный прямой резервный вариант. Любые свидетельства в заголовках Forwarded, X-Forwarded-* или X-Real-IP вместо этого оставляют запрос на пути trusted-proxy.
Если настроен gateway.auth.rateLimit и происходит слишком много неудачных попыток аутентификации, эндпоинт возвращает 429 с Retry-After.

Граница безопасности (важно)

Считайте этот эндпоинт поверхностью с полным операторским доступом для экземпляра Gateway.

HTTP bearer auth здесь не является узкой моделью областей действия для каждого пользователя.
Действительный токен/пароль Gateway для этого эндпоинта следует считать учетными данными владельца/оператора.
Запросы выполняются через тот же агентский путь control-plane, что и доверенные операторские действия.
На этом эндпоинте нет отдельной инструментальной границы для не-владельцев/отдельных пользователей; как только вызывающая сторона проходит здесь аутентификацию Gateway, OpenClaw считает эту вызывающую сторону доверенным оператором для этого Gateway.
Для режимов аутентификации с общим секретом (token и password) эндпоинт восстанавливает обычные полные операторские значения по умолчанию, даже если вызывающая сторона отправляет более узкий заголовок x-openclaw-scopes.
Доверенные HTTP-режимы с идентичностью (например, аутентификация через доверенный прокси или gateway.auth.mode="none") учитывают x-openclaw-scopes, когда он присутствует, и иначе возвращаются к обычному набору операторских областей по умолчанию.
Если политика целевого агента разрешает чувствительные инструменты, этот эндпоинт может их использовать.
Держите этот эндпоинт только на loopback/tailnet/private ingress; не открывайте его напрямую в публичный интернет.

Матрица аутентификации:

gateway.auth.mode="token" или "password" + Authorization: Bearer ...
- доказывает владение общим операторским секретом Gateway
- игнорирует более узкий x-openclaw-scopes
- восстанавливает полный набор операторских областей по умолчанию: operator.admin, operator.approvals, operator.pairing, operator.read, operator.talk.secrets, operator.write
- считает ходы чата на этом эндпоинте ходами от владельца-отправителя
доверенные HTTP-режимы с идентичностью (например, аутентификация через доверенный прокси или gateway.auth.mode="none" на приватном входе)
- аутентифицируют некоторую внешнюю доверенную идентичность или границу развертывания
- учитывают x-openclaw-scopes, когда заголовок присутствует
- возвращаются к обычному набору операторских областей по умолчанию, когда заголовок отсутствует
- теряют семантику владельца только когда вызывающая сторона явно сужает области и опускает operator.admin
- требуют operator.admin для элементов управления запросом уровня владельца, таких как x-openclaw-model

См. Безопасность и Удаленный доступ.

Когда использовать этот эндпоинт

Используйте /v1/chat/completions, когда вы интегрируете инструменты или доверенный backend на стороне приложения с существующим Gateway и можете безопасно хранить операторские учетные данные Gateway.

Предпочитайте это добавлению нового встроенного канала, когда ваша интеграция является просто еще одной операторской/клиентской поверхностью для того же Gateway.
Для нативных мобильных клиентов, которые подключаются напрямую к удаленному Gateway, предпочитайте WebChat или Gateway Protocol и реализуйте поток bootstrap/device-token для сопряженного устройства, чтобы устройству не требовался общий HTTP-токен/пароль.
Вместо этого создайте channel plugin, когда интегрируете внешнюю сеть обмена сообщениями с собственными пользователями, комнатами, доставкой Webhook или исходящим транспортом. См. Создание plugins.

Контракт модели с приоритетом агента

OpenClaw трактует поле OpenAI model как цель агента, а не как сырой id модели провайдера.

model: "openclaw" направляет к настроенному агенту по умолчанию.
model: "openclaw/default" также направляет к настроенному агенту по умолчанию.
model: "openclaw/<agentId>" направляет к конкретному агенту.

Необязательные заголовки запроса:

x-openclaw-model: <provider/model-or-bare-id> переопределяет backend-модель для выбранного агента. Вызывающие стороны с bearer-токеном общего секрета могут использовать этот заголовок. Вызывающим сторонам с идентичностью, например trusted-proxy или запросам приватного входа без аутентификации с x-openclaw-scopes, нужен operator.admin; вызывающие стороны только с правом записи получают 403 missing scope: operator.admin.
x-openclaw-agent-id: <agentId> остается поддерживаемым как переопределение для совместимости.
x-openclaw-session-key: <sessionKey> явно управляет маршрутизацией сессии. Значение не должно использовать зарезервированные внутренние пространства имен сессий, такие как subagent:, cron: или acp:; такие запросы отклоняются с 400 invalid_request_error.
x-openclaw-message-channel: <channel> задает синтетический контекст входного канала для подсказок и политик, учитывающих каналы.

Псевдонимы совместимости, которые все еще принимаются:

model: "openclaw:<agentId>"
model: "agent:<agentId>"

Включение эндпоинта

Установите gateway.http.endpoints.chatCompletions.enabled в true:

{
  gateway: {
    http: {
      endpoints: {
        chatCompletions: { enabled: true },
      },
    },
  },
}

Отключение эндпоинта

Установите gateway.http.endpoints.chatCompletions.enabled в false:

{
  gateway: {
    http: {
      endpoints: {
        chatCompletions: { enabled: false },
      },
    },
  },
}

Поведение сессии

По умолчанию эндпоинт не хранит состояние между запросами (при каждом вызове генерируется новый ключ сессии). Если запрос включает строку OpenAI user, Gateway выводит из нее стабильный ключ сессии, поэтому повторные вызовы могут разделять сессию агента. Для пользовательских приложений самый безопасный вариант по умолчанию — повторно использовать одно и то же значение user для каждой ветки разговора. Избегайте идентификаторов уровня аккаунта, если явно не хотите, чтобы несколько разговоров или устройств разделяли одну сессию OpenClaw. Используйте x-openclaw-session-key только когда вам нужен явный контроль маршрутизации между несколькими клиентами или ветками, и выбирайте ключи, принадлежащие приложению, которые не начинаются с зарезервированных внутренних пространств имен, таких как subagent:, cron: или acp:.

Почему эта поверхность важна

Это самый эффективный набор совместимости для self-hosted фронтендов и инструментов:

Большинство установок Open WebUI, LobeChat и LibreChat ожидают /v1/models.
Многие RAG-системы ожидают /v1/embeddings.
Существующие клиенты чата OpenAI обычно могут начать с /v1/chat/completions.
Более agent-native клиенты все чаще предпочитают /v1/responses.

Список моделей и маршрутизация агентов

Что возвращает `/v1/models`?

Список целей агентов OpenClaw.Возвращаемые id — это записи openclaw, openclaw/default и openclaw/<agentId>. Используйте их напрямую как значения OpenAI model.

`/v1/models` перечисляет агентов или sub-agents?

Он перечисляет цели верхнеуровневых агентов, а не backend-модели провайдеров и не sub-agents.Sub-agents остаются внутренней топологией выполнения. Они не появляются как псевдомодели.

Почему включен `openclaw/default`?

openclaw/default — стабильный псевдоним для настроенного агента по умолчанию.Это означает, что клиенты могут продолжать использовать один предсказуемый id, даже если реальный id агента по умолчанию меняется между окружениями.

Как переопределить backend-модель?

Используйте x-openclaw-model. Это переопределение уровня владельца: оно работает с путем bearer-токена/пароля общего секрета Gateway и требует operator.admin на HTTP-путях с идентичностью, таких как аутентификация через доверенный прокси.Примеры: x-openclaw-model: openai/gpt-5.4 x-openclaw-model: gpt-5.5Если вы его опускаете, выбранный агент запускается со своим обычным настроенным выбором модели.

Как embeddings вписываются в этот контракт?

/v1/embeddings использует те же id model для целей агентов.Используйте model: "openclaw/default" или model: "openclaw/<agentId>". Когда нужна конкретная embedding-модель, отправьте ее в x-openclaw-model от вызывающей стороны с общим секретом или вызывающей стороны с идентичностью и operator.admin. Без этого заголовка запрос передается в обычную настройку embeddings выбранного агента.

Потоковая передача (SSE)

Установите stream: true, чтобы получать Server-Sent Events (SSE):

Content-Type: text/event-stream
Каждая строка события имеет вид data: <json>
Поток завершается data: [DONE]

Контракт инструментов чата

/v1/chat/completions поддерживает подмножество function-tool, совместимое с распространенными клиентами OpenAI Chat.

Поддерживаемые поля запроса

tools: массив { "type": "function", "function": { ... } }
tool_choice: "auto", "none", "required" или { "type": "function", "function": { "name": "..." } }
messages[*].role: "tool" последующие ходы
messages[*].tool_call_id для привязки результатов инструмента к предыдущему вызову инструмента
max_completion_tokens: число; лимит на общий объем токенов completion для каждого вызова (включая reasoning-токены). Текущее имя поля OpenAI Chat Completions; предпочтительно, когда отправлены и max_completion_tokens, и max_tokens.
max_tokens: число; legacy-псевдоним, принимаемый для обратной совместимости. Игнорируется, когда также присутствует max_completion_tokens.
temperature: число; best-effort температура сэмплирования, передаваемая upstream-провайдеру через канал stream-param агента.
top_p: число; best-effort nucleus sampling, передаваемый upstream-провайдеру через канал stream-param агента.
frequency_penalty: число; best-effort штраф частоты, передаваемый upstream-провайдеру через канал stream-param агента. Допустимый диапазон: от -2.0 до 2.0. Возвращает 400 invalid_request_error для значений вне диапазона.
presence_penalty: число; best-effort штраф присутствия, передаваемый upstream-провайдеру через канал stream-param агента. Допустимый диапазон: от -2.0 до 2.0. Возвращает 400 invalid_request_error для значений вне диапазона.
seed: число (целое); best-effort seed, передаваемый upstream-провайдеру через канал stream-param агента. Возвращает 400 invalid_request_error для нецелых значений.
stop: строка или массив до 4 строк; best-effort stop-последовательности, передаваемые upstream-провайдеру через канал stream-param агента. Возвращает 400 invalid_request_error для более чем 4 последовательностей или нестроковых/пустых элементов.

Когда задано любое из полей ограничения токенов, значение передается вышестоящему провайдеру через канал stream-param агента. Фактическое имя поля в wire-протоколе, отправляемое вышестоящему провайдеру, выбирается транспортом провайдера: max_completion_tokens для конечных точек семейства OpenAI и max_tokens для провайдеров, которые принимают только устаревшее имя (например, Mistral и Chutes). Поля сэмплирования (temperature, top_p, frequency_penalty, presence_penalty, seed) следуют через тот же канал stream-param; backend Codex Responses на основе ChatGPT удаляет их на стороне сервера, поскольку использует фиксированный сэмплинг. stop также передается через канал stream-param и сопоставляется с полем остановки транспорта (stop для backend-ов Chat Completions, stop_sequences для Anthropic); у OpenAI Responses API нет параметра остановки, поэтому stop не применяется к моделям на базе Responses.

Неподдерживаемые варианты

Конечная точка возвращает 400 invalid_request_error для неподдерживаемых вариантов инструментов, включая:

tools, не являющийся массивом
записи инструментов, не являющиеся функциями
отсутствующий tool.function.name
варианты tool_choice, такие как allowed_tools и custom
значения tool_choice.function.name, которые не совпадают с предоставленными tools

Для tool_choice: "required" и tool_choice с закрепленной функцией конечная точка сужает открытый набор function-tool клиента, указывает runtime вызвать клиентский инструмент перед ответом и возвращает ошибку, если ответ агента не включает соответствующий структурированный вызов клиентского инструмента. Этот контракт применяется к предоставленному вызывающей стороной HTTP-списку tools, а не к каждому внутреннему инструменту агента OpenClaw.

Форма ответа инструмента без потоковой передачи

Когда агент решает вызвать инструменты, ответ использует:

записи choices[0].finish_reason = "tool_calls"
choices[0].message.tool_calls[] с:
- id
- type: "function"
- function.name
- function.arguments (строка JSON)

Комментарий ассистента перед вызовом инструмента возвращается в choices[0].message.content (возможно, пустой).

Форма ответа инструмента при потоковой передаче

Когда stream: true, вызовы инструментов выдаются как инкрементальные SSE-фрагменты:

начальная delta роли ассистента
необязательные delta комментариев ассистента
один или несколько фрагментов delta.tool_calls, содержащих идентификатор инструмента и фрагменты аргументов
финальный фрагмент с finish_reason: "tool_calls"
data: [DONE]

Если stream_options.include_usage=true, завершающий фрагмент usage выдается перед [DONE].

Цикл продолжения после инструмента

После получения tool_calls клиент должен выполнить запрошенные функции и отправить последующий запрос, который включает:

предыдущее сообщение ассистента с вызовом инструмента
одно или несколько сообщений role: "tool" с соответствующим tool_call_id

Это позволяет запуску агента Gateway продолжить тот же цикл рассуждения и сформировать финальный ответ ассистента.

Быстрая настройка Open WebUI

Для базового подключения Open WebUI:

Базовый URL: http://127.0.0.1:18789/v1
Базовый URL Docker на macOS: http://host.docker.internal:18789/v1
API-ключ: ваш bearer-токен Gateway
Модель: openclaw/default

Ожидаемое поведение:

GET /v1/models должен перечислять openclaw/default
Open WebUI должен использовать openclaw/default как id чат-модели
Если для этого агента нужен конкретный backend-провайдер/модель, задайте обычную модель по умолчанию агента или отправьте x-openclaw-model от вызывающей стороны с общим секретом либо от вызывающей стороны с идентификацией и operator.admin

Быстрая проверка:

curl -sS http://127.0.0.1:18789/v1/models \
  -H 'Authorization: Bearer YOUR_TOKEN'

Если это возвращает openclaw/default, большинство настроек Open WebUI могут подключиться с тем же базовым URL и токеном.

Примеры

Стабильная сессия для одного разговора приложения:

curl -sS http://127.0.0.1:18789/v1/chat/completions \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "openclaw/default",
    "user": "conv:YOUR_CONVERSATION_ID",
    "messages": [{"role":"user","content":"Summarize my tasks for today"}]
  }'

Повторно используйте то же значение user в последующих вызовах для этого разговора, чтобы продолжить ту же сессию агента. Без потоковой передачи:

curl -sS http://127.0.0.1:18789/v1/chat/completions \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "openclaw/default",
    "messages": [{"role":"user","content":"hi"}]
  }'

Потоковая передача:

curl -N http://127.0.0.1:18789/v1/chat/completions \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -H 'x-openclaw-model: openai/gpt-5.4' \
  -d '{
    "model": "openclaw/research",
    "stream": true,
    "messages": [{"role":"user","content":"hi"}]
  }'

Список моделей:

curl -sS http://127.0.0.1:18789/v1/models \
  -H 'Authorization: Bearer YOUR_TOKEN'

Получить одну модель:

curl -sS http://127.0.0.1:18789/v1/models/openclaw%2Fdefault \
  -H 'Authorization: Bearer YOUR_TOKEN'

Создать embeddings:

curl -sS http://127.0.0.1:18789/v1/embeddings \
  -H 'Authorization: Bearer YOUR_TOKEN' \
  -H 'Content-Type: application/json' \
  -H 'x-openclaw-model: openai/text-embedding-3-small' \
  -d '{
    "model": "openclaw/default",
    "input": ["alpha", "beta"]
  }'

Примечания:

/v1/models возвращает целевые агенты OpenClaw, а не необработанные каталоги провайдеров.
openclaw/default всегда присутствует, поэтому один стабильный id работает в разных окружениях.
Переопределения backend-провайдера/модели должны находиться в x-openclaw-model, а не в поле OpenAI model. В HTTP-путях аутентификации с идентификацией этот заголовок требует operator.admin.
/v1/embeddings поддерживает input как строку или массив строк.

​Аутентификация

​Граница безопасности (важно)

​Когда использовать этот эндпоинт

​Контракт модели с приоритетом агента

​Включение эндпоинта

​Отключение эндпоинта

​Поведение сессии

​Почему эта поверхность важна

​Список моделей и маршрутизация агентов

​Потоковая передача (SSE)

​Контракт инструментов чата

​Поддерживаемые поля запроса

​Неподдерживаемые варианты

​Форма ответа инструмента без потоковой передачи

​Форма ответа инструмента при потоковой передаче

​Цикл продолжения после инструмента

​Быстрая настройка Open WebUI

​Примеры

​Связанные материалы