openclaw infer — каноническая headless-поверхность для рабочих процессов инференса, поддерживаемых провайдерами.
Она намеренно раскрывает семейства возможностей, а не сырые имена RPC Gateway и не сырые идентификаторы инструментов агента.
Превратите infer в skill
Скопируйте и вставьте это агенту:- сопоставлять распространенные намерения пользователя с правильной подкомандой infer
- включать несколько канонических примеров infer для рабочих процессов, которые он покрывает
- предпочитать
openclaw infer ...в примерах и рекомендациях - избегать повторного документирования всей поверхности infer внутри тела skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Зачем использовать infer
openclaw infer предоставляет единый согласованный CLI для задач инференса, поддерживаемых провайдерами внутри OpenClaw.
Преимущества:
- Используйте провайдеры и модели, уже настроенные в OpenClaw, вместо настройки одноразовых оберток для каждого backend.
- Держите рабочие процессы с моделями, изображениями, аудиотранскрибацией, TTS, видео, вебом и embeddings в одном дереве команд.
- Используйте стабильную форму вывода
--jsonдля скриптов, автоматизации и рабочих процессов, управляемых агентами. - Предпочитайте первичную поверхность OpenClaw, когда задача по сути сводится к “запустить инференс”.
- Используйте обычный локальный путь без необходимости Gateway для большинства команд infer.
openclaw infer ..., когда низкоуровневые
тесты провайдера уже проходят. Это проверяет поставляемый CLI, загрузку конфигурации,
разрешение агента по умолчанию, активацию встроенного Plugin и общую среду выполнения
возможностей до отправки запроса провайдеру.
Дерево команд
Распространенные задачи
Эта таблица сопоставляет распространенные задачи инференса с соответствующей командой infer.| Задача | Команда | Примечания |
|---|---|---|
| Запустить текстовый/model prompt | openclaw infer model run --prompt "..." --json | По умолчанию использует обычный локальный путь |
| Запустить model prompt на изображениях | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Повторите --file для нескольких входных изображений |
| Сгенерировать изображение | openclaw infer image generate --prompt "..." --json | Используйте image edit, если начинаете с существующего файла |
| Описать файл изображения или URL | openclaw infer image describe --file ./image.png --prompt "..." --json | --model должен быть image-capable <provider/model> |
| Транскрибировать аудио | openclaw infer audio transcribe --file ./memo.m4a --json | --model должен быть <provider/model> |
| Синтезировать речь | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status ориентирован на Gateway |
| Сгенерировать видео | openclaw infer video generate --prompt "..." --json | Поддерживает подсказки провайдера, такие как --resolution |
| Описать видеофайл | openclaw infer video describe --file ./clip.mp4 --json | --model должен быть <provider/model> |
| Искать в вебе | openclaw infer web search --query "..." --json | |
| Получить веб-страницу | openclaw infer web fetch --url https://example.com --json | |
| Создать embeddings | openclaw infer embedding create --text "..." --json |
Поведение
openclaw infer ...— основная поверхность CLI для этих рабочих процессов.- Используйте
--json, когда вывод будет потребляться другой командой или скриптом. - Используйте
--providerили--model provider/model, когда требуется конкретный backend. - Используйте
model run --thinking <level>, чтобы передать одноразовый уровень thinking/reasoning (off,minimal,low,medium,high,adaptive,xhighилиmax), сохранив запуск сырым. - Для
image describe,audio transcribeиvideo describe--modelдолжен использовать форму<provider/model>. - Для
image describe--fileпринимает локальные пути и HTTP(S) URL изображений. Удаленные URL используют обычную SSRF-политику получения медиа. - Для
image describeявный--modelзапускает этот provider/model напрямую. Модель должна быть image-capable в каталоге моделей или конфигурации провайдера.codex/<model>запускает ограниченный ход понимания изображений через app-server Codex;openai/<model>использует путь провайдера OpenAI с аутентификацией через API-key или ChatGPT/Codex OAuth. - Команды stateless-выполнения по умолчанию локальные.
- Команды состояния, управляемого Gateway, по умолчанию используют Gateway.
- Обычный локальный путь не требует запущенного Gateway.
- Локальный
model run— компактное одноразовое completion провайдера. Он разрешает настроенную модель агента и auth, но не запускает ход chat-agent, не загружает инструменты и не открывает встроенные MCP-серверы. model run --fileпринимает файлы изображений, определяет их MIME type и отправляет их вместе с переданным prompt в выбранную модель. Повторите--fileдля нескольких изображений.model run --fileотклоняет входные данные, не являющиеся изображениями. Используйтеinfer audio transcribeдля аудиофайлов иinfer video describeдля видеофайлов.model run --gatewayпроверяет маршрутизацию Gateway, сохраненную auth, выбор провайдера и встроенную среду выполнения, но все равно выполняется как сырой пробный запуск модели: он отправляет переданный prompt и любые вложения изображений без предыдущего transcript сеанса, bootstrap/AGENTS context, сборки context-engine, инструментов или встроенных MCP-серверов.model run --gateway --model <provider/model>требует доверенные учетные данные оператора Gateway, потому что запрос просит Gateway выполнить одноразовое переопределение provider/model.- Локальный
model run --thinkingиспользует компактный путь provider-completion; специфичные для провайдера уровни, такие какadaptiveиmax, сопоставляются с ближайшим переносимым уровнем simple-completion.
Модель
Используйтеmodel для текстового инференса, поддерживаемого провайдерами, и инспекции модели/провайдера.
<provider/model>, чтобы выполнить smoke-test конкретного провайдера без
запуска Gateway или загрузки полной поверхности инструментов агента:
- Локальный
model run— самый узкий CLI smoke для проверки работоспособности provider/model/auth, потому что для не-Codex провайдеров он отправляет только переданный prompt в выбранную модель. - Локальный
model run --model <provider/model>может использовать точные встроенные статические строки каталога изmodels list --allдо того, как этот провайдер записан в конфигурацию. Auth провайдера все равно требуется; отсутствующие учетные данные завершаются ошибками auth, а неUnknown model. - Для reasoning-проб Mistral Medium 3.5 оставьте temperature неустановленной/по умолчанию. Mistral отклоняет
reasoning_effort="high"плюсtemperature: 0; используйтеmistral/mistral-medium-3-5с temperature по умолчанию или ненулевым значением reasoning-mode, например0.7. - Локальные пробы Codex Responses — узкое исключение: OpenClaw добавляет минимальную системную инструкцию, чтобы транспорт мог заполнить обязательное поле
instructions, не добавляя полный контекст агента, инструменты, память или transcript сеанса. - Локальный
model run --fileсохраняет этот компактный путь и прикрепляет содержимое изображения напрямую к единственному сообщению пользователя. Распространенные файлы изображений, такие как PNG, JPEG и WebP, работают, когда их MIME type определяется какimage/*; неподдерживаемые или нераспознанные файлы завершаются ошибкой до вызова провайдера. model run --fileлучше всего подходит, когда вы хотите напрямую протестировать выбранную multimodal text model. Используйтеinfer image describe, когда вам нужны выбор OpenClaw провайдера для понимания изображений и маршрутизация image-model по умолчанию.- Выбранная модель должна поддерживать ввод изображений; text-only модели могут отклонить запрос на уровне провайдера.
model run --promptдолжен содержать непустой не-whitespace текст; пустые prompts отклоняются до вызова локальных провайдеров или Gateway.- Локальный
model runзавершается с ненулевым кодом, когда провайдер не возвращает текстовый вывод, поэтому недоступные локальные провайдеры и пустые completions не выглядят как успешные пробы. - Используйте
model run --gateway, когда нужно протестировать маршрутизацию Gateway, настройку agent-runtime или состояние провайдера, управляемое Gateway, сохраняя при этом сырой ввод модели. Используйтеopenclaw agentили chat-поверхности, когда нужен полный контекст агента, инструменты, память и transcript сеанса. model auth login,model auth logoutиmodel auth statusуправляют сохраненным состоянием auth провайдера.
Изображение
Используйтеimage для генерации, редактирования и описания.
-
Используйте
image edit, когда начинаете с существующих входных файлов. -
Используйте
--size,--aspect-ratioили--resolutionсimage editдля провайдеров/моделей, которые поддерживают подсказки геометрии при редактировании по эталонным изображениям. -
Используйте
--output-format png --background transparentс--model openai/gpt-image-1.5для вывода OpenAI PNG с прозрачным фоном;--openai-backgroundостается доступным как специфичный для OpenAI псевдоним. Провайдеры, которые не заявляют поддержку фона, сообщают подсказку как проигнорированное переопределение. -
Используйте
--quality low|medium|high|autoдля провайдеров, которые поддерживают подсказки качества изображения, включая OpenAI. OpenAI также принимает--openai-moderation low|autoдля специфичной для провайдера подсказки модерации. -
Используйте
image providers --json, чтобы проверить, какие встроенные провайдеры изображений обнаруживаются, настроены, выбраны и какие возможности генерации/редактирования предоставляет каждый провайдер. -
Используйте
image generate --model <provider/model> --jsonкак самый узкий живой CLI smoke для изменений генерации изображений. Пример:JSON-ответ сообщаетok,provider,model,attemptsи записанные пути вывода. Когда задан--output, итоговое расширение может соответствовать MIME-типу, возвращенному провайдером. -
Для
image describeиimage describe-manyиспользуйте--prompt, чтобы дать модели зрения инструкцию для конкретной задачи, например OCR, сравнение, инспекцию UI или краткую подпись. -
Используйте
--timeout-msс медленными локальными моделями зрения или холодными запусками Ollama. -
Для
image describe--modelдолжен быть моделью<provider/model>с поддержкой изображений. -
Для локальных моделей зрения Ollama сначала загрузите модель и задайте
OLLAMA_API_KEYлюбым значением-заполнителем, напримерollama-local. См. Ollama.
Аудио
Используйтеaudio для транскрибации файлов.
audio transcribeпредназначен для транскрибации файлов, а не для управления сеансами в реальном времени.--modelдолжен быть<provider/model>.
TTS
Используйтеtts для синтеза речи и состояния провайдера TTS.
tts statusпо умолчанию использует Gateway, потому что отражает состояние TTS, управляемое Gateway.- Используйте
tts providers,tts voicesиtts set-provider, чтобы просматривать и настраивать поведение TTS.
Видео
Используйтеvideo для генерации и описания.
video generateпринимает--size,--aspect-ratio,--resolution,--duration,--audio,--watermarkи--timeout-msи передает их среде выполнения генерации видео.--modelдолжен быть<provider/model>дляvideo describe.
Веб
Используйтеweb для рабочих процессов поиска и получения данных.
- Используйте
web providers, чтобы просмотреть доступных, настроенных и выбранных провайдеров.
Эмбеддинг
Используйтеembedding для создания векторов и инспекции провайдера эмбеддингов.
Вывод JSON
Команды Infer нормализуют вывод JSON в общей оболочке:okcapabilitytransportprovidermodelattemptsoutputserror
outputs содержит файлы, записанные OpenClaw. Используйте
path, mimeType, size и любые специфичные для медиа размеры в этом массиве
для автоматизации вместо разбора человекочитаемого stdout.
Распространенные ошибки
Примечания
openclaw capability ...— псевдоним дляopenclaw infer ....