inferrs може обслуговувати локальні моделі за OpenAI-сумісним APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1. OpenClaw працює з inferrs через загальний шлях openai-completions.
| Властивість | Значення |
|---|---|
| ID провайдера | inferrs (користувацький; налаштовується в models.providers.inferrs) |
| Plugin | немає — inferrs не є вбудованим Plugin провайдера OpenClaw |
| Змінна env для автентифікації | Необов’язкова. Будь-яке значення працює, якщо ваш сервер inferrs не має автентифікації |
| API | OpenAI-сумісний (openai-completions) |
| Пропонована базова URL-адреса | http://127.0.0.1:8080/v1 (або там, де працює ваш сервер inferrs) |
inferrs наразі найкраще розглядати як користувацький самостійно розміщений OpenAI-сумісний бекенд, а не як окремий Plugin провайдера OpenClaw. Ви налаштовуєте його через models.providers.inferrs, а не через прапорець вибору під час онбордингу. Якщо вам потрібен справжній вбудований Plugin з автовиявленням, див. SGLang або vLLM.Початок роботи
Повний приклад конфігурації
У цьому прикладі використовується Gemma 4 на локальному серверіinferrs.
Запуск на вимогу
Inferrs також може запускатися OpenClaw лише тоді, коли вибрано модельinferrs/....
Додайте localService до того самого запису провайдера:
command має бути абсолютним. Використайте which inferrs на хості Gateway і вкажіть цей
шлях у конфігурації. Повний довідник полів див. у
Служби локальних моделей.
Розширена конфігурація
Чому requiresStringContent важливий
Чому requiresStringContent важливий
Деякі маршрути Chat Completions у OpenClaw перетворить частини суто текстового вмісту на прості рядки перед надсиланням
запиту.
inferrs приймають лише рядковий
messages[].content, а не структуровані масиви частин вмісту.Застереження щодо Gemma і схем інструментів
Застереження щодо Gemma і схем інструментів
Деякі поточні комбінації Це вимикає поверхню схем інструментів OpenClaw для моделі й може зменшити навантаження промпта
на суворіші локальні бекенди.Якщо крихітні прямі запити все ще працюють, але звичайні ходи агента OpenClaw продовжують
аварійно завершуватися всередині
inferrs + Gemma приймають невеликі прямі
запити /v1/chat/completions, але все одно дають збій на повних ходах
agent-runtime OpenClaw.Якщо це трапляється, спершу спробуйте таке:inferrs, решта проблеми зазвичай пов’язана з поведінкою
upstream-моделі або сервера, а не з транспортним шаром OpenClaw.Ручний smoke-тест
Ручний smoke-тест
Після налаштування перевірте обидва шари:Якщо перша команда працює, а друга завершується помилкою, перегляньте розділ усунення несправностей нижче.
Поведінка у стилі проксі
Поведінка у стилі проксі
inferrs розглядається як OpenAI-сумісний бекенд /v1 у стилі проксі, а не як
нативна кінцева точка OpenAI.- Формування запитів, призначене лише для нативного OpenAI, тут не застосовується
- Немає
service_tier, немає Responsesstore, немає підказок prompt-cache і немає формування payload для сумісності reasoning OpenAI - Приховані заголовки атрибуції OpenClaw (
originator,version,User-Agent) не додаються до користувацьких базових URL-адресinferrs
Усунення несправностей
curl /v1/models завершується помилкою
curl /v1/models завершується помилкою
inferrs не запущено, він недоступний або не прив’язаний до очікуваного
хоста/порту. Переконайтеся, що сервер запущено й він прослуховує адресу, яку ви
налаштували.messages[].content очікує рядок
messages[].content очікує рядок
Задайте
compat.requiresStringContent: true у записі моделі. Докладніше див.
розділ requiresStringContent вище.Прямі виклики /v1/chat/completions проходять, але openclaw infer model run завершується помилкою
Прямі виклики /v1/chat/completions проходять, але openclaw infer model run завершується помилкою
Спробуйте задати
compat.supportsTools: false, щоб вимкнути поверхню схем інструментів.
Див. застереження щодо схем інструментів Gemma вище.inferrs все ще аварійно завершується на більших ходах агента
inferrs все ще аварійно завершується на більших ходах агента
Якщо OpenClaw більше не отримує помилок схеми, але
inferrs усе ще аварійно завершується на більших
ходах агента, розглядайте це як обмеження upstream inferrs або моделі. Зменште
навантаження промпта або перейдіть на інший локальний бекенд чи модель.Пов’язане
Локальні моделі
Запуск OpenClaw із локальними серверами моделей.
Служби локальних моделей
Запуск локальних серверів моделей на вимогу для налаштованих провайдерів.
Усунення несправностей Gateway
Налагодження локальних OpenAI-сумісних бекендів, які проходять перевірки, але дають збій під час запусків агента.
Вибір моделі
Огляд усіх провайдерів, посилань на моделі та поведінки failover.