/v1. OpenClaw подключается к ds4
через универсальное семейство провайдеров openai-completions.
ds4 не является встроенным Plugin провайдера OpenClaw. Настройте его в
models.providers.ds4, затем выберите ds4/deepseek-v4-flash.
- Идентификатор провайдера:
ds4 - Plugin: нет
- API: OpenAI-совместимый Chat Completions (
openai-completions) - Рекомендуемый базовый URL:
http://127.0.0.1:18000/v1 - Идентификатор модели:
deepseek-v4-flash - Вызовы инструментов: поддерживаются через
toolsиtool_callsв стиле OpenAI - Рассуждение:
thinkingиreasoning_effortв стиле DeepSeek
Требования
- macOS с поддержкой Metal.
- Рабочая копия ds4 с
ds4-serverи файлом GGUF DeepSeek V4 Flash. - Достаточно памяти для выбранного вами контекста. Большие значения
--ctxвыделяют больше KV-памяти при запуске сервера.
Быстрый старт
Add the OpenClaw provider config
Добавьте конфигурацию из Полной конфигурации, затем выполните разовую
проверку модели:
Полная конфигурация
Используйте эту конфигурацию, когда ds4 уже запущен на127.0.0.1:18000.
contextWindow согласованным со значением ds4-server --ctx. Держите maxTokens
согласованным с --tokens, если вы намеренно не хотите, чтобы OpenClaw запрашивал меньше
вывода, чем значение сервера по умолчанию.
Запуск по требованию
OpenClaw может запускать ds4 только когда выбрана модельds4/.... Добавьте
localService в ту же запись провайдера:
command должен быть абсолютным путем к исполняемому файлу. Поиск через оболочку и раскрытие ~
не используются. См. Локальные сервисы моделей для всех
полей localService.
Think Max
ds4 применяет Think Max только когда оба условия истинны:ds4-serverзапускается с--ctx 393216или выше.- Запрос использует
reasoning_effort: "max"или эквивалентное поле усилия ds4.
Тестирование
Начните с прямой HTTP-проверки:executionTrace.winnerProviderравенds4executionTrace.winnerModelравенdeepseek-v4-flashtoolSummary.callsне меньше1finalAssistantVisibleTextначинается сtool-ok
Устранение неполадок
curl /v1/models cannot connect
curl /v1/models cannot connect
ds4 не запущен или не привязан к хосту и порту из
baseUrl. Запустите
ds4-server, затем повторите попытку:500 prompt exceeds context
500 prompt exceeds context
Настроенный
--ctx слишком мал для хода OpenClaw. Увеличьте
ds4-server --ctx, затем обновите models.providers.ds4.models[].contextWindow,
чтобы значения совпадали. Полным ходам агента с инструментами требуется существенно больше контекста, чем
прямому curl-запросу с одним сообщением.Think Max does not activate
Think Max does not activate
ds4 использует Think Max только когда
--ctx не меньше 393216, а запрос
запрашивает reasoning_effort: "max". Меньшие контексты откатываются к высокому
уровню рассуждения.The first request is slow
The first request is slow
У ds4 есть фаза холодного размещения Metal и прогрева модели. Используйте
localService.readyTimeoutMs: 300000, когда OpenClaw запускает сервер по
требованию.Связанные материалы
Local model services
Запускайте локальные серверы моделей по требованию перед запросами к моделям.
Local models
Выбирайте и эксплуатируйте локальные бэкенды моделей.
Model providers
Настраивайте ссылки на провайдеров, аутентификацию и failover.
DeepSeek
Нативное поведение провайдера DeepSeek и элементы управления thinking.