/v1 API के साथ DeepSeek V4 Flash सर्व करता है। OpenClaw सामान्य openai-completions प्रदाता परिवार के माध्यम से ds4 से कनेक्ट करता है।
ds4 कोई बंडल किया हुआ OpenClaw प्रदाता Plugin नहीं है। इसे models.providers.ds4 के अंतर्गत कॉन्फ़िगर करें, फिर ds4/deepseek-v4-flash चुनें।
- प्रदाता id:
ds4 - Plugin: कोई नहीं
- API: OpenAI-संगत Chat Completions (
openai-completions) - सुझाया गया बेस URL:
http://127.0.0.1:18000/v1 - मॉडल id:
deepseek-v4-flash - टूल कॉल: OpenAI-शैली के
toolsऔरtool_callsके माध्यम से समर्थित - रीजनिंग: DeepSeek-शैली के
thinkingऔरreasoning_effort
आवश्यकताएँ
- Metal समर्थन वाला macOS।
ds4-serverऔर DeepSeek V4 Flash GGUF फ़ाइल के साथ काम करता हुआ ds4 checkout।- आपके चुने हुए कॉन्टेक्स्ट के लिए पर्याप्त मेमोरी। बड़े
--ctxमान सर्वर शुरू होने पर अधिक KV मेमोरी आवंटित करते हैं।
त्वरित शुरुआत
OpenClaw प्रदाता config जोड़ें
पूर्ण config से config जोड़ें, फिर एक one-shot मॉडल जाँच चलाएँ:
पूर्ण config
इस config का उपयोग तब करें जब ds4 पहले से127.0.0.1:18000 पर चल रहा हो।
contextWindow को ds4-server --ctx मान के साथ संरेखित रखें। maxTokens को --tokens के साथ संरेखित रखें, जब तक कि आप जानबूझकर OpenClaw से सर्वर default से कम output अनुरोध कराना न चाहें।
ऑन-डिमांड startup
OpenClaw ds4 को केवल तब शुरू कर सकता है जब कोईds4/... मॉडल चुना गया हो। उसी प्रदाता एंट्री में localService जोड़ें:
command एक पूर्ण executable पथ होना चाहिए। Shell lookup और ~ expansion का उपयोग नहीं किया जाता। हर localService फ़ील्ड के लिए स्थानीय मॉडल सेवाएँ देखें।
Think Max
ds4 Think Max केवल तब लागू करता है जब दोनों शर्तें सत्य हों:ds4-server--ctx 393216या उससे अधिक के साथ शुरू होता है।- अनुरोध
reasoning_effort: "max"या समकक्ष ds4 effort फ़ील्ड का उपयोग करता है।
परीक्षण
सीधी HTTP जाँच से शुरू करें:executionTrace.winnerProviderds4हैexecutionTrace.winnerModeldeepseek-v4-flashहैtoolSummary.callsकम से कम1हैfinalAssistantVisibleTexttool-okसे शुरू होता है
समस्या निवारण
curl /v1/models कनेक्ट नहीं कर सकता
curl /v1/models कनेक्ट नहीं कर सकता
ds4 चल नहीं रहा है या
baseUrl में दिए गए host और port से bind नहीं है। ds4-server शुरू करें, फिर दोबारा प्रयास करें:500 prompt exceeds context
500 prompt exceeds context
कॉन्फ़िगर किया गया
--ctx OpenClaw टर्न के लिए बहुत छोटा है। ds4-server --ctx बढ़ाएँ, फिर मिलान के लिए models.providers.ds4.models[].contextWindow अपडेट करें। टूल्स के साथ पूरे एजेंट टर्न को सीधे एक-message curl अनुरोध की तुलना में काफी अधिक कॉन्टेक्स्ट चाहिए।Think Max सक्रिय नहीं होता
Think Max सक्रिय नहीं होता
ds4 Think Max का उपयोग केवल तब करता है जब
--ctx कम से कम 393216 हो और अनुरोध reasoning_effort: "max" माँगे। छोटे कॉन्टेक्स्ट high reasoning पर fallback करते हैं।पहला अनुरोध धीमा है
पहला अनुरोध धीमा है
ds4 में cold Metal residency और मॉडल warmup चरण होता है। जब OpenClaw सर्वर को मांग पर शुरू करता है, तो
localService.readyTimeoutMs: 300000 का उपयोग करें।संबंधित
स्थानीय मॉडल सेवाएँ
मॉडल अनुरोधों से पहले स्थानीय मॉडल सर्वर मांग पर शुरू करें।
स्थानीय मॉडल
स्थानीय मॉडल बैकएंड चुनें और संचालित करें।
मॉडल प्रदाता
प्रदाता refs, auth, और failover कॉन्फ़िगर करें।
DeepSeek
Native DeepSeek प्रदाता व्यवहार और thinking controls।