/v1 API के पीछे सेवा दे सकता है। OpenClaw सामान्य openai-completions पथ के ज़रिए inferrs के साथ काम करता है।
| गुण | मान |
|---|---|
| प्रदाता id | inferrs (कस्टम; models.providers.inferrs के अंतर्गत कॉन्फ़िगर करें) |
| Plugin | कोई नहीं — inferrs बंडल किया गया OpenClaw प्रदाता Plugin नहीं है |
| प्रमाणीकरण env var | वैकल्पिक। यदि आपके inferrs सर्वर में प्रमाणीकरण नहीं है, तो कोई भी मान काम करता है |
| API | OpenAI-संगत (openai-completions) |
| सुझाया गया आधार URL | http://127.0.0.1:8080/v1 (या जहाँ भी आपका inferrs सर्वर चलता हो) |
inferrs को अभी समर्पित OpenClaw प्रदाता Plugin के बजाय कस्टम स्व-होस्टेड OpenAI-संगत बैकएंड के रूप में मानना सबसे अच्छा है। आप इसे ऑनबोर्डिंग विकल्प फ़्लैग के बजाय models.providers.inferrs के ज़रिए कॉन्फ़िगर करते हैं। यदि आपको ऑटो-डिस्कवरी वाला वास्तविक बंडल किया गया Plugin चाहिए, तो SGLang या vLLM देखें।शुरू करना
पूरा कॉन्फ़िग उदाहरण
यह उदाहरण स्थानीयinferrs सर्वर पर Gemma 4 का उपयोग करता है।
माँग पर स्टार्टअप
जब कोईinferrs/... मॉडल चुना जाता है, तब ही Inferrs को OpenClaw द्वारा शुरू भी किया जा सकता है। उसी प्रदाता प्रविष्टि में localService जोड़ें:
command निरपेक्ष होना चाहिए। Gateway होस्ट पर which inferrs का उपयोग करें और उस पथ को कॉन्फ़िग में रखें। पूरे फ़ील्ड संदर्भ के लिए, स्थानीय मॉडल सेवाएँ देखें।
उन्नत कॉन्फ़िगरेशन
Why requiresStringContent matters
Why requiresStringContent matters
कुछ अनुरोध भेजने से पहले OpenClaw शुद्ध टेक्स्ट कंटेंट पार्ट्स को सादी स्ट्रिंग में समतल कर देगा।
inferrs Chat Completions रूट केवल स्ट्रिंग messages[].content स्वीकार करते हैं, संरचित कंटेंट-पार्ट ऐरे नहीं।Gemma and tool-schema caveat
Gemma and tool-schema caveat
कुछ मौजूदा यह मॉडल के लिए OpenClaw की टूल स्कीमा सतह को अक्षम करता है और कड़े स्थानीय बैकएंड पर प्रॉम्प्ट दबाव कम कर सकता है।यदि छोटे सीधे अनुरोध फिर भी काम करते हैं लेकिन सामान्य OpenClaw एजेंट टर्न
inferrs + Gemma संयोजन छोटे सीधे /v1/chat/completions अनुरोध स्वीकार करते हैं, लेकिन पूरे OpenClaw एजेंट-रनटाइम टर्न पर फिर भी विफल हो जाते हैं।यदि ऐसा होता है, तो पहले यह आज़माएँ:inferrs के अंदर क्रैश होते रहते हैं, तो बची हुई समस्या आमतौर पर OpenClaw की ट्रांसपोर्ट परत के बजाय अपस्ट्रीम मॉडल/सर्वर व्यवहार होती है।Manual smoke test
Manual smoke test
कॉन्फ़िगर होने के बाद, दोनों परतों की जाँच करें:यदि पहला कमांड काम करता है लेकिन दूसरा विफल होता है, तो नीचे समस्या-निवारण अनुभाग देखें।
Proxy-style behavior
Proxy-style behavior
inferrs को नेटिव OpenAI एंडपॉइंट के बजाय प्रॉक्सी-शैली OpenAI-संगत /v1 बैकएंड माना जाता है।- नेटिव केवल-OpenAI अनुरोध आकारण यहाँ लागू नहीं होता
- कोई
service_tierनहीं, कोई Responsesstoreनहीं, कोई प्रॉम्प्ट-कैश संकेत नहीं, और कोई OpenAI reasoning-compat पेलोड आकारण नहीं - छिपे हुए OpenClaw एट्रिब्यूशन हेडर (
originator,version,User-Agent) कस्टमinferrsआधार URLs पर इंजेक्ट नहीं किए जाते
समस्या-निवारण
curl /v1/models fails
curl /v1/models fails
inferrs नहीं चल रहा, पहुँच योग्य नहीं है, या अपेक्षित होस्ट/पोर्ट से बंधा नहीं है। सुनिश्चित करें कि सर्वर शुरू है और आपके कॉन्फ़िगर किए गए पते पर सुन रहा है।messages[].content expected a string
messages[].content expected a string
मॉडल प्रविष्टि में
compat.requiresStringContent: true सेट करें। विवरण के लिए ऊपर requiresStringContent अनुभाग देखें।Direct /v1/chat/completions calls pass but openclaw infer model run fails
Direct /v1/chat/completions calls pass but openclaw infer model run fails
टूल स्कीमा सतह को अक्षम करने के लिए
compat.supportsTools: false सेट करने का प्रयास करें। ऊपर Gemma टूल-स्कीमा चेतावनी देखें।inferrs still crashes on larger agent turns
inferrs still crashes on larger agent turns
यदि OpenClaw को अब स्कीमा त्रुटियाँ नहीं मिलतीं, लेकिन
inferrs बड़े एजेंट टर्न पर अब भी क्रैश होता है, तो इसे अपस्ट्रीम inferrs या मॉडल सीमा मानें। प्रॉम्प्ट दबाव घटाएँ या किसी अलग स्थानीय बैकएंड या मॉडल पर स्विच करें।संबंधित
Local models
स्थानीय मॉडल सर्वरों के विरुद्ध OpenClaw चलाना।
Local model services
कॉन्फ़िगर किए गए प्रदाताओं के लिए माँग पर स्थानीय मॉडल सर्वर शुरू करना।
Gateway troubleshooting
उन स्थानीय OpenAI-संगत बैकएंड को डीबग करना जो प्रोब पास करते हैं लेकिन एजेंट रन में विफल होते हैं।
Model selection
सभी प्रदाताओं, मॉडल refs, और फ़ेलओवर व्यवहार का अवलोकन।