/api/chat) के साथ एकीकृत होता है। आप Ollama को तीन मोड में उपयोग कर सकते हैं: पहुँच योग्य Ollama होस्ट के माध्यम से Cloud + Local, https://ollama.com के विरुद्ध Cloud only, या पहुँच योग्य Ollama होस्ट के विरुद्ध Local only।
OpenClaw सीधे Ollama Cloud उपयोग के लिए ollama-cloud को प्रथम-श्रेणी होस्टेड provider id के रूप में भी रजिस्टर करता है। जब आप स्थानीय ollama provider id साझा किए बिना केवल-क्लाउड routing चाहते हैं, तो ollama-cloud/kimi-k2.5:cloud जैसे refs का उपयोग करें।
समर्पित केवल-क्लाउड सेटअप पेज के लिए, Ollama Cloud देखें।
Ollama provider config canonical key के रूप में baseUrl का उपयोग करता है। OpenClaw OpenAI SDK-शैली के उदाहरणों के साथ compatibility के लिए baseURL भी स्वीकार करता है, लेकिन नए config में baseUrl को प्राथमिकता देनी चाहिए।
Auth नियम
स्थानीय और LAN होस्ट
स्थानीय और LAN होस्ट
.local, और bare-hostname Ollama base URLs के लिए स्थानीय ollama-local marker का उपयोग करता है।Remote और Ollama Cloud होस्ट
Remote और Ollama Cloud होस्ट
https://ollama.com) को OLLAMA_API_KEY, auth profile, या provider के apiKey के माध्यम से वास्तविक credential की आवश्यकता होती है। सीधे hosted उपयोग के लिए, provider ollama-cloud को प्राथमिकता दें।Custom provider ids
Custom provider ids
api: "ollama" सेट करने वाले custom provider ids समान नियमों का पालन करते हैं। उदाहरण के लिए, निजी LAN Ollama host की ओर संकेत करने वाला ollama-remote provider apiKey: "ollama-local" का उपयोग कर सकता है और sub-agents उस marker को missing credential मानने के बजाय Ollama provider hook के माध्यम से resolve करेंगे। Memory search agents.defaults.memorySearch.provider को उस custom provider id पर भी सेट कर सकता है ताकि embeddings मेल खाते Ollama endpoint का उपयोग करें।Auth profiles
Auth profiles
auth-profiles.json किसी provider id के लिए credential संग्रहीत करता है। Endpoint settings (baseUrl, api, model ids, headers, timeouts) को models.providers.<id> में रखें। पुराने flat auth-profile files जैसे { "ollama-windows": { "apiKey": "ollama-local" } } runtime format नहीं हैं; उन्हें backup के साथ canonical ollama-windows:default API-key profile में फिर से लिखने के लिए openclaw doctor --fix चलाएँ। उस file में baseUrl compatibility noise है और उसे provider config में ले जाना चाहिए।Memory embedding scope
Memory embedding scope
- Provider-level key केवल उस provider के Ollama host को भेजी जाती है।
agents.*.memorySearch.remote.apiKeyकेवल उसके remote embedding host को भेजी जाती है।- शुद्ध
OLLAMA_API_KEYenv value को Ollama Cloud convention माना जाता है, और default रूप से स्थानीय या self-hosted hosts को नहीं भेजा जाता।
शुरुआत करना
अपनी पसंदीदा setup method और mode चुनें।- Onboarding (अनुशंसित)
- Manual setup
अपना mode चुनें
- क्लाउड + स्थानीय — स्थानीय Ollama host और उस host के माध्यम से routed cloud models
- केवल क्लाउड —
https://ollama.comके माध्यम से hosted Ollama models - केवल स्थानीय — केवल स्थानीय models
एक model चुनें
Cloud only OLLAMA_API_KEY के लिए prompt करता है और hosted cloud defaults सुझाता है। Cloud + Local और Local only Ollama base URL माँगते हैं, उपलब्ध models discover करते हैं, और चयनित local model अभी उपलब्ध न होने पर उसे auto-pull करते हैं। जब Ollama gemma4:latest जैसा installed :latest tag report करता है, तो setup gemma4 और gemma4:latest दोनों दिखाने या bare alias को फिर से pull करने के बजाय उस installed model को एक बार दिखाता है। Cloud + Local यह भी जाँचता है कि वह Ollama host cloud access के लिए signed in है या नहीं।Non-interactive mode
Cloud models
- Cloud + Local
- Cloud only
- Local only
Cloud + Local स्थानीय और cloud models दोनों के लिए control point के रूप में पहुँच योग्य Ollama host का उपयोग करता है। यह Ollama का पसंदीदा hybrid flow है।Setup के दौरान Cloud + Local का उपयोग करें। OpenClaw Ollama base URL के लिए prompt करता है, उस host से local models discover करता है, और ollama signin के साथ जाँचता है कि host cloud access के लिए signed in है या नहीं। जब host signed in होता है, तो OpenClaw kimi-k2.5:cloud, minimax-m2.7:cloud, और glm-5.1:cloud जैसे hosted cloud defaults भी सुझाता है।यदि host अभी signed in नहीं है, तो जब तक आप ollama signin नहीं चलाते OpenClaw setup को local-only रखता है।Model discovery (implicit provider)
जब आपOLLAMA_API_KEY (या auth profile) सेट करते हैं और models.providers.ollama या api: "ollama" वाले किसी अन्य custom remote provider को define नहीं करते, तो OpenClaw http://127.0.0.1:11434 पर स्थानीय Ollama instance से models discover करता है।
| व्यवहार | विवरण |
|---|---|
| Catalog query | /api/tags query करता है |
| Capability detection | contextWindow, expanded num_ctx Modelfile parameters, और vision/tools सहित capabilities पढ़ने के लिए best-effort /api/show lookups का उपयोग करता है |
| Vision models | /api/show द्वारा report की गई vision capability वाले models को image-capable (input: ["text", "image"]) के रूप में mark किया जाता है, इसलिए OpenClaw images को prompt में auto-inject करता है |
| Reasoning detection | उपलब्ध होने पर /api/show capabilities का उपयोग करता है, जिसमें thinking भी शामिल है; जब Ollama capabilities omit करता है, तो model-name heuristic (r1, reasoning, think) पर fall back करता है |
| Token limits | maxTokens को OpenClaw द्वारा उपयोग किए जाने वाले default Ollama max-token cap पर सेट करता है |
| Costs | सभी costs को 0 पर सेट करता है |
infer model run में ollama/<pulled-model>:latest जैसे full ref का उपयोग कर सकते हैं; OpenClaw hand-written models.json entry की आवश्यकता के बिना Ollama के live catalog से उस installed model को resolve करता है।
Signed-in Ollama hosts के लिए, कुछ :cloud models /api/tags में दिखाई देने से पहले /api/chat
और /api/show के माध्यम से usable हो सकते हैं। जब आप explicit रूप से full
ollama/<model>:cloud ref चुनते हैं, तो OpenClaw उस exact missing model को
/api/show से validate करता है और केवल तभी उसे runtime catalog में जोड़ता है जब Ollama model
metadata confirm करता है। Typos अब भी auto-created होने के बजाय unknown models के रूप में fail होते हैं।
infer model run का उपयोग करें:
infer model run में एक या अधिक
image files जोड़ें। यह prompt और image को chat tools, memory, या prior
session context load किए बिना सीधे selected Ollama vision model को भेजता है:
model run --file image/* के रूप में पहचानी गई फ़ाइलें स्वीकार करता है, जिनमें सामान्य PNG,
JPEG, और WebP इनपुट शामिल हैं। गैर-इमेज फ़ाइलें Ollama को कॉल करने से पहले अस्वीकार कर दी जाती हैं।
स्पीच रिकग्निशन के लिए, इसके बजाय openclaw infer audio transcribe का उपयोग करें।
जब आप किसी बातचीत को /model ollama/<model> से स्विच करते हैं, OpenClaw इसे
उपयोगकर्ता के सटीक चयन के रूप में मानता है। यदि कॉन्फ़िगर किया गया Ollama baseUrl
पहुँच योग्य नहीं है, तो अगला उत्तर किसी अन्य कॉन्फ़िगर किए गए फॉलबैक मॉडल से चुपचाप
उत्तर देने के बजाय प्रदाता त्रुटि के साथ विफल हो जाता है।
आइसोलेटेड Cron जॉब्स एजेंट टर्न शुरू करने से पहले एक अतिरिक्त स्थानीय सुरक्षा जाँच करते हैं।
यदि चयनित मॉडल किसी लोकल, प्राइवेट-नेटवर्क, या .local Ollama प्रदाता पर रिज़ॉल्व होता है
और /api/tags पहुँच योग्य नहीं है, तो OpenClaw उस Cron रन को त्रुटि टेक्स्ट में चयनित
ollama/<model> के साथ skipped के रूप में रिकॉर्ड करता है। एंडपॉइंट प्रीफ़्लाइट
5 मिनट के लिए कैश होता है, इसलिए एक ही बंद Ollama डेमन की ओर इंगित कई Cron जॉब्स
सभी विफल मॉडल अनुरोध लॉन्च नहीं करते।
लोकल Ollama के विरुद्ध स्थानीय टेक्स्ट पाथ, नेटिव स्ट्रीम पाथ, और एम्बेडिंग्स को लाइव सत्यापित करें:
https://ollama.com
पर इंगित करें और मौजूदा कैटलॉग से एक होस्टेड मॉडल चुनें:
https://ollama.com
के लिए डिफ़ॉल्ट रूप से एम्बेडिंग्स छोड़ देता है क्योंकि Ollama Cloud API कीज़
/api/embed को अधिकृत नहीं कर सकतीं। जब आप स्पष्ट रूप से चाहते हैं कि कॉन्फ़िगर की गई
क्लाउड की एम्बेड एंडपॉइंट का उपयोग नहीं कर सकती तो लाइव टेस्ट विफल हो, तब
OPENCLAW_LIVE_OLLAMA_EMBEDDINGS=1 सेट करें।
नया मॉडल जोड़ने के लिए, उसे बस Ollama के साथ पुल करें:
models.providers.ollama को स्पष्ट रूप से सेट करते हैं, या api: "ollama" के साथ models.providers.ollama-cloud जैसे कस्टम रिमोट प्रदाता को कॉन्फ़िगर करते हैं, तो ऑटो-डिस्कवरी छोड़ दी जाती है और आपको मॉडल मैन्युअली परिभाषित करने होंगे। http://127.0.0.2:11434 जैसे लूपबैक कस्टम प्रदाता अब भी लोकल माने जाते हैं। नीचे स्पष्ट कॉन्फ़िग सेक्शन देखें।विज़न और इमेज विवरण
बंडल किया गया Ollama Plugin, Ollama को इमेज-सक्षम मीडिया-अंडरस्टैंडिंग प्रदाता के रूप में रजिस्टर करता है। इससे OpenClaw स्पष्ट इमेज-विवरण अनुरोधों और कॉन्फ़िगर किए गए इमेज-मॉडल डिफ़ॉल्ट्स को लोकल या होस्टेड Ollama विज़न मॉडल्स के माध्यम से रूट कर सकता है। लोकल विज़न के लिए, ऐसा मॉडल पुल करें जो इमेज सपोर्ट करता हो:--model एक पूरा <provider/model> रेफ़ होना चाहिए। जब यह सेट होता है, तो openclaw infer image describe उस मॉडल को सीधे चलाता है, विवरण को इसलिए छोड़ने के बजाय कि मॉडल नेटिव विज़न सपोर्ट करता है।
जब आप OpenClaw का इमेज-अंडरस्टैंडिंग प्रदाता फ्लो, कॉन्फ़िगर किया गया agents.defaults.imageModel, और इमेज-विवरण आउटपुट आकार चाहते हैं, तब infer image describe का उपयोग करें। जब आप कस्टम प्रॉम्प्ट और एक या अधिक इमेज के साथ कच्चा मल्टीमॉडल मॉडल प्रोब चाहते हैं, तब infer model run --file का उपयोग करें।
इनबाउंड मीडिया के लिए Ollama को डिफ़ॉल्ट इमेज-अंडरस्टैंडिंग मॉडल बनाने के लिए, agents.defaults.imageModel कॉन्फ़िगर करें:
ollama/<model> रेफ़ प्राथमिकता दें। यदि वही मॉडल models.providers.ollama.models के अंतर्गत input: ["text", "image"] के साथ सूचीबद्ध है और कोई अन्य कॉन्फ़िगर किया गया इमेज प्रदाता उस बेयर मॉडल ID को एक्सपोज़ नहीं करता, तो OpenClaw qwen2.5vl:7b जैसे बेयर imageModel रेफ़ को भी ollama/qwen2.5vl:7b में नॉर्मलाइज़ करता है। यदि एक से अधिक कॉन्फ़िगर किए गए इमेज प्रदाताओं के पास वही बेयर ID है, तो प्रदाता प्रीफ़िक्स स्पष्ट रूप से उपयोग करें।
धीमे लोकल विज़न मॉडल्स को क्लाउड मॉडल्स की तुलना में अधिक लंबा इमेज-अंडरस्टैंडिंग टाइमआउट चाहिए हो सकता है। वे सीमित हार्डवेयर पर Ollama द्वारा पूरे विज्ञापित विज़न कॉन्टेक्स्ट को आवंटित करने की कोशिश करने पर क्रैश या बंद भी हो सकते हैं। जब आपको केवल सामान्य इमेज-विवरण टर्न चाहिए, तो कैपेबिलिटी टाइमआउट सेट करें और मॉडल एंट्री पर num_ctx सीमित करें:
image टूल पर लागू होता है जिसे एजेंट टर्न के दौरान कॉल कर सकता है। प्रदाता-स्तर का models.providers.ollama.timeoutSeconds अब भी सामान्य मॉडल कॉल्स के लिए अंतर्निहित Ollama HTTP अनुरोध गार्ड को नियंत्रित करता है।
लोकल Ollama के विरुद्ध स्पष्ट इमेज टूल को लाइव सत्यापित करें:
models.providers.ollama.models को मैन्युअली परिभाषित करते हैं, तो विज़न मॉडल्स को इमेज इनपुट सपोर्ट के साथ चिह्नित करें:
/api/show विज़न कैपेबिलिटी रिपोर्ट करता है, तो OpenClaw इसे Ollama से पढ़ता है।
कॉन्फ़िगरेशन
- Basic (implicit discovery)
- Explicit (manual models)
- Custom base URL
सामान्य रेसिपी
इन्हें शुरुआती बिंदुओं के रूप में उपयोग करें और मॉडल IDs कोollama list या openclaw models list --provider ollama से मिले सटीक नामों से बदलें।
Local model with auto-discovery
Local model with auto-discovery
models.providers.ollama ब्लॉक न जोड़ें।LAN Ollama host with manual models
LAN Ollama host with manual models
/v1 न जोड़ें।contextWindow OpenClaw-साइड कॉन्टेक्स्ट बजट है। params.num_ctx अनुरोध के लिए Ollama को भेजा जाता है। जब आपका हार्डवेयर मॉडल के पूरे विज्ञापित कॉन्टेक्स्ट को नहीं चला सकता, तो इन्हें संरेखित रखें।Ollama Cloud only
Ollama Cloud only
Cloud plus local through a signed-in daemon
Cloud plus local through a signed-in daemon
ollama signin के साथ साइन इन है और उसे लोकल मॉडल्स और :cloud मॉडल्स दोनों सर्व करने चाहिए।Multiple Ollama hosts
Multiple Ollama hosts
ollama-large/qwen3.5:27b Ollama तक qwen3.5:27b के रूप में पहुंचे।Lean local model profile
Lean local model profile
compat.supportsTools: false का उपयोग केवल तब करें जब मॉडल या server tool schemas पर विश्वसनीय रूप से विफल होता हो। यह स्थिरता के लिए agent capability का समझौता करता है।
localModelLean direct agent surface से browser, cron, और message tools को हटाता है और बड़े catalogs को structured Tool Search controls के पीछे default करता है, सिवाय तब जब किसी run को direct message delivery semantics बनाए रखना जरूरी हो, लेकिन यह Ollama के runtime context या thinking mode को नहीं बदलता। छोटे Qwen-शैली thinking models के लिए इसे explicit params.num_ctx और params.thinking: false के साथ जोड़ें, जो loop करते हैं या अपना response budget hidden reasoning पर खर्च करते हैं।मॉडल चयन
Configure हो जाने के बाद, आपके सभी Ollama models उपलब्ध होते हैं:ollama-spark/qwen3:32b, तो OpenClaw Ollama को call करने से पहले केवल वही
prefix हटाता है ताकि server को qwen3:32b मिले।
धीमे local models के लिए, पूरे agent runtime timeout को बढ़ाने से पहले
provider-scoped request tuning को प्राथमिकता दें:
timeoutSeconds model HTTP request पर लागू होता है, जिसमें connection setup,
headers, body streaming, और total guarded-fetch abort शामिल हैं। params.keep_alive
native /api/chat requests पर top-level keep_alive के रूप में Ollama को forward किया जाता है;
जब first-turn load time bottleneck हो, तो इसे per model set करें।
त्वरित सत्यापन
127.0.0.1 को baseUrl में उपयोग किए गए host से बदलें। यदि curl काम करता है लेकिन OpenClaw नहीं करता, तो जांचें कि क्या Gateway किसी अलग machine, container, या service account पर चल रहा है।
Ollama Web Search
OpenClaw bundledweb_search provider के रूप में Ollama Web Search का समर्थन करता है।
| गुण | विवरण |
|---|---|
| होस्ट | आपके configured Ollama host का उपयोग करता है (models.providers.ollama.baseUrl set होने पर, अन्यथा http://127.0.0.1:11434); https://ollama.com hosted API का सीधे उपयोग करता है |
| प्रमाणीकरण | signed-in local Ollama hosts के लिए key-free; direct https://ollama.com search या auth-protected hosts के लिए OLLAMA_API_KEY या configured provider auth |
| आवश्यकता | Local/self-hosted hosts चल रहे होने चाहिए और ollama signin के साथ signed in होने चाहिए; direct hosted search के लिए baseUrl: "https://ollama.com" और वास्तविक Ollama API key चाहिए |
openclaw onboard या openclaw configure --section web के दौरान Ollama Web Search चुनें, या set करें:
/api/experimental/web_search proxy का उपयोग करता है। https://ollama.com के लिए, यह hosted /api/web_search endpoint को सीधे call करता है।
उन्नत configuration
Legacy OpenAI-compatible mode
Legacy OpenAI-compatible mode
api: "openai-completions" स्पष्ट रूप से set करें:params: { streaming: false } के साथ streaming disable करनी पड़ सकती है।जब Ollama के साथ api: "openai-completions" उपयोग किया जाता है, तो OpenClaw default रूप से options.num_ctx inject करता है ताकि Ollama चुपचाप 4096 context window पर वापस न चला जाए। यदि आपका proxy/upstream अज्ञात options fields को reject करता है, तो इस behavior को disable करें:Context windows
Context windows
PARAMETER num_ctx values शामिल हैं। अन्यथा यह OpenClaw द्वारा उपयोग की जाने वाली default Ollama context window पर fallback करता है।आप उस Ollama provider के अंतर्गत हर model के लिए provider-level contextWindow, contextTokens, और maxTokens defaults set कर सकते हैं, फिर जरूरत पड़ने पर per model उन्हें override कर सकते हैं। contextWindow OpenClaw का prompt और compaction budget है। Native Ollama requests options.num_ctx को unset छोड़ते हैं जब तक आप स्पष्ट रूप से params.num_ctx configure न करें, ताकि Ollama अपना model, OLLAMA_CONTEXT_LENGTH, या VRAM-based default लागू कर सके। Modelfile rebuild किए बिना Ollama के per-request runtime context को cap या force करने के लिए, params.num_ctx set करें; invalid, zero, negative, और non-finite values ignore किए जाते हैं। यदि आपने पुराने config को upgrade किया है जो native Ollama request context को force करने के लिए केवल contextWindow या maxTokens का उपयोग करता था, तो उन explicit provider या model budgets को params.num_ctx में copy करने के लिए openclaw doctor --fix चलाएं। OpenAI-compatible Ollama adapter अब भी configured params.num_ctx या contextWindow से default रूप से options.num_ctx inject करता है; यदि आपका upstream options reject करता है, तो उसे injectNumCtxForOpenAICompat: false के साथ disable करें।Native Ollama model entries params के अंतर्गत common Ollama runtime options भी accept करती हैं, जिनमें temperature, top_p, top_k, min_p, num_predict, stop, repeat_penalty, num_batch, num_thread, और use_mmap शामिल हैं। OpenClaw केवल Ollama request keys forward करता है, इसलिए streaming जैसे OpenClaw runtime params Ollama तक leak नहीं होते। Top-level Ollama think भेजने के लिए params.think या params.thinking का उपयोग करें; false Qwen-शैली thinking models के लिए API-level thinking disable करता है।agents.defaults.models["ollama/<model>"].params.num_ctx भी काम करता है। यदि दोनों configured हैं, तो explicit provider model entry agent default पर प्राथमिकता पाती है।Thinking control
Thinking control
think, options.think नहीं। Auto-discovered models जिनकी /api/show response में thinking capability शामिल है, /think low, /think medium, /think high, और /think max expose करते हैं; non-thinking models केवल /think off expose करते हैं।params.think या params.thinking किसी specific configured model के लिए Ollama API thinking को disable या force कर सकता है। OpenClaw उन explicit model params को preserve करता है जब active run में केवल implicit default off होता है; /think medium जैसे non-off runtime commands अब भी active run को override करते हैं।Reasoning models
Reasoning models
deepseek-r1, reasoning, या think जैसे नामों वाले models को default रूप से reasoning-capable मानता है।Model costs
Model costs
मेमोरी एम्बेडिंग
मेमोरी एम्बेडिंग
/api/embed endpoint को कॉल करता है, और संभव होने पर
कई मेमोरी chunks को एक input अनुरोध में batch करता है।जब proxy.enabled=true होता है, तो कॉन्फ़िगर किए गए baseUrl से निकले ठीक
host-local loopback origin पर Ollama मेमोरी एम्बेडिंग अनुरोध managed forward proxy के बजाय
OpenClaw के guarded direct path का उपयोग करते हैं। कॉन्फ़िगर किया गया hostname स्वयं localhost या कोई loopback IP literal होना चाहिए;
DNS नाम जो केवल loopback पर resolve होते हैं, वे फिर भी managed proxy path का उपयोग करते हैं।
LAN, tailnet, private-network, और public Ollama hosts भी
managed proxy path पर ही रहते हैं। किसी दूसरे host या port पर redirects trust inherit नहीं करते।
Operators फिर भी loopback traffic को proxy के माध्यम से भेजने के लिए global proxy.loopbackMode: "proxy" setting सेट कर सकते हैं,
या connection खोलने से पहले loopback connections को deny करने के लिए proxy.loopbackMode: "block" सेट कर सकते हैं; इस setting के
process-wide प्रभाव के लिए
Managed proxy देखें।| Property | Value |
|---|---|
| Default model | nomic-embed-text |
| Auto-pull | हाँ — embedding model स्थानीय रूप से मौजूद न होने पर अपने-आप pull किया जाता है |
nomic-embed-text, qwen3-embedding, और mxbai-embed-large शामिल हैं। मेमोरी document batches raw रहती हैं ताकि existing indexes को format migration की आवश्यकता न पड़े।Ollama को memory search embedding provider के रूप में चुनने के लिए:Streaming कॉन्फ़िगरेशन
Streaming कॉन्फ़िगरेशन
/api/chat) का उपयोग करता है, जो streaming और tool calling दोनों को एक साथ पूरी तरह support करता है। किसी विशेष configuration की आवश्यकता नहीं है।native /api/chat अनुरोधों के लिए, OpenClaw thinking control को भी सीधे Ollama तक forward करता है: /think off और openclaw agent --thinking off top-level think: false भेजते हैं, जब तक कि कोई explicit model params.think/params.thinking value configured न हो, जबकि /think low|medium|high matching top-level think effort string भेजते हैं। /think max Ollama के highest native effort, think: "high" पर map होता है।समस्या निवारण
WSL2 crash loop (बार-बार reboot)
WSL2 crash loop (बार-बार reboot)
Restart=always के साथ एक ollama.service systemd unit बनाता है। यदि वह service autostart होती है और WSL2 boot के दौरान GPU-backed model load करती है, तो model load होते समय Ollama host memory को pin कर सकता है। Hyper-V memory reclaim हमेशा उन pinned pages को reclaim नहीं कर पाता, इसलिए Windows WSL2 VM को terminate कर सकता है, systemd Ollama को फिर से शुरू करता है, और loop दोहराता है।सामान्य evidence:- Windows side से बार-बार WSL2 reboot या termination
- WSL2 startup के तुरंत बाद
app.sliceयाollama.serviceमें high CPU - Linux OOM-killer event के बजाय systemd से SIGTERM
Restart=always के साथ enabled ollama.service, और visible CUDA markers मिलते हैं।Mitigation:%USERPROFILE%\.wslconfig में जोड़ें, फिर wsl --shutdown चलाएँ:Ollama detect नहीं हुआ
Ollama detect नहीं हुआ
OLLAMA_API_KEY (या कोई auth profile) सेट किया है, और आपने explicit models.providers.ollama entry define नहीं की है:कोई model उपलब्ध नहीं
कोई model उपलब्ध नहीं
models.providers.ollama में explicitly define करें।Connection refused
Connection refused
Remote host curl के साथ काम करता है लेकिन OpenClaw के साथ नहीं
Remote host curl के साथ काम करता है लेकिन OpenClaw के साथ नहीं
baseUrllocalhostकी ओर point करता है, लेकिन Gateway Docker में या किसी दूसरे host पर चलता है।- URL
/v1का उपयोग करता है, जो native Ollama के बजाय OpenAI-compatible behavior चुनता है। - remote host को Ollama side पर firewall या LAN binding changes की आवश्यकता है।
- model आपके laptop के daemon पर मौजूद है, लेकिन remote daemon पर नहीं।
Model tool JSON को text के रूप में output करता है
Model tool JSON को text के रूप में output करता है
compat.supportsTools: false सेट करें और retest करें।Kimi या GLM garbled symbols लौटाता है
Kimi या GLM garbled symbols लौटाता है
Cloud + Local या Cloud only का उपयोग किया था, capture करें, फिर fresh session और fallback model आज़माएँ:Cold local model timeout हो जाता है
Cold local model timeout हो जाता है
timeoutSeconds इस provider के लिए guarded Undici connect timeout को भी extend करता है।Large-context model बहुत धीमा है या memory खत्म हो जाती है
Large-context model बहुत धीमा है या memory खत्म हो जाती है
params.num_ctx सेट न करें। जब आपको predictable first-token latency चाहिए, तो OpenClaw के budget और Ollama के request context दोनों को cap करें:contextWindow घटाएँ। यदि Ollama machine के लिए बहुत बड़ा runtime context load कर रहा है, तो params.num_ctx घटाएँ। यदि generation बहुत लंबा चलता है, तो maxTokens घटाएँ।