मुख्य सामग्री पर जाएं
OpenClaw Grok मॉडल के लिए एक बंडल किया हुआ xai प्रदाता Plugin शिप करता है। अधिकतर उपयोगकर्ताओं के लिए, अनुशंसित पथ पात्र SuperGrok या X Premium सदस्यता के साथ Grok OAuth है। OpenClaw local-first रहता है: Gateway, कॉन्फ़िग, रूटिंग, और टूल आपकी मशीन पर चलते हैं, जबकि Grok मॉडल अनुरोध xAI के माध्यम से प्रमाणित होते हैं और xAI की API को भेजे जाते हैं। OAuth के लिए xAI API कुंजी की आवश्यकता नहीं होती, और इसके लिए Grok Build ऐप की भी आवश्यकता नहीं होती। xAI सहमति स्क्रीन पर फिर भी Grok Build दिखा सकता है क्योंकि OpenClaw xAI के साझा OAuth क्लाइंट का उपयोग करता है।

अपना सेटअप पथ चुनें

अपने OpenClaw इंस्टॉल की स्थिति से मेल खाने वाला पथ उपयोग करें:
1

New OpenClaw install

जब आप नया स्थानीय Gateway सेट अप कर रहे हों, तो डेमन इंस्टॉल के साथ ऑनबोर्डिंग चलाएं, फिर मॉडल/प्रमाणीकरण चरण में xAI/Grok OAuth विकल्प चुनें:
openclaw onboard --install-daemon
VPS पर या SSH के माध्यम से, सीधे xAI OAuth चुनें; OpenClaw device-code सत्यापन का उपयोग करता है और localhost callback की आवश्यकता नहीं होती:
openclaw onboard --install-daemon --auth-choice xai-oauth
OAuth के लिए xAI API कुंजी की आवश्यकता नहीं होती। OpenClaw को Grok Build ऐप की आवश्यकता नहीं होती। xAI सहमति ऐप को फिर भी Grok Build के रूप में लेबल कर सकता है क्योंकि OpenClaw xAI के साझा OAuth क्लाइंट का उपयोग करता है।
2

Existing OpenClaw install

यदि OpenClaw पहले से कॉन्फ़िगर है, तो केवल xAI में साइन इन करें। सिर्फ Grok कनेक्ट करने के लिए पूरी ऑनबोर्डिंग दोबारा न चलाएं या डेमन फिर से इंस्टॉल न करें:
openclaw models auth login --provider xai --method oauth
साइन इन करने के बाद Grok को डिफ़ॉल्ट मॉडल बनाने के लिए, इसे अलग से लागू करें:
openclaw models set xai/grok-4.3
पूरी ऑनबोर्डिंग केवल तभी दोबारा चलाएं जब आप जानबूझकर Gateway, डेमन, चैनल, वर्कस्पेस, या अन्य सेटअप विकल्प बदलना चाहते हों।
3

API-key path

API-key सेटअप xAI Console कुंजियों और उन मीडिया सतहों के लिए अभी भी काम करता है जिन्हें key-backed प्रदाता कॉन्फ़िग की आवश्यकता होती है:
openclaw models auth login --provider xai --method api-key
export XAI_API_KEY=xai-...
4

Pick a model

{
  agents: { defaults: { model: { primary: "xai/grok-4.3" } } },
}
OpenClaw बंडल किए गए xAI transport के रूप में xAI Responses API का उपयोग करता है। वही credential openclaw models auth login --provider xai --method oauth या openclaw models auth login --provider xai --method api-key से first-class web_search, x_search, remote code_execution, और xAI image/video generation को भी चला सकता है। Speech और transcription के लिए वर्तमान में XAI_API_KEY या प्रदाता कॉन्फ़िग की आवश्यकता होती है। Grok-backed web_search xAI OAuth को प्राथमिकता देता है और XAI_API_KEY या Plugin web-search कॉन्फ़िग पर fallback करता है। यदि आप plugins.entries.xai.config.webSearch.apiKey के अंतर्गत xAI कुंजी संग्रहीत करते हैं, तो बंडल किया गया xAI मॉडल प्रदाता उस कुंजी को भी fallback के रूप में पुनः उपयोग करता है। Grok web_search और, डिफ़ॉल्ट रूप से, x_search को operator xAI Responses proxy के माध्यम से route करने के लिए plugins.entries.xai.config.webSearch.baseUrl सेट करें। code_execution tuning plugins.entries.xai.config.codeExecution के अंतर्गत रहती है।

OAuth समस्या निवारण

  • SSH, Docker, VPS, या अन्य remote सेटअप के लिए, openclaw models auth login --provider xai --method oauth उपयोग करें; xAI OAuth localhost callback के बजाय device-code सत्यापन का उपयोग करता है।
  • यदि sign-in सफल होता है लेकिन Grok डिफ़ॉल्ट मॉडल नहीं है, तो openclaw models set xai/grok-4.3 चलाएं।
  • सहेजे गए xAI auth profiles निरीक्षण करने के लिए, चलाएं:
    openclaw models auth list --provider xai
    openclaw models status
    
  • xAI तय करता है कि कौन से खाते OAuth API tokens प्राप्त कर सकते हैं। यदि कोई खाता पात्र नहीं है, तो API-key पथ आज़माएं या xAI की ओर subscription जांचें।
SSH, Docker, या VPS से sign in करते समय xai-oauth उपयोग करें। OpenClaw एक xAI URL और छोटा code प्रिंट करता है; remote process द्वारा completed token exchange के लिए xAI को poll करते समय किसी भी स्थानीय browser में sign-in पूरा करें।

बिल्ट-इन कैटलॉग

OpenClaw मौजूदा xAI chat models को out of the box शामिल करता है, model pickers में सबसे नए पहले क्रम में:
FamilyModel ids
Grok Build 0.1grok-build-0.1
Grok 4.3grok-4.3
Grok 4.20 Betagrok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning
Plugin मौजूदा configs के लिए पुराने Grok 3, Grok 4, Grok 4 Fast, Grok 4.1 Fast, और Grok Code slugs को अभी भी forward-resolve करता है। Official Grok Code Fast aliases grok-build-0.1 में normalize होते हैं; OpenClaw selectable catalog में अन्य retired upstream slugs अब नहीं दिखाता।
सामान्य chat के लिए grok-4.3 और build/coding-focused workloads के लिए grok-build-0.1 उपयोग करें, जब तक आपको स्पष्ट रूप से Grok 4.20 beta alias की आवश्यकता न हो।

OpenClaw फीचर कवरेज

बंडल किया गया Plugin xAI की मौजूदा public API surface को OpenClaw के साझा प्रदाता और tool contracts पर map करता है। साझा contract में फिट न होने वाली capabilities (उदाहरण के लिए streaming TTS और realtime voice) expose नहीं की जातीं - नीचे तालिका देखें।
xAI capabilityOpenClaw surfaceStatus
Chat / Responsesxai/<model> model providerहां
Server-side web searchweb_search provider grokहां
Server-side X searchx_search toolहां
Server-side code executioncode_execution toolहां
Imagesimage_generateहां
Videosvideo_generateहां
Batch text-to-speechmessages.tts.provider: "xai" / ttsहां
Streaming TTS-Expose नहीं; OpenClaw का TTS contract complete audio buffers लौटाता है
Batch speech-to-texttools.media.audio / media understandingहां
Streaming speech-to-textVoice Call streaming.provider: "xai"हां
Realtime voice-अभी expose नहीं; अलग session/WebSocket contract
Files / batchesGeneric model API compatibility onlyfirst-class OpenClaw tool नहीं
OpenClaw media generation, speech, और batch transcription के लिए xAI की REST image/video/TTS/STT APIs, live voice-call transcription के लिए xAI की streaming STT WebSocket, और model, search, तथा code-execution tools के लिए Responses API का उपयोग करता है। जिन features को अलग OpenClaw contracts की आवश्यकता होती है, जैसे Realtime voice sessions, उन्हें hidden Plugin behavior के बजाय upstream capabilities के रूप में यहां दस्तावेजीकृत किया गया है।

Fast-mode mappings

/fast on या agents.defaults.models["xai/<model>"].params.fastMode: true native xAI requests को इस प्रकार rewrite करता है:
Source modelFast-mode target
grok-3grok-3-fast
grok-3-minigrok-3-mini-fast
grok-4grok-4-fast
grok-4-0709grok-4-fast

Legacy compatibility aliases

Legacy aliases अभी भी canonical bundled ids में normalize होते हैं:
Legacy aliasCanonical id
grok-code-fast-1grok-build-0.1
grok-code-fastgrok-build-0.1
grok-code-fast-1-0825grok-build-0.1
grok-4-fast-reasoninggrok-4-fast
grok-4-1-fast-reasoninggrok-4-1-fast
grok-4.20-reasoninggrok-4.20-beta-latest-reasoning
grok-4.20-non-reasoninggrok-4.20-beta-latest-non-reasoning

Features

बंडल किया गया xai Plugin साझा video_generate tool के माध्यम से video generation register करता है।
  • डिफ़ॉल्ट video model: xai/grok-imagine-video
  • Modes: text-to-video, image-to-video, reference-image generation, remote video edit, और remote video extension
  • Aspect ratios: 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3
  • Resolutions: 480P, 720P
  • Duration: generation/image-to-video के लिए 1-15 seconds, reference_image roles उपयोग करते समय 1-10 seconds, extension के लिए 2-10 seconds
  • Reference-image generation: हर supplied image के लिए imageRoles को reference_image पर सेट करें; xAI ऐसी 7 images तक स्वीकार करता है
  • डिफ़ॉल्ट operation timeout: 600 seconds, जब तक video_generate.timeoutMs या agents.defaults.videoGenerationModel.timeoutMs सेट न हो
Local video buffers स्वीकार नहीं किए जाते। video edit/extend inputs के लिए remote http(s) URLs उपयोग करें। Image-to-video local image buffers स्वीकार करता है क्योंकि OpenClaw उन्हें xAI के लिए data URLs के रूप में encode कर सकता है।
xAI को डिफ़ॉल्ट video provider के रूप में उपयोग करने के लिए:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "xai/grok-imagine-video",
      },
    },
  },
}
साझा tool parameters, provider selection, और failover behavior के लिए Video Generation देखें।
बंडल किया गया xai Plugin साझा image_generate tool के माध्यम से image generation register करता है।
  • डिफ़ॉल्ट image model: xai/grok-imagine-image
  • अतिरिक्त model: xai/grok-imagine-image-quality
  • Modes: text-to-image और reference-image edit
  • Reference inputs: एक image या पांच तक images
  • Aspect ratios: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • Resolutions: 1K, 2K
  • Count: 4 images तक
  • डिफ़ॉल्ट operation timeout: 600 seconds, जब तक image_generate.timeoutMs या agents.defaults.imageGenerationModel.timeoutMs सेट न हो
OpenClaw xAI से b64_json image responses मांगता है ताकि generated media को सामान्य channel attachment path के माध्यम से stored और delivered किया जा सके। Local reference images data URLs में convert की जाती हैं; remote http(s) references pass through की जाती हैं।xAI को डिफ़ॉल्ट image provider के रूप में उपयोग करने के लिए:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "xai/grok-imagine-image",
      },
    },
  },
}
xAI quality, mask, user, और अतिरिक्त नेटिव अनुपातों को भी दस्तावेजीकृत करता है, जैसे 1:2, 2:1, 9:20, और 20:9। OpenClaw आज केवल साझा क्रॉस-प्रदाता इमेज नियंत्रणों को फॉरवर्ड करता है; असमर्थित केवल-नेटिव नॉब्स जानबूझकर image_generate के माध्यम से उजागर नहीं किए जाते।
बंडल किया गया xai Plugin साझा tts प्रदाता सतह के माध्यम से टेक्स्ट-से-स्पीच पंजीकृत करता है।
  • आवाज़ें: eve, ara, rex, sal, leo, una
  • डिफ़ॉल्ट आवाज़: eve
  • फ़ॉर्मैट: mp3, wav, pcm, mulaw, alaw
  • भाषा: BCP-47 कोड या auto
  • गति: प्रदाता-नेटिव गति ओवरराइड
  • नेटिव Opus वॉयस-नोट फ़ॉर्मैट समर्थित नहीं है
xAI को डिफ़ॉल्ट TTS प्रदाता के रूप में उपयोग करने के लिए:
{
  messages: {
    tts: {
      provider: "xai",
      providers: {
        xai: {
          speakerVoiceId: "eve",
        },
      },
    },
  },
}
OpenClaw xAI के बैच /v1/tts एंडपॉइंट का उपयोग करता है। xAI WebSocket पर स्ट्रीमिंग TTS भी प्रदान करता है, लेकिन OpenClaw स्पीच प्रदाता अनुबंध वर्तमान में उत्तर डिलीवरी से पहले पूर्ण ऑडियो बफ़र की अपेक्षा करता है।
बंडल किया गया xai Plugin OpenClaw की मीडिया-अंडरस्टैंडिंग ट्रांसक्रिप्शन सतह के माध्यम से बैच स्पीच-से-टेक्स्ट पंजीकृत करता है।
  • डिफ़ॉल्ट मॉडल: grok-stt
  • एंडपॉइंट: xAI REST /v1/stt
  • इनपुट पथ: multipart ऑडियो फ़ाइल अपलोड
  • जहाँ भी इनबाउंड ऑडियो ट्रांसक्रिप्शन tools.media.audio का उपयोग करता है, वहाँ OpenClaw द्वारा समर्थित, जिसमें Discord वॉइस-चैनल सेगमेंट और चैनल ऑडियो अटैचमेंट शामिल हैं
इनबाउंड ऑडियो ट्रांसक्रिप्शन के लिए xAI को बाध्य करने के लिए:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "xai",
            model: "grok-stt",
          },
        ],
      },
    },
  },
}
भाषा साझा ऑडियो मीडिया कॉन्फ़िग या प्रति-कॉल ट्रांसक्रिप्शन अनुरोध के माध्यम से दी जा सकती है। प्रॉम्प्ट संकेत साझा OpenClaw सतह द्वारा स्वीकार किए जाते हैं, लेकिन xAI REST STT इंटीग्रेशन केवल फ़ाइल, मॉडल, और भाषा को फॉरवर्ड करता है क्योंकि वे वर्तमान सार्वजनिक xAI एंडपॉइंट से साफ़ तौर पर मैप होते हैं।
बंडल किया गया xai Plugin लाइव वॉइस-कॉल ऑडियो के लिए एक रीयलटाइम ट्रांसक्रिप्शन प्रदाता भी पंजीकृत करता है।
  • एंडपॉइंट: xAI WebSocket wss://api.x.ai/v1/stt
  • डिफ़ॉल्ट एन्कोडिंग: mulaw
  • डिफ़ॉल्ट सैंपल दर: 8000
  • डिफ़ॉल्ट एंडपॉइंटिंग: 800ms
  • अंतरिम ट्रांसक्रिप्ट: डिफ़ॉल्ट रूप से सक्षम
Voice Call की Twilio मीडिया स्ट्रीम G.711 µ-law ऑडियो फ़्रेम भेजती है, इसलिए xAI प्रदाता उन फ़्रेमों को ट्रांसकोडिंग के बिना सीधे फॉरवर्ड कर सकता है:
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "xai",
            providers: {
              xai: {
                apiKey: "${XAI_API_KEY}",
                endpointingMs: 800,
                language: "en",
              },
            },
          },
        },
      },
    },
  },
}
प्रदाता-स्वामित्व वाला कॉन्फ़िग plugins.entries.voice-call.config.streaming.providers.xai के अंतर्गत रहता है। समर्थित कुंजियाँ apiKey, baseUrl, sampleRate, encoding (pcm, mulaw, या alaw), interimResults, endpointingMs, और language हैं।
यह स्ट्रीमिंग प्रदाता Voice Call के रीयलटाइम ट्रांसक्रिप्शन पथ के लिए है। Discord वॉइस वर्तमान में छोटे सेगमेंट रिकॉर्ड करता है और इसके बजाय बैच tools.media.audio ट्रांसक्रिप्शन पथ का उपयोग करता है।
बंडल किया गया xAI Plugin xAI के सैंडबॉक्स वातावरण में दूरस्थ कोड निष्पादन के लिए code_execution को OpenClaw टूल के रूप में उजागर करता है।कॉन्फ़िग पथ: plugins.entries.xai.config.codeExecution
कुंजीप्रकारडिफ़ॉल्टविवरण
enabledbooleantrue (यदि कुंजी उपलब्ध हो)कोड निष्पादन सक्षम या अक्षम करें
modelstringgrok-4-1-fastकोड निष्पादन अनुरोधों के लिए उपयोग किया गया मॉडल
maxTurnsnumber-अधिकतम बातचीत टर्न
timeoutSecondsnumber-सेकंड में अनुरोध टाइमआउट
यह दूरस्थ xAI सैंडबॉक्स निष्पादन है, स्थानीय exec नहीं।
{
  plugins: {
    entries: {
      xai: {
        config: {
          codeExecution: {
            enabled: true,
            model: "grok-4-1-fast",
          },
        },
      },
    },
  },
}
  • xAI प्रमाणीकरण API कुंजी, एनवायरनमेंट वैरिएबल, Plugin कॉन्फ़िग फ़ॉलबैक, या पात्र xAI खाते के साथ OAuth का उपयोग कर सकता है। OAuth localhost callback के बिना डिवाइस-कोड सत्यापन का उपयोग करता है। xAI तय करता है कि कौन से खाते OAuth API टोकन प्राप्त कर सकते हैं, और सहमति पृष्ठ Grok Build दिखा सकता है, भले ही OpenClaw को Grok Build ऐप की आवश्यकता नहीं है।
  • OpenClaw वर्तमान में xAI मल्टी-एजेंट मॉडल परिवार को उजागर नहीं करता। xAI इन मॉडलों को Responses API के माध्यम से सर्व करता है, लेकिन वे OpenClaw के साझा एजेंट लूप द्वारा उपयोग किए गए क्लाइंट-साइड या कस्टम टूल स्वीकार नहीं करते। देखें xAI मल्टी-एजेंट सीमाएँ.
  • xAI Realtime वॉइस अभी OpenClaw प्रदाता के रूप में पंजीकृत नहीं है। इसे बैच STT या स्ट्रीमिंग ट्रांसक्रिप्शन से अलग द्विदिश वॉइस सत्र अनुबंध चाहिए।
  • xAI इमेज quality, इमेज mask, और अतिरिक्त केवल-नेटिव आस्पेक्ट रेशियो तब तक उजागर नहीं किए जाते जब तक साझा image_generate टूल में संबंधित क्रॉस-प्रदाता नियंत्रण नहीं होते।
  • OpenClaw साझा रनर पथ पर xAI-विशिष्ट टूल-स्कीमा और टूल-कॉल संगतता सुधार स्वचालित रूप से लागू करता है।
  • नेटिव xAI अनुरोधों में डिफ़ॉल्ट tool_stream: true होता है। इसे अक्षम करने के लिए agents.defaults.models["xai/<model>"].params.tool_stream को false पर सेट करें।
  • बंडल किया गया xAI रैपर नेटिव xAI अनुरोध भेजने से पहले असमर्थित strict टूल-स्कीमा फ़्लैग और reasoning effort पेलोड कुंजियाँ हटा देता है। केवल grok-4.3 / grok-4.3-* कॉन्फ़िगर करने योग्य reasoning effort घोषित करते हैं; अन्य सभी reasoning-सक्षम xAI मॉडल फिर भी include: ["reasoning.encrypted_content"] का अनुरोध करते हैं ताकि पिछली एन्क्रिप्टेड reasoning को फ़ॉलो-अप टर्न पर फिर से चलाया जा सके।
  • web_search, x_search, और code_execution OpenClaw टूल के रूप में उजागर किए जाते हैं। OpenClaw हर चैट टर्न में सभी नेटिव टूल अटैच करने के बजाय प्रत्येक टूल अनुरोध के अंदर उसे चाहिए वह विशिष्ट xAI बिल्ट-इन सक्षम करता है।
  • Grok web_search plugins.entries.xai.config.webSearch.baseUrl पढ़ता है। x_search plugins.entries.xai.config.xSearch.baseUrl पढ़ता है, फिर Grok वेब-सर्च बेस URL पर फ़ॉलबैक करता है।
  • x_search और code_execution कोर मॉडल रनटाइम में हार्डकोड होने के बजाय बंडल किए गए xAI Plugin के स्वामित्व में हैं।
  • code_execution दूरस्थ xAI सैंडबॉक्स निष्पादन है, स्थानीय exec नहीं।

लाइव परीक्षण

xAI मीडिया पथ यूनिट परीक्षणों और ऑप्ट-इन लाइव सूट्स द्वारा कवर किए गए हैं। लाइव प्रोब चलाने से पहले प्रोसेस एनवायरनमेंट में XAI_API_KEY एक्सपोर्ट करें।
pnpm test extensions/xai
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.ts
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.ts
प्रदाता-विशिष्ट लाइव फ़ाइल सामान्य TTS, टेलीफ़ोनी-अनुकूल PCM TTS सिंथेसाइज़ करती है, xAI बैच STT के माध्यम से ऑडियो ट्रांसक्राइब करती है, उसी PCM को xAI रीयलटाइम STT के माध्यम से स्ट्रीम करती है, टेक्स्ट-से-इमेज आउटपुट जनरेट करती है, और संदर्भ इमेज संपादित करती है। साझा इमेज लाइव फ़ाइल OpenClaw के रनटाइम चयन, फ़ॉलबैक, सामान्यीकरण, और मीडिया अटैचमेंट पथ के माध्यम से उसी xAI प्रदाता की पुष्टि करती है।

संबंधित

मॉडल चयन

प्रदाता, मॉडल रेफ़, और फ़ेलओवर व्यवहार चुनना।

वीडियो जनरेशन

साझा वीडियो टूल पैरामीटर और प्रदाता चयन।

सभी प्रदाता

व्यापक प्रदाता अवलोकन।

समस्या निवारण

सामान्य समस्याएँ और सुधार।