छवि निर्माण

image_generate टूल एजेंट को आपके कॉन्फ़िगर किए गए प्रदाताओं का उपयोग करके इमेज बनाने और संपादित करने देता है। चैट सत्रों में, इमेज जनरेशन असिंक्रोनस रूप से चलता है: OpenClaw एक पृष्ठभूमि कार्य दर्ज करता है, कार्य id तुरंत लौटाता है, और प्रदाता के पूरा होने पर एजेंट को जगाता है। पूर्णता एजेंट सत्र के सामान्य दृश्यमान-उत्तर मोड का पालन करता है: कॉन्फ़िगर होने पर स्वचालित अंतिम उत्तर डिलीवरी, या जब सत्र को message टूल की आवश्यकता हो तब message(action="send")। यदि अनुरोधकर्ता सत्र निष्क्रिय है या उसका सक्रिय वेक विफल हो जाता है, और कुछ जेनरेट की गई इमेज अभी भी पूर्णता उत्तर से गायब हैं, तो OpenClaw केवल गायब इमेज के साथ एक idempotent प्रत्यक्ष fallback भेजता है।

यह टूल केवल तब दिखाई देता है जब कम से कम एक इमेज-जनरेशन प्रदाता उपलब्ध हो। यदि आपको अपने एजेंट के टूल में image_generate नहीं दिखता, तो agents.defaults.imageGenerationModel कॉन्फ़िगर करें, प्रदाता API key सेट करें, या OpenAI ChatGPT/Codex OAuth से साइन इन करें।

त्वरित शुरुआत

Configure auth

कम से कम एक प्रदाता के लिए API key सेट करें (उदाहरण के लिए OPENAI_API_KEY, GEMINI_API_KEY, OPENROUTER_API_KEY) या OpenAI Codex OAuth से साइन इन करें।

Pick a default model (optional)

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
      },
    },
  },
}

ChatGPT/Codex OAuth उसी openai/gpt-image-2 मॉडल संदर्भ का उपयोग करता है। जब कोई openai OAuth प्रोफ़ाइल कॉन्फ़िगर होती है, तो OpenClaw पहले OPENAI_API_KEY आज़माने के बजाय उस OAuth प्रोफ़ाइल के माध्यम से इमेज अनुरोध रूट करता है। स्पष्ट models.providers.openai कॉन्फ़िगरेशन (API key, custom/Azure base URL) प्रत्यक्ष OpenAI Images API रूट में वापस opt in करता है।

Ask the agent

“एक दोस्ताना रोबोट mascot की इमेज जेनरेट करें।”एजेंट स्वतः image_generate कॉल करता है। किसी टूल allow-listing की आवश्यकता नहीं - प्रदाता उपलब्ध होने पर यह डिफ़ॉल्ट रूप से सक्षम होता है। टूल एक पृष्ठभूमि कार्य id लौटाता है, फिर तैयार होने पर पूर्णता एजेंट message टूल के माध्यम से जेनरेट किया गया attachment भेजता है।

LocalAI जैसे OpenAI-संगत LAN endpoints के लिए, custom models.providers.openai.baseUrl रखें और browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true के साथ स्पष्ट रूप से opt in करें। निजी और आंतरिक इमेज endpoints डिफ़ॉल्ट रूप से अवरुद्ध रहते हैं।

सामान्य रूट

लक्ष्य	मॉडल संदर्भ	प्रमाणीकरण
API billing के साथ OpenAI इमेज जनरेशन	`openai/gpt-image-2`	`OPENAI_API_KEY`
Codex subscription auth के साथ OpenAI इमेज जनरेशन	`openai/gpt-image-2`	OpenAI ChatGPT/Codex OAuth
OpenAI पारदर्शी-background PNG/WebP	`openai/gpt-image-1.5`	`OPENAI_API_KEY` या OpenAI Codex OAuth
DeepInfra इमेज जनरेशन	`deepinfra/black-forest-labs/FLUX-1-schnell`	`DEEPINFRA_API_KEY`
fal Krea 2 अभिव्यंजक/style-directed जनरेशन	`fal/krea/v2/medium/text-to-image`	`FAL_KEY`
OpenRouter इमेज जनरेशन	`openrouter/google/gemini-3.1-flash-image-preview`	`OPENROUTER_API_KEY`
LiteLLM इमेज जनरेशन	`litellm/gpt-image-2`	`LITELLM_API_KEY`
Microsoft Foundry MAI इमेज जनरेशन	`microsoft-foundry/<deployment-name>`	`AZURE_OPENAI_API_KEY` या Entra ID
Google Gemini इमेज जनरेशन	`google/gemini-3.1-flash-image-preview`	`GEMINI_API_KEY` या `GOOGLE_API_KEY`

वही image_generate टूल text-to-image और reference-image संपादन संभालता है। एक संदर्भ के लिए image या कई संदर्भों के लिए images का उपयोग करें। fal पर Krea 2 मॉडल के लिए, वे संदर्भ edit inputs के बजाय style references के रूप में भेजे जाते हैं। प्रदाता-समर्थित output hints जैसे quality, outputFormat, और background उपलब्ध होने पर आगे भेजे जाते हैं और जब कोई प्रदाता उनका समर्थन नहीं करता तो ignored के रूप में रिपोर्ट किए जाते हैं। Bundled पारदर्शी-background समर्थन OpenAI-विशिष्ट है; अन्य प्रदाता तब भी PNG alpha बनाए रख सकते हैं यदि उनका backend उसे emit करता है।

समर्थित प्रदाता

प्रदाता	डिफ़ॉल्ट मॉडल	संपादन समर्थन	प्रमाणीकरण
ComfyUI	`workflow`	हाँ (1 इमेज, workflow-configured)	cloud के लिए `COMFY_API_KEY` या `COMFY_CLOUD_API_KEY`
DeepInfra	`black-forest-labs/FLUX-1-schnell`	हाँ (1 इमेज)	`DEEPINFRA_API_KEY`
fal	`fal-ai/flux/dev`	हाँ (model-specific सीमाएँ)	`FAL_KEY`
Google	`gemini-3.1-flash-image-preview`	हाँ	`GEMINI_API_KEY` या `GOOGLE_API_KEY`
LiteLLM	`gpt-image-2`	हाँ (अधिकतम 5 input images)	`LITELLM_API_KEY`
Microsoft Foundry	`<deployment-name>`	हाँ (केवल MAI-Image-2.5 मॉडल)	`AZURE_OPENAI_API_KEY` या Entra ID (`az login`)
MiniMax	`image-01`	हाँ (subject reference)	`MINIMAX_API_KEY` या MiniMax OAuth (`minimax-portal`)
OpenAI	`gpt-image-2`	हाँ (अधिकतम 4 इमेज)	`OPENAI_API_KEY` या OpenAI ChatGPT/Codex OAuth
OpenRouter	`google/gemini-3.1-flash-image-preview`	हाँ (अधिकतम 5 input images)	`OPENROUTER_API_KEY`
Vydra	`grok-imagine`	नहीं	`VYDRA_API_KEY`
xAI	`grok-imagine-image`	हाँ (अधिकतम 5 इमेज)	`XAI_API_KEY`

runtime पर उपलब्ध प्रदाताओं और मॉडलों को देखने के लिए action: "list" का उपयोग करें:

/tool image_generate action=list

वर्तमान सत्र के लिए सक्रिय इमेज-जनरेशन कार्य देखने के लिए action: "status" का उपयोग करें:

/tool image_generate action=status

प्रदाता क्षमताएँ

क्षमता	ComfyUI	DeepInfra	fal	Google	Microsoft Foundry	MiniMax	OpenAI	Vydra	xAI
जेनरेट करें (अधिकतम संख्या)	Workflow-defined	4	4	4	1	9	4	1	4
संपादन / संदर्भ	1 इमेज (workflow)	1 इमेज	Flux: 1; GPT: 10; Krea style refs: 10; NB2: 14	अधिकतम 5 इमेज	1 इमेज	1 इमेज (subject ref)	अधिकतम 5 इमेज	-	अधिकतम 5 इमेज
आकार नियंत्रण	-	✓	✓	✓	✓	-	अधिकतम 4K	-	-
Aspect ratio	-	-	✓	✓	-	✓	-	-	✓
Resolution (1K/2K/4K)	-	-	✓	✓	-	-	-	-	1K, 2K

टूल पैरामीटर

prompt

string

आवश्यक

इमेज जनरेशन prompt। action: "generate" के लिए आवश्यक।

action

"generate" | "status" | "list"

डिफ़ॉल्ट:"generate"

सक्रिय सत्र कार्य देखने के लिए "status" या runtime पर उपलब्ध प्रदाताओं और मॉडलों को देखने के लिए "list" का उपयोग करें।

model

string

प्रदाता/मॉडल override (जैसे openai/gpt-image-2)। पारदर्शी OpenAI backgrounds के लिए openai/gpt-image-1.5 का उपयोग करें।

image

string

edit mode के लिए एकल reference image path या URL।

images

string[]

edit mode या style-reference मॉडल के लिए कई reference images (shared tool के माध्यम से अधिकतम 10; प्रदाता-विशिष्ट सीमाएँ फिर भी लागू होती हैं)।

size

string

Size hint: 1024x1024, 1536x1024, 1024x1536, 2048x2048, 3840x2160।

aspectRatio

string

Aspect ratio: 1:1, 2:3, 3:2, 2.35:1, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, 4:1, 1:4, 8:1, 1:8। प्रदाता अपने model-specific subset को validate करते हैं।

resolution

"1K" | "2K" | "4K"

Resolution hint।

quality

"low" | "medium" | "high" | "auto"

जब प्रदाता इसका समर्थन करता है तब quality hint।

outputFormat

"png" | "jpeg" | "webp"

जब प्रदाता इसका समर्थन करता है तब output format hint।

background

"transparent" | "opaque" | "auto"

जब प्रदाता इसका समर्थन करता है तब background hint। transparency-capable प्रदाताओं के लिए outputFormat: "png" या "webp" के साथ transparent का उपयोग करें।

count

number

जेनरेट की जाने वाली इमेज की संख्या (1-4)।

timeoutMs

number

मिलीसेकंड में वैकल्पिक प्रदाता अनुरोध timeout। जब Codex dynamic tools के माध्यम से image_generate कॉल करता है, तब भी यह per-call value कॉन्फ़िगर किए गए डिफ़ॉल्ट को override करती है और 600000 ms पर capped होती है।

filename

string

Output filename hint।

openai

object

केवल-OpenAI hints: background, moderation, outputCompression, और user।

fal.creativity

"raw" | "low" | "medium" | "high"

fal Krea 2 creativity control। डिफ़ॉल्ट medium है।

सभी प्रदाता सभी पैरामीटर का समर्थन नहीं करते। जब fallback प्रदाता सटीक अनुरोधित विकल्प के बजाय निकटतम geometry option का समर्थन करता है, तो OpenClaw submission से पहले सबसे निकट समर्थित size, aspect ratio, या resolution पर remap करता है। Unsupported output hints उन प्रदाताओं के लिए dropped किए जाते हैं जो समर्थन घोषित नहीं करते और tool result में रिपोर्ट किए जाते हैं। Tool results लागू settings रिपोर्ट करते हैं; details.normalization requested-to-applied translation को capture करता है।

कॉन्फ़िगरेशन

मॉडल चयन

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openai/gpt-image-2",
        timeoutMs: 180_000,
        fallbacks: [
          "openrouter/google/gemini-3.1-flash-image-preview",
          "google/gemini-3.1-flash-image-preview",
          "fal/fal-ai/flux/dev",
        ],
      },
    },
  },
}

प्रदाता चयन क्रम

OpenClaw प्रदाताओं को इस क्रम में आज़माता है:

टूल कॉल से model पैरामीटर (यदि एजेंट कोई निर्दिष्ट करता है)।
कॉन्फिग से imageGenerationModel.primary।
क्रम में imageGenerationModel.fallbacks।
स्वतः-पहचान - केवल प्रमाणीकरण-समर्थित प्रदाता डिफॉल्ट:
- पहले वर्तमान डिफॉल्ट प्रदाता;
- बाकी पंजीकृत इमेज-जनरेशन प्रदाता, प्रदाता-id क्रम में।

यदि कोई प्रदाता विफल होता है (प्रमाणीकरण त्रुटि, दर सीमा, आदि), तो अगला कॉन्फिगर किया गया उम्मीदवार अपने आप आजमाया जाता है। यदि सभी विफल होते हैं, तो त्रुटि में प्रत्येक प्रयास के विवरण शामिल होते हैं।

प्रति-कॉल मॉडल ओवरराइड सटीक होते हैं

प्रति-कॉल model ओवरराइड केवल उसी प्रदाता/मॉडल को आजमाता है और कॉन्फिगर किए गए primary/fallback या स्वतः-पहचाने गए प्रदाताओं पर आगे नहीं बढ़ता।

स्वतः-पहचान प्रमाणीकरण-सचेत है

कोई प्रदाता डिफॉल्ट उम्मीदवार सूची में केवल तब आता है जब OpenClaw उस प्रदाता को वास्तव में प्रमाणित कर सकता है। केवल स्पष्ट model, primary, और fallbacks प्रविष्टियों का उपयोग करने के लिए agents.defaults.mediaGenerationAutoProviderFallback: false सेट करें।

टाइमआउट

धीमे इमेज बैकएंड के लिए agents.defaults.imageGenerationModel.timeoutMs सेट करें। प्रति-कॉल timeoutMs टूल पैरामीटर कॉन्फिगर किए गए डिफॉल्ट को ओवरराइड करता है, और कॉन्फिगर किए गए डिफॉल्ट plugin-लेखित प्रदाता डिफॉल्ट को ओवरराइड करते हैं। Google और OpenRouter होस्टेड इमेज प्रदाता 180 सेकंड के डिफॉल्ट का उपयोग करते हैं; Microsoft Foundry MAI, xAI, और Azure OpenAI इमेज जनरेशन 600 सेकंड का उपयोग करते हैं। Codex डायनेमिक-टूल कॉल 120 सेकंड के image_generate ब्रिज डिफॉल्ट का उपयोग करते हैं और कॉन्फिगर होने पर वही टाइमआउट बजट मानते हैं, जो OpenClaw के 600000 ms डायनेमिक-टूल ब्रिज अधिकतम से सीमित होता है।

रनटाइम पर निरीक्षण करें

वर्तमान में पंजीकृत प्रदाताओं, उनके डिफॉल्ट मॉडलों, और प्रमाणीकरण env-var संकेतों का निरीक्षण करने के लिए action: "list" का उपयोग करें।

इमेज संपादन

OpenAI, OpenRouter, Google, DeepInfra, fal, Microsoft Foundry, MiniMax, ComfyUI, और xAI संदर्भ इमेज संपादित करने का समर्थन करते हैं। fal पर Krea 2 मॉडल संपादन इनपुट के बजाय स्टाइल संदर्भों के रूप में वही image / images फील्ड उपयोग करते हैं। एक संदर्भ इमेज पथ या URL दें:

"Generate a watercolor version of this photo" + image: "/path/to/photo.jpg"

OpenAI, OpenRouter, Google, और xAI images पैरामीटर के जरिए 5 तक संदर्भ इमेज का समर्थन करते हैं। fal Flux image-to-image के लिए 1 संदर्भ इमेज, GPT Image 2 संपादनों के लिए 10 तक, Krea 2 के लिए 10 तक स्टाइल संदर्भ, और Nano Banana 2 संपादनों के लिए 14 तक समर्थन करता है। Microsoft Foundry, MiniMax, और ComfyUI 1 का समर्थन करते हैं।

प्रदाता की गहन जानकारी

OpenAI gpt-image-2 (और gpt-image-1.5)

OpenAI इमेज जनरेशन का डिफॉल्ट openai/gpt-image-2 है। यदि कोई openai OAuth प्रोफाइल कॉन्फिगर है, तो OpenClaw वही OAuth प्रोफाइल फिर से उपयोग करता है जो Codex सब्सक्रिप्शन चैट मॉडलों द्वारा उपयोग किया जाता है और इमेज अनुरोध को Codex Responses बैकएंड के जरिए भेजता है। पुराने Codex बेस URL जैसे https://chatgpt.com/backend-api को इमेज अनुरोधों के लिए https://chatgpt.com/backend-api/codex में canonicalize किया जाता है। OpenClaw उस अनुरोध के लिए चुपचाप OPENAI_API_KEY पर fallback नहीं करता - सीधे OpenAI Images API रूटिंग को बाध्य करने के लिए, models.providers.openai को API key, कस्टम बेस URL, या Azure endpoint के साथ स्पष्ट रूप से कॉन्फिगर करें।openai/gpt-image-1.5, openai/gpt-image-1, और openai/gpt-image-1-mini मॉडल अब भी स्पष्ट रूप से चुने जा सकते हैं। पारदर्शी-background PNG/WebP आउटपुट के लिए gpt-image-1.5 का उपयोग करें; वर्तमान gpt-image-2 API background: "transparent" को अस्वीकार करता है।gpt-image-2 एक ही image_generate टूल के जरिए text-to-image जनरेशन और संदर्भ-इमेज संपादन दोनों का समर्थन करता है। OpenClaw prompt, count, size, quality, outputFormat, और संदर्भ इमेज OpenAI को अग्रेषित करता है। OpenAI को aspectRatio या resolution सीधे नहीं मिलते; जब संभव हो, OpenClaw उन्हें समर्थित size में मैप करता है, अन्यथा टूल उन्हें अनदेखे ओवरराइड के रूप में रिपोर्ट करता है।OpenAI-विशिष्ट विकल्प openai ऑब्जेक्ट के अंतर्गत रहते हैं:

{
  "quality": "low",
  "outputFormat": "jpeg",
  "openai": {
    "background": "opaque",
    "moderation": "low",
    "outputCompression": 60,
    "user": "end-user-42"
  }
}

openai.background transparent, opaque, या auto स्वीकार करता है; पारदर्शी आउटपुट के लिए outputFormat png या webp और पारदर्शिता-सक्षम OpenAI इमेज मॉडल चाहिए। OpenClaw डिफॉल्ट gpt-image-2 पारदर्शी-background अनुरोधों को gpt-image-1.5 पर रूट करता है। openai.outputCompression JPEG/WebP आउटपुट पर लागू होता है और PNG आउटपुट के लिए अनदेखा किया जाता है।शीर्ष-स्तरीय background संकेत प्रदाता-तटस्थ है और वर्तमान में OpenAI प्रदाता चुने जाने पर उसी OpenAI background अनुरोध फील्ड पर मैप होता है। जो प्रदाता background समर्थन घोषित नहीं करते, वे असमर्थित पैरामीटर प्राप्त करने के बजाय इसे ignoredOverrides में लौटाते हैं।api.openai.com के बजाय Azure OpenAI deployment के जरिए OpenAI इमेज जनरेशन रूट करने के लिए, Azure OpenAI endpoints देखें।

Microsoft Foundry MAI इमेज मॉडल

Microsoft Foundry इमेज जनरेशन microsoft-foundry/ प्रदाता prefix के अंतर्गत deploy किए गए MAI इमेज deployment नामों का उपयोग करता है। कोई प्रदाता-स्तर डिफॉल्ट मॉडल नहीं है क्योंकि MAI API model फील्ड में आपके deployment नाम की अपेक्षा करता है:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "microsoft-foundry/<deployment-name>",
        timeoutMs: 600_000,
      },
    },
  },
}

प्रदाता OpenAI Images API नहीं, बल्कि Microsoft Foundry की MAI API का उपयोग करता है:

जनरेशन endpoint: /mai/v1/images/generations
संपादन endpoint: /mai/v1/images/edits
प्रमाणीकरण: AZURE_OPENAI_API_KEY / प्रदाता API key, या az login के जरिए Entra ID
आउटपुट: एक PNG इमेज
आकार: डिफॉल्ट 1024x1024; चौड़ाई और ऊंचाई प्रत्येक कम से कम 768 px होनी चाहिए, और कुल पिक्सेल अधिकतम 1,048,576 होने चाहिए
संपादन: एक PNG या JPEG संदर्भ इमेज, केवल MAI-Image-2.5-Flash और MAI-Image-2.5 deployments द्वारा समर्थित

केवल-prompt जनरेशन केवल Foundry endpoint कॉन्फिगर करके कस्टम deployment नाम का उपयोग कर सकता है। कस्टम deployment नामों के साथ संपादन के लिए onboarding/model metadata चाहिए ताकि OpenClaw सत्यापित कर सके कि deployment MAI-Image-2.5-Flash या MAI-Image-2.5 द्वारा समर्थित है।वर्तमान MAI इमेज मॉडल MAI-Image-2.5-Flash, MAI-Image-2.5, MAI-Image-2e, और MAI-Image-2 हैं। सेटअप और chat-model व्यवहार के लिए Microsoft Foundry plugin देखें।

OpenRouter इमेज मॉडल

OpenRouter इमेज जनरेशन वही OPENROUTER_API_KEY उपयोग करता है और OpenRouter की chat completions image API के जरिए रूट करता है। openrouter/ prefix के साथ OpenRouter इमेज मॉडल चुनें:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "openrouter/google/gemini-3.1-flash-image-preview",
      },
    },
  },
}

OpenClaw prompt, count, संदर्भ इमेज, और Gemini-संगत aspectRatio / resolution संकेत OpenRouter को अग्रेषित करता है। वर्तमान built-in OpenRouter इमेज मॉडल shortcuts में google/gemini-3.1-flash-image-preview, google/gemini-3-pro-image-preview, और openai/gpt-5.4-image-2 शामिल हैं। आपके कॉन्फिगर किए गए plugin क्या expose करता है, यह देखने के लिए action: "list" का उपयोग करें।

fal Krea 2

fal पर Krea 2 मॉडल Flux द्वारा उपयोग किए गए generic image_size schema के बजाय fal के native Krea schema का उपयोग करते हैं। OpenClaw भेजता है:

aspect-ratio संकेतों के लिए aspect_ratio
creativity, जिसका डिफॉल्ट medium है
image या images दिए जाने पर image_style_references

तेज expressive illustration के लिए Krea 2 Medium और धीमे, अधिक विस्तृत photoreal और textured looks के लिए Krea 2 Large चुनें:

{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "fal/krea/v2/medium/text-to-image",
      },
    },
  },
}

Krea 2 वर्तमान में प्रति अनुरोध एक इमेज लौटाता है। Krea के लिए aspectRatio को प्राथमिकता दें; OpenClaw size को निकटतम समर्थित Krea aspect ratio पर मैप करता है और Krea के लिए resolution को छोड़ने के बजाय अस्वीकार करता है। जब आप native Krea creativity level चाहते हैं, तो fal.creativity का उपयोग करें:

{
  "model": "fal/krea/v2/medium/text-to-image",
  "prompt": "A cyber zine portrait with risograph texture",
  "aspectRatio": "9:16",
  "fal": {
    "creativity": "high"
  }
}

MiniMax dual-auth

MiniMax इमेज जनरेशन दोनों bundled MiniMax प्रमाणीकरण पथों के जरिए उपलब्ध है:

API-key setups के लिए minimax/image-01
OAuth setups के लिए minimax-portal/image-01

xAI grok-imagine-image

bundled xAI प्रदाता prompt-only अनुरोधों के लिए /v1/images/generations और image या images मौजूद होने पर /v1/images/edits का उपयोग करता है।

मॉडल: xai/grok-imagine-image, xai/grok-imagine-image-quality
संख्या: 4 तक
संदर्भ: एक image या पांच तक images
Aspect ratios: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
Resolutions: 1K, 2K
आउटपुट: OpenClaw-प्रबंधित इमेज attachments के रूप में लौटाए जाते हैं

OpenClaw जानबूझकर xAI-native quality, mask, user, या अतिरिक्त native-only aspect ratios expose नहीं करता, जब तक वे controls shared cross-provider image_generate contract में मौजूद नहीं होते।

उदाहरण

/tool image_generate action=generate model=openai/gpt-image-2 prompt="A clean editorial poster for OpenClaw image generation" size=3840x2160 count=1

/tool image_generate action=generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent

समतुल्य CLI:

openclaw infer image generate \
  --model openai/gpt-image-1.5 \
  --output-format png \
  --background transparent \
  --prompt "A simple red circle sticker on a transparent background" \
  --json

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Low-cost draft poster for a quiet productivity app" quality=low openai='{"moderation":"low"}'

समतुल्य CLI:

openclaw infer image generate \
  --model openai/gpt-image-2 \
  --quality low \
  --openai-moderation low \
  --prompt "Low-cost draft poster for a quiet productivity app" \
  --json

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Two visual directions for a calm productivity app icon" size=1024x1024 count=2

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Keep the subject, replace the background with a bright studio setup" image=/path/to/reference.png size=1024x1536

/tool image_generate action=generate model=openai/gpt-image-2 prompt="Combine the character identity from the first image with the color palette from the second" images='["/path/to/character.png","/path/to/palette.jpg"]' size=1536x1024

/tool image_generate action=generate model=fal/krea/v2/medium/text-to-image prompt="An expressive editorial portrait using this color palette and print texture" images='["/path/to/palette.png","/path/to/texture.jpg"]' aspectRatio=9:16 fal='{"creativity":"high"}'

यही --output-format, --background, --quality, और --openai-moderation फ्लैग openclaw infer image edit पर उपलब्ध हैं; --openai-background OpenAI-विशिष्ट उपनाम के रूप में बना रहता है। OpenAI के अलावा बंडल किए गए प्रदाता आज स्पष्ट background नियंत्रण घोषित नहीं करते, इसलिए background: "transparent" उनके लिए अनदेखा किया गया रिपोर्ट होता है।

​त्वरित शुरुआत

​सामान्य रूट

​समर्थित प्रदाता

​प्रदाता क्षमताएँ

​टूल पैरामीटर

​कॉन्फ़िगरेशन

​मॉडल चयन

​प्रदाता चयन क्रम

​इमेज संपादन

​प्रदाता की गहन जानकारी

​उदाहरण

​संबंधित

त्वरित शुरुआत

सामान्य रूट

समर्थित प्रदाता

प्रदाता क्षमताएँ

टूल पैरामीटर

कॉन्फ़िगरेशन

मॉडल चयन

प्रदाता चयन क्रम

इमेज संपादन

प्रदाता की गहन जानकारी

उदाहरण

संबंधित