Langsung ke konten utama

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

openclaw infer adalah permukaan headless kanonis untuk alur kerja inferensi yang didukung provider. Ini sengaja mengekspos keluarga kapabilitas, bukan nama RPC gateway mentah dan bukan id alat agent mentah.

Ubah infer menjadi kemampuan

Salin dan tempel ini ke agent:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.
Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.
Kemampuan berbasis infer yang baik harus:
  • memetakan niat pengguna umum ke subperintah infer yang benar
  • menyertakan beberapa contoh infer kanonis untuk alur kerja yang dicakupnya
  • mengutamakan openclaw infer ... dalam contoh dan saran
  • menghindari pendokumentasian ulang seluruh permukaan infer di dalam isi kemampuan
Cakupan kemampuan yang biasanya berfokus pada infer:
  • openclaw infer model run
  • openclaw infer image generate
  • openclaw infer audio transcribe
  • openclaw infer tts convert
  • openclaw infer web search
  • openclaw infer embedding create

Mengapa menggunakan infer

openclaw infer menyediakan satu CLI yang konsisten untuk tugas inferensi yang didukung provider di dalam OpenClaw. Manfaat:
  • Gunakan provider dan model yang sudah dikonfigurasi di OpenClaw alih-alih merangkai wrapper sekali pakai untuk setiap backend.
  • Pertahankan alur kerja model, gambar, transkripsi audio, TTS, video, web, dan embedding di bawah satu pohon perintah.
  • Gunakan bentuk output --json yang stabil untuk skrip, otomatisasi, dan alur kerja yang digerakkan agent.
  • Utamakan permukaan OpenClaw pihak pertama saat tugasnya pada dasarnya adalah “menjalankan inferensi.”
  • Gunakan jalur lokal normal tanpa memerlukan Gateway untuk sebagian besar perintah infer.
Untuk pemeriksaan provider end-to-end, utamakan openclaw infer ... setelah pengujian provider tingkat rendah sudah hijau. Ini menjalankan CLI yang dikirimkan, pemuatan config, resolusi agent default, aktivasi Plugin bawaan, dan runtime kapabilitas bersama sebelum permintaan provider dibuat.

Pohon perintah

 openclaw infer
  list
  inspect

  model
    run
    list
    inspect
    providers
    auth login
    auth logout
    auth status

  image
    generate
    edit
    describe
    describe-many
    providers

  audio
    transcribe
    providers

  tts
    convert
    voices
    providers
    status
    enable
    disable
    set-provider

  video
    generate
    describe
    providers

  web
    search
    fetch
    providers

  embedding
    create
    providers

Tugas umum

Tabel ini memetakan tugas inferensi umum ke perintah infer yang sesuai.
TugasPerintahCatatan
Jalankan prompt teks/modelopenclaw infer model run --prompt "..." --jsonMenggunakan jalur lokal normal secara default
Jalankan prompt model pada gambaropenclaw infer model run --prompt "Describe this" --file ./image.png --model provider/modelUlangi --file untuk beberapa input gambar
Buat gambaropenclaw infer image generate --prompt "..." --jsonGunakan image edit saat memulai dari file yang ada
Deskripsikan file gambaropenclaw infer image describe --file ./image.png --prompt "..." --json--model harus berupa <provider/model> yang mendukung gambar
Transkripsikan audioopenclaw infer audio transcribe --file ./memo.m4a --json--model harus berupa <provider/model>
Sintesis ucapanopenclaw infer tts convert --text "..." --output ./speech.mp3 --jsontts status berorientasi Gateway
Buat videoopenclaw infer video generate --prompt "..." --jsonMendukung petunjuk provider seperti --resolution
Deskripsikan file videoopenclaw infer video describe --file ./clip.mp4 --json--model harus berupa <provider/model>
Cari di webopenclaw infer web search --query "..." --json
Ambil halaman webopenclaw infer web fetch --url https://example.com --json
Buat embeddingopenclaw infer embedding create --text "..." --json

Perilaku

  • openclaw infer ... adalah permukaan CLI utama untuk alur kerja ini.
  • Gunakan --json saat output akan dikonsumsi oleh perintah atau skrip lain.
  • Gunakan --provider atau --model provider/model saat backend tertentu diperlukan.
  • Gunakan model run --thinking <level> untuk meneruskan tingkat berpikir/penalaran satu kali (off, minimal, low, medium, high, adaptive, xhigh, atau max) sambil menjaga run tetap mentah.
  • Untuk image describe, audio transcribe, dan video describe, --model harus menggunakan bentuk <provider/model>.
  • Untuk image describe, --model eksplisit menjalankan provider/model tersebut secara langsung. Model harus mendukung gambar di katalog model atau config provider. codex/<model> menjalankan giliran pemahaman gambar app-server Codex yang terbatas; openai-codex/<model> menggunakan jalur provider OAuth OpenAI Codex.
  • Perintah eksekusi stateless default ke lokal.
  • Perintah status yang dikelola Gateway default ke Gateway.
  • Jalur lokal normal tidak memerlukan Gateway berjalan.
  • model run lokal adalah completion provider satu kali yang ringan. Ini me-resolve model agent dan auth yang dikonfigurasi, tetapi tidak memulai giliran chat-agent, memuat alat, atau membuka server MCP bawaan.
  • model run --file menerima file gambar, mendeteksi tipe MIME-nya, dan mengirimkannya bersama prompt yang diberikan ke model yang dipilih. Ulangi --file untuk beberapa gambar.
  • model run --file menolak input non-gambar. Gunakan infer audio transcribe untuk file audio dan infer video describe untuk file video.
  • model run --gateway menjalankan routing Gateway, auth tersimpan, pemilihan provider, dan runtime tertanam, tetapi tetap berjalan sebagai probe model mentah: ini mengirim prompt yang diberikan dan lampiran gambar apa pun tanpa transkrip sesi sebelumnya, konteks bootstrap/AGENTS, perakitan context-engine, alat, atau server MCP bawaan.
  • model run --gateway --model <provider/model> memerlukan kredensial Gateway operator tepercaya karena permintaan meminta Gateway menjalankan override provider/model satu kali.
  • model run --thinking lokal menggunakan jalur provider-completion yang ringan; tingkat khusus provider seperti adaptive dan max dipetakan ke tingkat simple-completion portabel terdekat.

Model

Gunakan model untuk inferensi teks yang didukung provider dan inspeksi model/provider.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --json
openclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --json
openclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --json
openclaw infer model run --prompt "Use more reasoning here" --thinking high --json
openclaw infer model providers --json
openclaw infer model inspect --name gpt-5.5 --json
Gunakan ref lengkap <provider/model> untuk smoke-test provider tertentu tanpa memulai Gateway atau memuat seluruh permukaan alat agent:
openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json
Catatan:
  • model run lokal adalah smoke CLI paling sempit untuk kesehatan provider/model/auth karena, untuk provider non-Codex, ini hanya mengirim prompt yang diberikan ke model yang dipilih.
  • model run --model <provider/model> lokal dapat menggunakan baris katalog statis bawaan yang persis dari models list --all sebelum provider tersebut ditulis ke config. Auth provider tetap diperlukan; kredensial yang hilang gagal sebagai error auth, bukan Unknown model.
  • Untuk probe penalaran Mistral Medium 3.5, biarkan temperature tidak disetel/default. Mistral menolak reasoning_effort="high" plus temperature: 0; gunakan mistral/mistral-medium-3-5 dengan temperature default atau nilai mode penalaran non-nol seperti 0.7.
  • Probe lokal openai-codex/* adalah pengecualian sempit: OpenClaw menambahkan instruksi sistem minimal agar transport Codex Responses dapat mengisi field instructions yang diwajibkan, tanpa menambahkan konteks agent penuh, alat, memori, atau transkrip sesi.
  • model run --file lokal mempertahankan jalur ringan tersebut dan melampirkan konten gambar langsung ke satu pesan pengguna. File gambar umum seperti PNG, JPEG, dan WebP berfungsi saat tipe MIME-nya terdeteksi sebagai image/*; file yang tidak didukung atau tidak dikenali gagal sebelum provider dipanggil.
  • model run --file paling cocok saat Anda ingin menguji model teks multimodal yang dipilih secara langsung. Gunakan infer image describe saat Anda menginginkan pemilihan provider pemahaman gambar OpenClaw dan routing model gambar default.
  • Model yang dipilih harus mendukung input gambar; model khusus teks dapat menolak permintaan di lapisan provider.
  • model run --prompt harus berisi teks non-whitespace; prompt kosong ditolak sebelum provider lokal atau Gateway dipanggil.
  • model run lokal keluar non-nol saat provider tidak mengembalikan output teks, sehingga provider lokal yang tidak dapat dijangkau dan completion kosong tidak tampak seperti probe yang berhasil.
  • Gunakan model run --gateway saat Anda perlu menguji routing Gateway, penyiapan agent-runtime, atau status provider yang dikelola Gateway sambil menjaga input model tetap mentah. Gunakan openclaw agent atau permukaan chat saat Anda menginginkan konteks agent penuh, alat, memori, dan transkrip sesi.
  • model auth login, model auth logout, dan model auth status mengelola status auth provider yang disimpan.

Gambar

Gunakan image untuk pembuatan, edit, dan deskripsi.
openclaw infer image generate --prompt "friendly lobster illustration" --json
openclaw infer image generate --prompt "cinematic product photo of headphones" --json
openclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --json
openclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --json
openclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --json
openclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --json
openclaw infer image describe --file ./photo.jpg --json
openclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --json
openclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --json
openclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --json
openclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json
Catatan:
  • Gunakan image edit saat memulai dari file input yang sudah ada.
  • Gunakan --size, --aspect-ratio, atau --resolution dengan image edit untuk penyedia/model yang mendukung petunjuk geometri pada pengeditan gambar referensi.
  • Gunakan --output-format png --background transparent dengan --model openai/gpt-image-1.5 untuk output PNG OpenAI berlatar belakang transparan; --openai-background tetap tersedia sebagai alias khusus OpenAI. Penyedia yang tidak mendeklarasikan dukungan latar belakang melaporkan petunjuk tersebut sebagai override yang diabaikan.
  • Gunakan image providers --json untuk memverifikasi penyedia gambar bawaan mana yang dapat ditemukan, dikonfigurasi, dipilih, dan kapabilitas pembuatan/pengeditan mana yang diekspos oleh tiap penyedia.
  • Gunakan image generate --model <provider/model> --json sebagai smoke CLI live paling sempit untuk perubahan pembuatan gambar. Contoh:
    openclaw infer image providers --json
    openclaw infer image generate \
      --model google/gemini-3.1-flash-image-preview \
      --prompt "Minimal flat test image: one blue square on a white background, no text." \
      --output ./openclaw-infer-image-smoke.png \
      --json
    
    Respons JSON melaporkan ok, provider, model, attempts, dan jalur output yang ditulis. Saat --output ditetapkan, ekstensi akhir dapat mengikuti jenis MIME yang dikembalikan penyedia.
  • Untuk image describe dan image describe-many, gunakan --prompt untuk memberi model visi instruksi khusus tugas seperti OCR, perbandingan, inspeksi UI, atau pembuatan keterangan ringkas.
  • Gunakan --timeout-ms dengan model visi lokal yang lambat atau start Ollama yang dingin.
  • Untuk image describe, --model harus berupa <provider/model> yang mendukung gambar.
  • Untuk model visi Ollama lokal, tarik model terlebih dahulu dan tetapkan OLLAMA_API_KEY ke nilai placeholder apa pun, misalnya ollama-local. Lihat Ollama.

Audio

Gunakan audio untuk transkripsi file.
openclaw infer audio transcribe --file ./memo.m4a --json
openclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --json
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json
Catatan:
  • audio transcribe digunakan untuk transkripsi file, bukan manajemen sesi realtime.
  • --model harus berupa <provider/model>.

TTS

Gunakan tts untuk sintesis ucapan dan status penyedia TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --json
openclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --json
openclaw infer tts providers --json
openclaw infer tts status --json
Catatan:
  • tts status default ke Gateway karena mencerminkan status TTS yang dikelola Gateway.
  • Gunakan tts providers, tts voices, dan tts set-provider untuk memeriksa dan mengonfigurasi perilaku TTS.

Video

Gunakan video untuk pembuatan dan deskripsi.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --json
openclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --json
openclaw infer video describe --file ./clip.mp4 --json
openclaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json
Catatan:
  • video generate menerima --size, --aspect-ratio, --resolution, --duration, --audio, --watermark, dan --timeout-ms serta meneruskannya ke runtime pembuatan video.
  • --model harus berupa <provider/model> untuk video describe.

Web

Gunakan web untuk alur kerja pencarian dan pengambilan.
openclaw infer web search --query "OpenClaw docs" --json
openclaw infer web search --query "OpenClaw infer web providers" --json
openclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --json
openclaw infer web providers --json
Catatan:
  • Gunakan web providers untuk memeriksa penyedia yang tersedia, dikonfigurasi, dan dipilih.

Embedding

Gunakan embedding untuk pembuatan vektor dan pemeriksaan penyedia embedding.
openclaw infer embedding create --text "friendly lobster" --json
openclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --json
openclaw infer embedding providers --json

Output JSON

Perintah infer menormalkan output JSON di bawah amplop bersama:
{
  "ok": true,
  "capability": "image.generate",
  "transport": "local",
  "provider": "openai",
  "model": "gpt-image-2",
  "attempts": [],
  "outputs": []
}
Kolom tingkat atas stabil:
  • ok
  • capability
  • transport
  • provider
  • model
  • attempts
  • outputs
  • error
Untuk perintah media yang dihasilkan, outputs berisi file yang ditulis oleh OpenClaw. Gunakan path, mimeType, size, dan dimensi khusus media apa pun dalam array tersebut untuk otomasi alih-alih mengurai stdout yang dapat dibaca manusia.

Kesalahan umum

# Bad
openclaw infer media image generate --prompt "friendly lobster"

# Good
openclaw infer image generate --prompt "friendly lobster"
# Bad
openclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json

# Good
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Catatan

  • openclaw capability ... adalah alias untuk openclaw infer ....

Terkait