CLI Inferensi - OpenClaw

openclaw infer adalah permukaan headless kanonis untuk alur kerja inferensi yang didukung penyedia. Ini sengaja mengekspos keluarga kapabilitas, bukan nama RPC gateway mentah dan bukan id tool agen mentah.

Ubah infer menjadi Skill

Salin dan tempel ini ke agen:

Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.
Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

Skill berbasis infer yang baik sebaiknya:

memetakan niat umum pengguna ke subperintah infer yang benar
menyertakan beberapa contoh infer kanonis untuk alur kerja yang dicakupnya
mengutamakan openclaw infer ... dalam contoh dan saran
menghindari pendokumentasian ulang seluruh permukaan infer di dalam isi Skill

Cakupan Skill yang biasanya berfokus pada infer:

openclaw infer model run
openclaw infer image generate
openclaw infer audio transcribe
openclaw infer tts convert
openclaw infer web search
openclaw infer embedding create

Mengapa menggunakan infer

openclaw infer menyediakan satu CLI yang konsisten untuk tugas inferensi yang didukung penyedia di dalam OpenClaw. Manfaat:

Gunakan penyedia dan model yang sudah dikonfigurasi di OpenClaw alih-alih merangkai wrapper sekali pakai untuk setiap backend.
Pertahankan alur kerja model, gambar, transkripsi audio, TTS, video, web, dan embedding di bawah satu pohon perintah.
Gunakan bentuk keluaran --json yang stabil untuk skrip, otomatisasi, dan alur kerja yang digerakkan agen.
Utamakan permukaan pihak pertama OpenClaw saat tugasnya pada dasarnya adalah “menjalankan inferensi.”
Gunakan jalur lokal normal tanpa memerlukan gateway untuk sebagian besar perintah infer.

Untuk pemeriksaan penyedia end-to-end, utamakan openclaw infer ... setelah pengujian penyedia tingkat lebih rendah sudah hijau. Ini menguji CLI yang dikirimkan, pemuatan konfigurasi, resolusi agen default, aktivasi Plugin bawaan, dan runtime kapabilitas bersama sebelum permintaan penyedia dibuat.

Pohon perintah

 openclaw infer
  list
  inspect

  model
    run
    list
    inspect
    providers
    auth login
    auth logout
    auth status

  image
    generate
    edit
    describe
    describe-many
    providers

  audio
    transcribe
    providers

  tts
    convert
    voices
    providers
    status
    enable
    disable
    set-provider

  video
    generate
    describe
    providers

  web
    search
    fetch
    providers

  embedding
    create
    providers

Tugas umum

Tabel ini memetakan tugas inferensi umum ke perintah infer yang sesuai.

Tugas	Perintah	Catatan
Jalankan prompt teks/model	`openclaw infer model run --prompt "..." --json`	Menggunakan jalur lokal normal secara default
Jalankan prompt model pada gambar	`openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model`	Ulangi `--file` untuk beberapa input gambar
Hasilkan gambar	`openclaw infer image generate --prompt "..." --json`	Gunakan `image edit` saat memulai dari file yang ada
Deskripsikan file gambar atau URL	`openclaw infer image describe --file ./image.png --prompt "..." --json`	`--model` harus berupa `<provider/model>` yang mendukung gambar
Transkripsikan audio	`openclaw infer audio transcribe --file ./memo.m4a --json`	`--model` harus berupa `<provider/model>`
Sintesis ucapan	`openclaw infer tts convert --text "..." --output ./speech.mp3 --json`	`tts status` berorientasi Gateway
Hasilkan video	`openclaw infer video generate --prompt "..." --json`	Mendukung petunjuk penyedia seperti `--resolution`
Deskripsikan file video	`openclaw infer video describe --file ./clip.mp4 --json`	`--model` harus berupa `<provider/model>`
Cari di web	`openclaw infer web search --query "..." --json`
Ambil halaman web	`openclaw infer web fetch --url https://example.com --json`
Buat embedding	`openclaw infer embedding create --text "..." --json`

Perilaku

openclaw infer ... adalah permukaan CLI utama untuk alur kerja ini.
Gunakan --json saat keluaran akan dikonsumsi oleh perintah atau skrip lain.
Gunakan --provider atau --model provider/model saat backend tertentu diperlukan.
Gunakan model run --thinking <level> untuk meneruskan tingkat thinking/reasoning sekali jalan (off, minimal, low, medium, high, adaptive, xhigh, atau max) sambil mempertahankan run tetap mentah.
Untuk image describe, audio transcribe, dan video describe, --model harus menggunakan bentuk <provider/model>.
Untuk image describe, --file menerima path lokal dan URL gambar HTTP(S). URL jarak jauh menggunakan kebijakan SSRF pengambilan media normal.
Untuk image describe, --model eksplisit menjalankan provider/model tersebut lebih dulu, lalu mencoba agents.defaults.imageModel.fallbacks yang dikonfigurasi saat panggilan model gagal. Error persiapan input, seperti file yang hilang atau URL yang tidak didukung, gagal sebelum percobaan fallback. Model harus mendukung gambar di katalog model atau konfigurasi penyedia. codex/<model> menjalankan turn pemahaman gambar server aplikasi Codex yang dibatasi; openai/<model> menggunakan jalur penyedia OpenAI dengan auth API-key atau ChatGPT/Codex OAuth.
Perintah eksekusi stateless default ke lokal.
Perintah state yang dikelola Gateway default ke gateway.
Jalur lokal normal tidak memerlukan gateway berjalan.
model run lokal adalah penyelesaian penyedia sekali jalan yang ramping. Ini menyelesaikan model agen dan auth yang dikonfigurasi, tetapi tidak memulai turn chat-agent, memuat tool, atau membuka server MCP bawaan.
model run --file menerima file gambar, mendeteksi tipe MIME-nya, dan mengirimkannya bersama prompt yang diberikan ke model terpilih. Ulangi --file untuk beberapa gambar.
model run --file menolak input non-gambar. Gunakan infer audio transcribe untuk file audio dan infer video describe untuk file video.
model run --gateway menguji routing Gateway, auth tersimpan, pemilihan penyedia, dan runtime tertanam, tetapi tetap berjalan sebagai probe model mentah: ini mengirim prompt yang diberikan dan lampiran gambar apa pun tanpa transkrip sesi sebelumnya, konteks bootstrap/AGENTS, perakitan context-engine, tool, atau server MCP bawaan.
model run --gateway --model <provider/model> memerlukan kredensial gateway operator tepercaya karena permintaan meminta Gateway menjalankan override provider/model sekali pakai.
model run --thinking lokal menggunakan jalur penyelesaian penyedia yang ramping; tingkat khusus penyedia seperti adaptive dan max dipetakan ke tingkat penyelesaian sederhana portabel terdekat.

Model

Gunakan model untuk inferensi teks yang didukung penyedia serta inspeksi model/penyedia.

openclaw infer model run --prompt "Reply with exactly: smoke-ok" --json
openclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --json
openclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --json
openclaw infer model run --prompt "Use more reasoning here" --thinking high --json
openclaw infer model providers --json
openclaw infer model inspect --name gpt-5.5 --json

Gunakan ref lengkap <provider/model> untuk smoke-test penyedia tertentu tanpa memulai Gateway atau memuat permukaan tool agen penuh:

openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model openai/gpt-5.5 --prompt "Reply with exactly: pong" --json
openclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

Catatan:

model run lokal adalah smoke CLI paling sempit untuk kesehatan provider/model/auth karena, untuk penyedia non-Codex, ini hanya mengirim prompt yang diberikan ke model terpilih.
model run --model <provider/model> lokal dapat menggunakan baris katalog statis bawaan persis dari models list --all sebelum penyedia tersebut ditulis ke konfigurasi. Auth penyedia tetap diperlukan; kredensial yang hilang gagal sebagai error auth, bukan Unknown model.
Untuk probe reasoning Mistral Medium 3.5, biarkan temperature tidak disetel/default. Mistral menolak reasoning_effort="high" ditambah temperature: 0; gunakan mistral/mistral-medium-3-5 dengan temperature default atau nilai mode reasoning non-nol seperti 0.7.
Probe lokal Codex Responses adalah pengecualian sempit: OpenClaw menambahkan instruksi sistem minimal agar transport dapat mengisi field instructions yang diperlukan, tanpa menambahkan konteks agen penuh, tool, memori, atau transkrip sesi.
model run --file lokal mempertahankan jalur ramping itu dan melampirkan konten gambar langsung ke satu pesan pengguna. File gambar umum seperti PNG, JPEG, dan WebP berfungsi saat tipe MIME-nya terdeteksi sebagai image/*; file yang tidak didukung atau tidak dikenali gagal sebelum penyedia dipanggil.
model run --file paling tepat saat Anda ingin menguji model teks multimodal terpilih secara langsung. Gunakan infer image describe saat Anda menginginkan pemilihan penyedia pemahaman gambar OpenClaw dan routing model gambar default.
Model terpilih harus mendukung input gambar; model hanya teks dapat menolak permintaan di lapisan penyedia.
model run --prompt harus berisi teks non-whitespace; prompt kosong ditolak sebelum penyedia lokal atau Gateway dipanggil.
model run lokal keluar non-nol saat penyedia tidak mengembalikan keluaran teks, sehingga penyedia lokal yang tidak terjangkau dan penyelesaian kosong tidak terlihat seperti probe yang berhasil.
Gunakan model run --gateway saat Anda perlu menguji routing Gateway, penyiapan runtime agen, atau state penyedia yang dikelola Gateway sambil mempertahankan input model tetap mentah. Gunakan openclaw agent atau permukaan chat saat Anda menginginkan konteks agen penuh, tool, memori, dan transkrip sesi.
model auth login, model auth logout, dan model auth status mengelola state auth penyedia tersimpan.

Gambar

Gunakan image untuk pembuatan, pengeditan, dan deskripsi.

openclaw infer image generate --prompt "friendly lobster illustration" --json
openclaw infer image generate --prompt "cinematic product photo of headphones" --json
openclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --json
openclaw infer image generate --model openai/gpt-image-2 --quality low --openai-moderation low --prompt "low-cost draft poster" --json
openclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --json
openclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --json
openclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --json
openclaw infer image describe --file ./photo.jpg --json
openclaw infer image describe --file https://example.com/photo.png --json
openclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --json
openclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --json
openclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-5.4-mini --json
openclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

Catatan:

Gunakan image edit saat memulai dari file input yang sudah ada.
Gunakan --size, --aspect-ratio, atau --resolution dengan image edit untuk penyedia/model yang mendukung petunjuk geometri pada pengeditan gambar referensi.
Gunakan --output-format png --background transparent dengan --model openai/gpt-image-1.5 untuk output PNG OpenAI dengan latar belakang transparan; --openai-background tetap tersedia sebagai alias khusus OpenAI. Penyedia yang tidak mendeklarasikan dukungan latar belakang melaporkan petunjuk tersebut sebagai override yang diabaikan.
Gunakan --quality low|medium|high|auto untuk penyedia yang mendukung petunjuk kualitas gambar, termasuk OpenAI. OpenAI juga menerima --openai-moderation low|auto untuk petunjuk moderasi khusus penyedia.
Gunakan image providers --json untuk memverifikasi penyedia gambar bawaan mana yang dapat ditemukan, dikonfigurasi, dipilih, dan kapabilitas pembuatan/pengeditan apa yang diekspos setiap penyedia.
Gunakan image generate --model <provider/model> --json sebagai smoke CLI live tersempit untuk perubahan pembuatan gambar. Contoh:
```
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "Minimal flat test image: one blue square on a white background, no text." \
  --output ./openclaw-infer-image-smoke.png \
  --json
```
Respons JSON melaporkan ok, provider, model, attempts, dan jalur output yang ditulis. Saat --output ditetapkan, ekstensi akhir dapat mengikuti tipe MIME yang dikembalikan penyedia.
Untuk image describe dan image describe-many, gunakan --prompt untuk memberikan instruksi khusus tugas kepada model vision seperti OCR, perbandingan, inspeksi UI, atau pembuatan keterangan singkat.
Gunakan --timeout-ms dengan model vision lokal yang lambat atau start dingin Ollama.
Untuk image describe, --model harus berupa <provider/model> yang mendukung gambar. Saat ditetapkan, OpenClaw mencoba model eksplisit tersebut terlebih dahulu lalu fallback model gambar yang dikonfigurasi jika panggilan model gagal.
Untuk model vision Ollama lokal, pull model terlebih dahulu dan tetapkan OLLAMA_API_KEY ke nilai placeholder apa pun, misalnya ollama-local. Lihat Ollama.

Audio

Gunakan audio untuk transkripsi file.

openclaw infer audio transcribe --file ./memo.m4a --json
openclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --json
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Catatan:

audio transcribe adalah untuk transkripsi file, bukan manajemen sesi realtime.
--model harus berupa <provider/model>.

TTS

Gunakan tts untuk sintesis suara dan status penyedia TTS.

openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --json
openclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --json
openclaw infer tts providers --json
openclaw infer tts status --json

Catatan:

tts status default ke gateway karena mencerminkan status TTS yang dikelola gateway.
Gunakan tts providers, tts voices, dan tts set-provider untuk memeriksa dan mengonfigurasi perilaku TTS.

Video

Gunakan video untuk pembuatan dan deskripsi.

openclaw infer video generate --prompt "cinematic sunset over the ocean" --json
openclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --json
openclaw infer video describe --file ./clip.mp4 --json
openclaw infer video describe --file ./clip.mp4 --model openai/gpt-5.4-mini --json

Catatan:

video generate menerima --size, --aspect-ratio, --resolution, --duration, --audio, --watermark, dan --timeout-ms lalu meneruskannya ke runtime pembuatan video.
--model harus berupa <provider/model> untuk video describe.

Web

Gunakan web untuk alur kerja pencarian dan fetch.

openclaw infer web search --query "OpenClaw docs" --json
openclaw infer web search --query "OpenClaw infer web providers" --json
openclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --json
openclaw infer web providers --json

Catatan:

Gunakan web providers untuk memeriksa penyedia yang tersedia, dikonfigurasi, dan dipilih.

Embedding

Gunakan embedding untuk pembuatan vektor dan inspeksi penyedia embedding.

openclaw infer embedding create --text "friendly lobster" --json
openclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --json
openclaw infer embedding providers --json

Output JSON

Perintah infer menormalkan output JSON di bawah envelope bersama:

{
  "ok": true,
  "capability": "image.generate",
  "transport": "local",
  "provider": "openai",
  "model": "gpt-image-2",
  "attempts": [],
  "outputs": []
}

Field tingkat atas stabil:

ok
capability
transport
provider
model
attempts
outputs
error

Untuk perintah media yang dihasilkan, outputs berisi file yang ditulis oleh OpenClaw. Gunakan path, mimeType, size, dan dimensi khusus media apa pun dalam array tersebut untuk otomatisasi alih-alih mengurai stdout yang mudah dibaca manusia.

Kesalahan umum

# Bad
openclaw infer media image generate --prompt "friendly lobster"

# Good
openclaw infer image generate --prompt "friendly lobster"

# Bad
openclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json

# Good
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Catatan

openclaw capability ... adalah alias untuk openclaw infer ....

​Ubah infer menjadi Skill

​Mengapa menggunakan infer

​Pohon perintah

​Tugas umum

​Perilaku

​Model

​Gambar

​Audio

​TTS

​Video

​Web

​Embedding

​Output JSON

​Kesalahan umum

​Catatan

​Terkait

Ubah infer menjadi Skill

Mengapa menggunakan infer

Pohon perintah

Tugas umum

Perilaku

Model

Gambar

Audio

TTS

Video

Web

Embedding

Output JSON

Kesalahan umum

Catatan

Terkait