inferrs dapat menyajikan model lokal di belakang APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 yang kompatibel dengan OpenAI. OpenClaw bekerja dengan inferrs melalui jalur generik openai-completions.
| Properti | Nilai |
|---|---|
| id Provider | inferrs (kustom; konfigurasikan di bawah models.providers.inferrs) |
| Plugin | tidak ada — inferrs bukan Plugin provider OpenClaw bawaan |
| Variabel env auth | Opsional. Nilai apa pun berfungsi jika server inferrs Anda tidak memiliki auth |
| API | Kompatibel dengan OpenAI (openai-completions) |
| URL dasar yang disarankan | http://127.0.0.1:8080/v1 (atau di mana pun server inferrs Anda berada) |
inferrs saat ini paling baik diperlakukan sebagai backend kustom yang di-host sendiri dan kompatibel dengan OpenAI, bukan Plugin provider OpenClaw khusus. Anda mengonfigurasinya melalui models.providers.inferrs, bukan melalui flag pilihan onboarding. Jika Anda membutuhkan Plugin bawaan sungguhan dengan penemuan otomatis, lihat SGLang atau vLLM.Memulai
Contoh konfigurasi lengkap
Contoh ini menggunakan Gemma 4 pada serverinferrs lokal.
Startup sesuai permintaan
Inferrs juga dapat dijalankan oleh OpenClaw hanya saat modelinferrs/...
dipilih. Tambahkan localService ke entri provider yang sama:
command harus absolut. Gunakan which inferrs pada host Gateway dan masukkan
path tersebut ke konfigurasi. Untuk referensi field lengkap, lihat
Layanan model lokal.
Konfigurasi lanjutan
Mengapa requiresStringContent penting
Mengapa requiresStringContent penting
Beberapa rute Chat Completions OpenClaw akan meratakan bagian konten teks murni menjadi string biasa sebelum mengirim
permintaan.
inferrs hanya menerima string
messages[].content, bukan array bagian konten terstruktur.Catatan Gemma dan skema tool
Catatan Gemma dan skema tool
Beberapa kombinasi Itu menonaktifkan permukaan skema tool OpenClaw untuk model dan dapat mengurangi tekanan prompt
pada backend lokal yang lebih ketat.Jika permintaan langsung yang sangat kecil masih berfungsi tetapi giliran agen OpenClaw normal terus
crash di dalam
inferrs + Gemma saat ini menerima permintaan langsung
/v1/chat/completions kecil tetapi masih gagal pada giliran agent-runtime OpenClaw
penuh.Jika itu terjadi, coba ini terlebih dahulu:inferrs, masalah yang tersisa biasanya adalah perilaku model/server
upstream, bukan lapisan transport OpenClaw.Uji smoke manual
Uji smoke manual
Setelah dikonfigurasi, uji kedua lapisan:Jika perintah pertama berfungsi tetapi yang kedua gagal, periksa bagian pemecahan masalah di bawah.
Perilaku bergaya proxy
Perilaku bergaya proxy
inferrs diperlakukan sebagai backend /v1 bergaya proxy yang kompatibel dengan OpenAI, bukan
endpoint OpenAI native.- Pembentukan permintaan khusus OpenAI native tidak berlaku di sini
- Tidak ada
service_tier, tidak ada Responsesstore, tidak ada petunjuk prompt-cache, dan tidak ada pembentukan payload kompatibilitas reasoning OpenAI - Header atribusi OpenClaw tersembunyi (
originator,version,User-Agent) tidak disuntikkan pada URL dasarinferrskustom
Pemecahan masalah
curl /v1/models gagal
curl /v1/models gagal
inferrs tidak berjalan, tidak dapat dijangkau, atau tidak terikat ke
host/port yang diharapkan. Pastikan server telah dijalankan dan mendengarkan pada alamat yang Anda
konfigurasi.messages[].content mengharapkan string
messages[].content mengharapkan string
Atur
compat.requiresStringContent: true di entri model. Lihat bagian
requiresStringContent di atas untuk detail.Panggilan langsung /v1/chat/completions berhasil tetapi openclaw infer model run gagal
Panggilan langsung /v1/chat/completions berhasil tetapi openclaw infer model run gagal
Coba atur
compat.supportsTools: false untuk menonaktifkan permukaan skema tool.
Lihat catatan skema tool Gemma di atas.inferrs masih crash pada giliran agen yang lebih besar
inferrs masih crash pada giliran agen yang lebih besar
Jika OpenClaw tidak lagi mendapatkan kesalahan skema tetapi
inferrs masih crash pada giliran
agen yang lebih besar, perlakukan itu sebagai batasan upstream inferrs atau model. Kurangi
tekanan prompt atau beralih ke backend atau model lokal yang berbeda.Terkait
Model lokal
Menjalankan OpenClaw terhadap server model lokal.
Layanan model lokal
Menjalankan server model lokal sesuai permintaan untuk provider yang dikonfigurasi.
Pemecahan masalah Gateway
Men-debug backend lokal yang kompatibel dengan OpenAI yang lulus probe tetapi gagal pada proses agen.
Pemilihan model
Ikhtisar semua provider, ref model, dan perilaku failover.