OpenClaw dapat mengekspos metrik diagnostik melalui Plugin resmiDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
diagnostics-prometheus. Plugin ini mendengarkan diagnostik internal tepercaya dan merender endpoint teks Prometheus di:
text/plain; version=0.0.4; charset=utf-8, format eksposisi Prometheus standar.
Untuk trace, log, push OTLP, dan atribut semantik OpenTelemetry GenAI, lihat Ekspor OpenTelemetry.
Mulai cepat
Mulai ulang Gateway
Rute HTTP didaftarkan saat Plugin dimulai, jadi muat ulang setelah mengaktifkannya.
diagnostics.enabled: true wajib diatur. Tanpanya, Plugin tetap mendaftarkan rute HTTP tetapi tidak ada peristiwa diagnostik yang mengalir ke eksportir, sehingga responsnya kosong.Metrik yang diekspor
| Metrik | Tipe | Label |
|---|---|---|
openclaw_run_completed_total | counter | channel, model, outcome, provider, trigger |
openclaw_run_duration_seconds | histogram | channel, model, outcome, provider, trigger |
openclaw_model_call_total | counter | api, error_category, model, outcome, provider, transport |
openclaw_model_call_duration_seconds | histogram | api, error_category, model, outcome, provider, transport |
openclaw_model_tokens_total | counter | agent, channel, model, provider, token_type |
openclaw_gen_ai_client_token_usage | histogram | model, provider, token_type |
openclaw_model_cost_usd_total | counter | agent, channel, model, provider |
openclaw_tool_execution_total | counter | error_category, outcome, params_kind, tool |
openclaw_tool_execution_duration_seconds | histogram | error_category, outcome, params_kind, tool |
openclaw_harness_run_total | counter | channel, error_category, harness, model, outcome, phase, plugin, provider |
openclaw_harness_run_duration_seconds | histogram | channel, error_category, harness, model, outcome, phase, plugin, provider |
openclaw_message_processed_total | counter | channel, outcome, reason |
openclaw_message_processed_duration_seconds | histogram | channel, outcome, reason |
openclaw_message_delivery_started_total | counter | channel, delivery_kind |
openclaw_message_delivery_total | counter | channel, delivery_kind, error_category, outcome |
openclaw_message_delivery_duration_seconds | histogram | channel, delivery_kind, error_category, outcome |
openclaw_talk_event_total | counter | brain, event_type, mode, provider, transport |
openclaw_talk_event_duration_seconds | histogram | brain, event_type, mode, provider, transport |
openclaw_talk_audio_bytes | histogram | brain, event_type, mode, provider, transport |
openclaw_queue_lane_size | gauge | lane |
openclaw_queue_lane_wait_seconds | histogram | lane |
openclaw_session_state_total | counter | reason, state |
openclaw_session_queue_depth | gauge | state |
openclaw_session_recovery_total | counter | action, active_work_kind, state, status |
openclaw_session_recovery_age_seconds | histogram | action, active_work_kind, state, status |
openclaw_memory_bytes | gauge | kind |
openclaw_memory_rss_bytes | histogram | tidak ada |
openclaw_memory_pressure_total | counter | level, reason |
openclaw_telemetry_exporter_total | counter | exporter, reason, signal, status |
openclaw_prometheus_series_dropped_total | counter | tidak ada |
Kebijakan label
Label terbatas dengan kardinalitas rendah
Label terbatas dengan kardinalitas rendah
Label Prometheus tetap terbatas dan berkardinalitas rendah. Eksportir tidak memancarkan pengenal diagnostik mentah seperti
runId, sessionKey, sessionId, callId, toolCallId, ID pesan, ID chat, atau ID permintaan penyedia.Nilai label disunting dan harus cocok dengan kebijakan karakter berkardinalitas rendah OpenClaw. Nilai yang gagal memenuhi kebijakan diganti dengan unknown, other, atau none, bergantung pada metrik.Batas seri dan penghitungan luapan
Batas seri dan penghitungan luapan
Pengekspor membatasi deret waktu yang disimpan dalam memori hingga 2048 seri untuk gabungan penghitung, gauge, dan histogram. Seri baru di luar batas tersebut akan dibuang, dan
openclaw_prometheus_series_dropped_total bertambah satu setiap kali.Pantau penghitung ini sebagai sinyal kuat bahwa atribut di hulu membocorkan nilai berkardinalitas tinggi. Pengekspor tidak pernah menaikkan batas secara otomatis; jika nilainya naik, perbaiki sumbernya alih-alih menonaktifkan batas.Yang tidak pernah muncul dalam keluaran Prometheus
Yang tidak pernah muncul dalam keluaran Prometheus
- teks prompt, teks respons, input alat, output alat, prompt sistem
- Transkrip Talk, payload audio, id panggilan, id ruang, token handoff, id giliran, dan id sesi mentah
- ID permintaan penyedia mentah (hanya hash terbatas, jika berlaku, pada span — tidak pernah pada metrik)
- kunci sesi dan ID sesi
- nama host, jalur file, nilai rahasia
Resep PromQL
Memilih antara ekspor Prometheus dan OpenTelemetry
OpenClaw mendukung kedua permukaan secara independen. Anda dapat menjalankan salah satu, keduanya, atau tidak keduanya.- diagnostics-prometheus
- diagnostics-otel
- Model tarik: Prometheus mengambil
/api/diagnostics/prometheus. - Tidak memerlukan kolektor eksternal.
- Diautentikasi melalui autentikasi Gateway normal.
- Permukaan hanya berupa metrik (tanpa trace atau log).
- Paling cocok untuk stack yang sudah distandarkan pada Prometheus + Grafana.
Pemecahan masalah
Isi respons kosong
Isi respons kosong
- Periksa
diagnostics.enabled: truedalam konfigurasi. - Pastikan Plugin diaktifkan dan dimuat dengan
openclaw plugins list --enabled. - Buat sejumlah traffic; penghitung dan histogram hanya memancarkan baris setelah setidaknya satu peristiwa.
401 / tidak terotorisasi
401 / tidak terotorisasi
Endpoint memerlukan cakupan operator Gateway (
auth: "gateway" dengan gatewayRuntimeScopeSurface: "trusted-operator"). Gunakan token atau kata sandi yang sama yang digunakan Prometheus untuk rute operator Gateway lainnya. Tidak ada mode publik tanpa autentikasi.`openclaw_prometheus_series_dropped_total` meningkat
`openclaw_prometheus_series_dropped_total` meningkat
Atribut baru melebihi batas 2048 seri. Periksa metrik terbaru untuk label dengan kardinalitas tinggi yang tidak terduga dan perbaiki di sumbernya. Pengekspor sengaja membuang seri baru alih-alih diam-diam menulis ulang label.
Prometheus menampilkan seri basi setelah mulai ulang
Prometheus menampilkan seri basi setelah mulai ulang
Plugin hanya menyimpan status dalam memori. Setelah Gateway dimulai ulang, penghitung diatur ulang ke nol dan gauge dimulai ulang pada nilai berikutnya yang dilaporkan. Gunakan PromQL
rate() dan increase() untuk menangani pengaturan ulang dengan bersih.Terkait
- Ekspor diagnostik — berkas zip diagnostik lokal untuk bundel dukungan
- Kesehatan dan kesiapan — probe
/healthzdan/readyz - Pencatatan log — pencatatan log berbasis file
- Ekspor OpenTelemetry — push OTLP untuk trace, metrik, dan log