Lo strumentoDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate consente all’agente di creare musica o audio tramite la
capacità condivisa di generazione musicale con provider configurati: Google,
MiniMax e, al momento, ComfyUI configurato tramite workflow.
Per le esecuzioni dell’agente basate su sessione, OpenClaw avvia la generazione musicale come
attività in background, la traccia nel registro delle attività, quindi risveglia nuovamente l’agente
quando la traccia è pronta, così l’agente può informare l’utente e allegare l’audio
finito. Nelle chat di gruppo/canale che usano la consegna visibile solo tramite strumento di messaggistica,
l’agente inoltra il risultato tramite lo strumento di messaggistica. Se l’agente di
completamento scrive solo una risposta finale privata, OpenClaw ripiega su un
invio diretto al canale con i media generati. Il risveglio di completamento avvisa esplicitamente
l’agente che le normali risposte finali sono private in quelle route.
Lo strumento condiviso integrato compare solo quando è disponibile almeno un provider
di generazione musicale. Se non vedi
music_generate negli strumenti del tuo agente,
configura agents.defaults.musicGenerationModel oppure imposta una chiave API
del provider.Avvio rapido
- Basato su provider condiviso
- Workflow ComfyUI
Configura l'autenticazione
Imposta una chiave API per almeno un provider, ad esempio
GEMINI_API_KEY o MINIMAX_API_KEY.Provider supportati
| Provider | Modello predefinito | Input di riferimento | Controlli supportati | Autenticazione |
|---|---|---|---|---|
| ComfyUI | workflow | Fino a 1 immagine | Musica o audio definiti dal workflow | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | Fino a 10 immagini | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | Nessuno | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY o OAuth MiniMax |
Matrice delle capacità
Il contratto di modalità esplicito usato damusic_generate, dai test del contratto e dallo
sweep live condiviso:
| Provider | generate | edit | Limite di modifica | Lane live condivise |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 immagine | Non nello sweep condiviso; coperto da extensions/comfy/comfy.live.test.ts |
| ✓ | ✓ | 10 immagini | generate, edit | |
| MiniMax | ✓ | — | Nessuno | generate |
action: "list" per ispezionare i provider e i modelli condivisi disponibili a
runtime:
action: "status" per ispezionare l’attività musicale attiva basata su sessione:
Parametri dello strumento
Prompt di generazione musicale. Obbligatorio per
action: "generate"."status" restituisce l’attività di sessione corrente; "list" ispeziona i provider.Override provider/modello (ad esempio
google/lyria-3-pro-preview,
comfy/workflow).Testo facoltativo quando il provider supporta l’input esplicito dei testi.
Richiede output solo strumentale quando il provider lo supporta.
Percorso o URL di una singola immagine di riferimento.
Più immagini di riferimento (fino a 10 sui provider che le supportano).
Durata target in secondi quando il provider supporta i suggerimenti di durata.
Suggerimento del formato di output quando il provider lo supporta.
Suggerimento del nome file di output.
Timeout facoltativo della richiesta al provider in millisecondi. Quando omesso, OpenClaw usa
agents.defaults.musicGenerationModel.timeoutMs se configurato. I valori inferiori a 10000ms vengono aumentati a 10000ms e segnalati nel risultato dello strumento.Non tutti i provider supportano tutti i parametri. OpenClaw convalida comunque i limiti
rigidi, come i conteggi degli input, prima dell’invio. Quando un provider supporta
la durata ma usa un massimo più breve del valore richiesto, OpenClaw
limita al valore più vicino supportato. I suggerimenti facoltativi realmente non supportati
vengono ignorati con un avviso quando il provider o modello selezionato non può rispettarli.
I risultati dello strumento riportano le impostazioni applicate;
details.normalization
cattura qualsiasi mappatura da richiesto ad applicato.Comportamento asincrono
La generazione musicale basata su sessione viene eseguita come attività in background:- Attività in background:
music_generatecrea un’attività in background, restituisce subito una risposta di avvio/attività e pubblica la traccia finita più tardi in un messaggio di follow-up dell’agente. - Prevenzione dei duplicati: mentre un’attività è
queuedorunning, le chiamate successive amusic_generatenella stessa sessione restituiscono lo stato dell’attività invece di avviare un’altra generazione. Usaaction: "status"per controllare esplicitamente. - Ricerca dello stato:
openclaw tasks listoopenclaw tasks show <taskId>ispeziona gli stati in coda, in esecuzione e terminali. - Risveglio di completamento: OpenClaw inietta un evento interno di completamento nella stessa sessione, così il modello può scrivere autonomamente il follow-up visibile all’utente.
- Suggerimento nel prompt: i turni successivi dell’utente/manuali nella stessa sessione ricevono un piccolo
suggerimento di runtime quando un’attività musicale è già in corso, così il modello
non richiama alla cieca
music_generate. - Fallback senza sessione: i contesti diretti/locali senza una reale sessione dell’agente vengono eseguiti inline e restituiscono il risultato audio finale nello stesso turno.
Ciclo di vita dell’attività
| Stato | Significato |
|---|---|
queued | Attività creata, in attesa che il provider la accetti. |
running | Il provider sta elaborando (in genere da 30 secondi a 3 minuti a seconda di provider e durata). |
succeeded | Traccia pronta; l’agente si risveglia e la pubblica nella conversazione. |
failed | Errore del provider o timeout; l’agente si risveglia con i dettagli dell’errore. |
Configurazione
Selezione del modello
Ordine di selezione dei provider
OpenClaw prova i provider in questo ordine:- Parametro
modeldella chiamata allo strumento (se l’agente ne specifica uno). musicGenerationModel.primarydalla configurazione.musicGenerationModel.fallbacksin ordine.- Rilevamento automatico usando solo valori predefiniti dei provider basati su autenticazione:
- prima il provider predefinito corrente;
- poi i restanti provider di generazione musicale registrati in ordine di id provider.
agents.defaults.mediaGenerationAutoProviderFallback: false per usare solo
voci esplicite model, primary e fallbacks.
Note sui provider
ComfyUI
ComfyUI
Basato su workflow e dipende dal grafo configurato più la mappatura dei nodi
per i campi prompt/output. Il plugin
comfy incluso si collega allo
strumento condiviso music_generate tramite il registro dei provider
di generazione musicale.Google (Lyria 3)
Google (Lyria 3)
Usa la generazione batch Lyria 3. Il flusso incluso corrente supporta
prompt, testo facoltativo dei brani e immagini di riferimento facoltative.
MiniMax
MiniMax
Usa l’endpoint batch
music_generation. Supporta prompt, testi facoltativi,
modalità strumentale, controllo della durata e output mp3 tramite
autenticazione con chiave API minimax oppure OAuth minimax-portal.Scegliere il percorso giusto
- Basato su provider condiviso quando vuoi selezione del modello, failover dei provider e il flusso integrato asincrono di attività/stato.
- Percorso Plugin (ComfyUI) quando ti serve un grafo di workflow personalizzato o un provider che non fa parte della capacità musicale condivisa inclusa.
Modalità delle capacità del provider
Il contratto condiviso di generazione musicale supporta dichiarazioni di modalità esplicite:generateper la generazione solo da prompt.editquando la richiesta include una o più immagini di riferimento.
maxInputImages, supportsLyrics e
supportsFormat non sono sufficienti per dichiarare il supporto di modifica. I provider
dovrebbero dichiarare generate e edit esplicitamente, così i test live, i test del contratto
e lo strumento condiviso music_generate possono convalidare il supporto delle modalità
in modo deterministico.
Test live
Copertura live opt-in per i provider condivisi inclusi:~/.profile, preferisce
per impostazione predefinita le chiavi API live/env ai profili di autenticazione archiviati
e viene eseguito sia per la copertura generate sia per la copertura edit dichiarata
quando il provider abilita la modalità di modifica. Copertura attuale:
google:generatepiùeditminimax: sologeneratecomfy: copertura live Comfy separata, non lo sweep condiviso dei provider
Correlati
- Attività in background — monitoraggio delle attività per esecuzioni
music_generatescollegate - ComfyUI
- Riferimento di configurazione — configurazione
musicGenerationModel - Google (Gemini)
- MiniMax
- Modelli — configurazione del modello e failover
- Panoramica degli strumenti