Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
music_generate ツールにより、エージェントは設定済みプロバイダー(現在は Google、
MiniMax、およびワークフロー設定済みの ComfyUI)を使った共有の音楽生成機能を通じて、音楽や音声を作成できます。
セッションに基づくエージェント実行では、OpenClaw は音楽生成を
バックグラウンドタスクとして開始し、タスク台帳で追跡したうえで、トラックの準備ができると
エージェントを再度起動します。これにより、エージェントはユーザーに通知し、完成した音声を
添付できます。メッセージツールのみで可視配信するグループ/チャンネルチャットでは、
エージェントはメッセージツールを通じて結果を中継します。完了エージェントが非公開の最終返信のみを書いた場合、OpenClaw は生成されたメディアを付けて
チャンネルへの直接送信にフォールバックします。完了時の起動では、通常の最終返信は
これらのルートでは非公開であることをエージェントに明示的に警告します。
組み込みの共有ツールは、少なくとも 1 つの音楽生成
プロバイダーが利用可能な場合にのみ表示されます。エージェントの
ツールに
music_generate が表示されない場合は、agents.defaults.musicGenerationModel を設定するか、
プロバイダー API キーをセットアップしてください。クイックスタート
プロンプト例:対応プロバイダー
| プロバイダー | デフォルトモデル | 参照入力 | 対応コントロール | 認証 |
|---|---|---|---|---|
| ComfyUI | workflow | 最大 1 枚の画像 | ワークフロー定義の音楽または音声 | COMFY_API_KEY, COMFY_CLOUD_API_KEY |
lyria-3-clip-preview | 最大 10 枚の画像 | lyrics, instrumental, format | GEMINI_API_KEY, GOOGLE_API_KEY | |
| MiniMax | music-2.6 | なし | lyrics, instrumental, durationSeconds, format=mp3 | MINIMAX_API_KEY または MiniMax OAuth |
機能マトリクス
music_generate、契約テスト、および
共有ライブスイープで使用される明示的なモード契約:
| プロバイダー | generate | edit | 編集制限 | 共有ライブレーン |
|---|---|---|---|---|
| ComfyUI | ✓ | ✓ | 1 枚の画像 | 共有スイープには含まれません。extensions/comfy/comfy.live.test.ts でカバーされます |
| ✓ | ✓ | 10 枚の画像 | generate, edit | |
| MiniMax | ✓ | — | なし | generate |
action: "list" を使用します:
action: "status" を使用します:
ツールパラメーター
音楽生成プロンプト。
action: "generate" では必須です。"status" は現在のセッションタスクを返し、"list" はプロバイダーを調べます。プロバイダー/モデルの上書き(例:
google/lyria-3-pro-preview,
comfy/workflow)。プロバイダーが明示的な歌詞入力に対応している場合の任意の歌詞。
プロバイダーが対応している場合に、インストゥルメンタルのみの出力をリクエストします。
単一の参照画像パスまたは URL。
複数の参照画像(対応プロバイダーでは最大 10 枚)。
プロバイダーが長さのヒントに対応している場合の目標時間(秒)。
プロバイダーが対応している場合の出力形式ヒント。
出力ファイル名のヒント。
任意のプロバイダーリクエストタイムアウト(ミリ秒)。省略した場合、OpenClaw は設定されていれば
agents.defaults.musicGenerationModel.timeoutMs を使用します。10000ms 未満の値は 10000ms に引き上げられ、ツール結果で報告されます。すべてのプロバイダーがすべてのパラメーターに対応しているわけではありません。OpenClaw は送信前に、入力数などのハード
制限を引き続き検証します。プロバイダーが
長さに対応しているものの、リクエスト値より短い最大値を使用する場合、OpenClaw は
最も近い対応済みの長さに丸めます。選択されたプロバイダーまたはモデルが対応できない、実際には未対応の任意ヒントは
警告付きで無視されます。ツール結果は適用された設定を報告し、
details.normalization
はリクエスト値から適用値へのマッピングを記録します。非同期動作
セッションに基づく音楽生成はバックグラウンドタスクとして実行されます:- バックグラウンドタスク:
music_generateはバックグラウンドタスクを作成し、 開始済み/タスクレスポンスをすぐに返し、後続のエージェントメッセージで 完成したトラックを後から投稿します。 - 重複防止: タスクが
queuedまたはrunningの間は、同じセッション内の後続のmusic_generate呼び出しは、別の生成を開始せずにタスクステータスを返します。明示的に確認するにはaction: "status"を使用します。 - ステータス検索:
openclaw tasks listまたはopenclaw tasks show <taskId>は、 キュー済み、実行中、および終了状態を調べます。 - 完了時の起動: OpenClaw は内部の完了イベントを同じセッションに 注入し、モデルがユーザー向けのフォローアップを 自分で書けるようにします。
- プロンプトヒント: 同じセッションの後続のユーザー/手動ターンでは、音楽タスクがすでに進行中の場合に小さな
実行時ヒントを受け取ります。そのため、モデルは
music_generateを無条件に再度呼び出しません。 - セッションなしのフォールバック: 実際のエージェント セッションを持たない直接/ローカルコンテキストではインラインで実行され、同じターンで最終音声結果を返します。
タスクライフサイクル
| 状態 | 意味 |
|---|---|
queued | タスクが作成され、プロバイダーが受け付けるのを待っています。 |
running | プロバイダーが処理中です(通常、プロバイダーと長さに応じて 30 秒から 3 分)。 |
succeeded | トラックの準備ができました。エージェントが起動し、会話に投稿します。 |
failed | プロバイダーエラーまたはタイムアウトです。エージェントはエラー詳細を伴って起動します。 |
設定
モデル選択
プロバイダー選択順
OpenClaw は次の順序でプロバイダーを試します:- ツール呼び出しの
modelパラメーター(エージェントが指定した場合)。 - 設定の
musicGenerationModel.primary。 musicGenerationModel.fallbacksの順序どおり。- 認証に基づくプロバイダーのデフォルトのみを使用した自動検出:
- 現在のデフォルトプロバイダーを最初に使用。
- 残りの登録済み音楽生成プロバイダーを provider-id 順に使用。
model、primary、fallbacks エントリーのみを使用するには、
agents.defaults.mediaGenerationAutoProviderFallback: false を設定します。
プロバイダーメモ
ComfyUI
ComfyUI
ワークフロー駆動であり、設定済みグラフとプロンプト/出力フィールド用のノードマッピングに依存します。バンドルされた
comfy Plugin は、音楽生成プロバイダー
レジストリを通じて共有 music_generate ツールに接続します。Google (Lyria 3)
Google (Lyria 3)
Lyria 3 バッチ生成を使用します。現在のバンドルフローは
プロンプト、任意の歌詞テキスト、および任意の参照画像に対応しています。
MiniMax
MiniMax
バッチ
music_generation エンドポイントを使用します。プロンプト、任意の
歌詞、インストゥルメンタルモード、長さの誘導、および
minimax API キー認証または minimax-portal OAuth のいずれかを通じた mp3 出力に対応しています。適切なパスの選択
- 共有プロバイダーに基づくパス は、モデル選択、プロバイダー フェイルオーバー、および組み込みの非同期タスク/ステータスフローが必要な場合に使用します。
- Plugin パス(ComfyUI) は、カスタムワークフローグラフ、または 共有のバンドル音楽機能に含まれないプロバイダーが必要な場合に使用します。
プロバイダー機能モード
共有音楽生成契約は、明示的なモード宣言に対応しています:- プロンプトのみの生成には
generate。 - リクエストに 1 つ以上の参照画像が含まれる場合は
edit。
maxInputImages、supportsLyrics、および
supportsFormat のような従来のフラットなフィールドだけでは、編集対応を示すには不十分です。プロバイダーは generate と edit を明示的に宣言し、ライブテスト、契約
テスト、および共有 music_generate ツールがモード対応を
決定論的に検証できるようにする必要があります。
ライブテスト
共有バンドルプロバイダー向けのオプトインライブカバレッジ:~/.profile から読み込み、デフォルトでは保存済み認証プロファイルよりも
live/env API キーを優先し、プロバイダーが編集モードを有効にしている場合は
generate と宣言済みの edit カバレッジの両方を実行します。現在のカバレッジ:
google:generateとeditminimax:generateのみcomfy: 個別の Comfy ライブカバレッジ。共有プロバイダー sweep ではありません
関連
- バックグラウンドタスク — デタッチされた
music_generate実行のタスク追跡 - ComfyUI
- 設定リファレンス —
musicGenerationModel設定 - Google (Gemini)
- MiniMax
- モデル — モデル設定とフェイルオーバー
- ツール概要