メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Inworld はストリーミング Text-to-speech (TTS) プロバイダーです。OpenClaw では、送信返信音声(既定では MP3、ボイスメモでは OGG_OPUS)と、音声通話などの電話チャネル向け PCM 音声を合成します。 OpenClaw は Inworld のストリーミング TTS エンドポイントに送信し、返された base64 音声チャンクを 1 つのバッファーに連結して、その結果を標準の返信音声パイプラインに渡します。
プロパティ
プロバイダー IDinworld
Plugin同梱、enabledByDefault: true
コントラクトspeechProviders (TTS のみ)
認証環境変数INWORLD_API_KEY (HTTP Basic、Base64 ダッシュボード認証情報)
ベース URLhttps://api.inworld.ai
既定の音声Sarah
既定のモデルinworld-tts-1.5-max
出力MP3 (既定)、OGG_OPUS (ボイスメモ)、PCM 22050 Hz (電話)
Web サイトinworld.ai
ドキュメントdocs.inworld.ai/tts/tts

はじめに

1

API キーを設定する

Inworld ダッシュボード (Workspace > API Keys) から認証情報をコピーし、環境変数として設定します。この値は HTTP Basic 認証情報としてそのまま送信されるため、再度 Base64 エンコードしたり、bearer トークンに変換したりしないでください。
INWORLD_API_KEY=<base64-credential-from-dashboard>
2

messages.tts で Inworld を選択する

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}
3

メッセージを送信する

接続済みチャネルから返信を送信します。OpenClaw は Inworld で音声を合成し、MP3 として配信します(チャネルがボイスメモを要求する場合は OGG_OPUS)。

設定オプション

オプションパス説明
apiKeymessages.tts.providers.inworld.apiKeyBase64 ダッシュボード認証情報。INWORLD_API_KEY にフォールバックします。
baseUrlmessages.tts.providers.inworld.baseUrlInworld API ベース URL を上書きします(既定は https://api.inworld.ai)。
voiceIdmessages.tts.providers.inworld.voiceId音声識別子(既定は Sarah)。
modelIdmessages.tts.providers.inworld.modelIdTTS モデル ID(既定は inworld-tts-1.5-max)。
temperaturemessages.tts.providers.inworld.temperatureサンプリング温度 0..2(任意)。

メモ

Inworld は、単一の Base64 エンコード済み認証情報文字列による HTTP Basic 認証を使用します。Inworld ダッシュボードからそのままコピーしてください。プロバイダーは追加のエンコードなしで Authorization: Basic <apiKey> として送信するため、自分で Base64 エンコードしたり、bearer 形式のトークンを渡したりしないでください。同じ注意点については TTS 認証メモ を参照してください。
サポートされるモデル ID: inworld-tts-1.5-max (既定)、inworld-tts-1.5-miniinworld-tts-1-maxinworld-tts-1
返信は既定で MP3 を使用します。チャネルターゲットが voice-note の場合、OpenClaw は Inworld に OGG_OPUS を要求し、音声がネイティブの音声バブルとして再生されるようにします。電話音声合成では、電話ブリッジに渡すために 22050 Hz の生 PCM を使用します。
messages.tts.providers.inworld.baseUrl で API ホストを上書きします。末尾のスラッシュは、リクエストが送信される前に削除されます。

関連

Text-to-speech

TTS の概要、プロバイダー、messages.tts 設定。

設定

messages.tts 設定を含む完全な設定リファレンス。

プロバイダー

同梱されているすべての OpenClaw プロバイダー。

トラブルシューティング

よくある問題とデバッグ手順。