Przejdź do głównej treści

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Inworld jest dostawcą strumieniowego przetwarzania tekstu na mowę (TTS). W OpenClaw syntetyzuje wychodzący dźwięk odpowiedzi (domyślnie MP3, OGG_OPUS dla notatek głosowych) oraz dźwięk PCM dla kanałów telefonicznych, takich jak Voice Call. OpenClaw wysyła żądania do strumieniowego punktu końcowego TTS Inworld, łączy zwrócone fragmenty audio base64 w pojedynczy bufor i przekazuje wynik do standardowego potoku dźwięku odpowiedzi.
WłaściwośćWartość
Identyfikator dostawcyinworld
Pluginwbudowany, enabledByDefault: true
KontraktspeechProviders (tylko TTS)
Zmienna środowiskowa uwierzytelnianiaINWORLD_API_KEY (HTTP Basic, poświadczenie Base64 z panelu)
Bazowy URLhttps://api.inworld.ai
Domyślny głosSarah
Domyślny modelinworld-tts-1.5-max
WyjścieMP3 (domyślnie), OGG_OPUS (notatki głosowe), PCM 22050 Hz (telefonia)
Witrynainworld.ai
Dokumentacjadocs.inworld.ai/tts/tts

Pierwsze kroki

1

Ustaw klucz API

Skopiuj poświadczenie z panelu Inworld (Workspace > API Keys) i ustaw je jako zmienną środowiskową. Wartość jest wysyłana dosłownie jako poświadczenie HTTP Basic, więc nie koduj jej ponownie w Base64 ani nie konwertuj jej na token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
2

Wybierz Inworld w messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}
3

Wyślij wiadomość

Wyślij odpowiedź przez dowolny połączony kanał. OpenClaw syntetyzuje dźwięk za pomocą Inworld i dostarcza go jako MP3 (lub OGG_OPUS, gdy kanał oczekuje notatki głosowej).

Opcje konfiguracji

OpcjaŚcieżkaOpis
apiKeymessages.tts.providers.inworld.apiKeyPoświadczenie Base64 z panelu. Używa zastępczo INWORLD_API_KEY.
baseUrlmessages.tts.providers.inworld.baseUrlNadpisuje bazowy URL API Inworld (domyślnie https://api.inworld.ai).
voiceIdmessages.tts.providers.inworld.voiceIdIdentyfikator głosu (domyślnie Sarah).
modelIdmessages.tts.providers.inworld.modelIdIdentyfikator modelu TTS (domyślnie inworld-tts-1.5-max).
temperaturemessages.tts.providers.inworld.temperatureTemperatura próbkowania 0..2 (opcjonalnie).

Uwagi

Inworld używa uwierzytelniania HTTP Basic z pojedynczym ciągiem poświadczenia zakodowanym w Base64. Skopiuj go dosłownie z panelu Inworld. Dostawca wysyła go jako Authorization: Basic <apiKey> bez żadnego dalszego kodowania, więc nie koduj go samodzielnie w Base64 i nie przekazuj tokenu w stylu bearer. Zobacz uwagi dotyczące uwierzytelniania TTS, aby uzyskać to samo ostrzeżenie.
Obsługiwane identyfikatory modeli: inworld-tts-1.5-max (domyślnie), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Odpowiedzi domyślnie używają MP3. Gdy docelowym typem kanału jest voice-note, OpenClaw prosi Inworld o OGG_OPUS, aby dźwięk był odtwarzany jako natywna dymka głosowa. Synteza telefoniczna używa surowego PCM przy 22050 Hz, aby zasilać most telefoniczny.
Nadpisz host API za pomocą messages.tts.providers.inworld.baseUrl. Końcowe ukośniki są usuwane przed wysłaniem żądań.

Powiązane

Tekst na mowę

Przegląd TTS, dostawcy i konfiguracja messages.tts.

Konfiguracja

Pełna dokumentacja konfiguracji, w tym ustawienia messages.tts.

Dostawcy

Wszyscy wbudowani dostawcy OpenClaw.

Rozwiązywanie problemów

Typowe problemy i kroki debugowania.