Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Inworld é um provedor de texto para fala (TTS) por streaming. No OpenClaw, ele sintetiza o áudio de respostas de saída (MP3 por padrão, OGG_OPUS para notas de voz) e áudio PCM para canais de telefonia, como Chamada de voz. O OpenClaw envia requisições para o endpoint de TTS por streaming da Inworld, concatena os fragmentos de áudio em base64 retornados em um único buffer e entrega o resultado ao pipeline padrão de áudio de resposta.
PropriedadeValor
ID do provedorinworld
Pluginincluído, enabledByDefault: true
ContratospeechProviders (somente TTS)
Variável de ambiente de autenticaçãoINWORLD_API_KEY (HTTP Basic, credencial Base64 do painel)
URL basehttps://api.inworld.ai
Voz padrãoSarah
Modelo padrãoinworld-tts-1.5-max
SaídaMP3 (padrão), OGG_OPUS (notas de voz), PCM 22050 Hz (telefonia)
Siteinworld.ai
Documentaçãodocs.inworld.ai/tts/tts

Primeiros passos

1

Defina sua chave de API

Copie a credencial do seu painel da Inworld (Workspace > API Keys) e defina-a como uma variável de ambiente. O valor é enviado literalmente como a credencial HTTP Basic, portanto não o codifique em Base64 novamente nem o converta em um token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
2

Selecione Inworld em messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}
3

Envie uma mensagem

Envie uma resposta por qualquer canal conectado. O OpenClaw sintetiza o áudio com a Inworld e o entrega como MP3 (ou OGG_OPUS quando o canal espera uma nota de voz).

Opções de configuração

OpçãoCaminhoDescrição
apiKeymessages.tts.providers.inworld.apiKeyCredencial Base64 do painel. Usa INWORLD_API_KEY como fallback.
baseUrlmessages.tts.providers.inworld.baseUrlSubstitui a URL base da API da Inworld (padrão https://api.inworld.ai).
voiceIdmessages.tts.providers.inworld.voiceIdIdentificador de voz (padrão Sarah).
modelIdmessages.tts.providers.inworld.modelIdID do modelo TTS (padrão inworld-tts-1.5-max).
temperaturemessages.tts.providers.inworld.temperatureTemperatura de amostragem 0..2 (opcional).

Observações

A Inworld usa autenticação HTTP Basic com uma única string de credencial codificada em Base64. Copie-a literalmente do painel da Inworld. O provedor a envia como Authorization: Basic <apiKey> sem nenhuma codificação adicional, portanto não a codifique em Base64 você mesmo e não passe um token no estilo bearer. Consulte observações de autenticação de TTS para o mesmo destaque.
IDs de modelo compatíveis: inworld-tts-1.5-max (padrão), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
As respostas usam MP3 por padrão. Quando o destino do canal é voice-note, o OpenClaw solicita OGG_OPUS à Inworld para que o áudio seja reproduzido como uma bolha de voz nativa. A síntese de telefonia usa PCM bruto a 22050 Hz para alimentar a ponte de telefonia.
Substitua o host da API com messages.tts.providers.inworld.baseUrl. Barras finais são removidas antes do envio das requisições.

Relacionado

Texto para fala

Visão geral de TTS, provedores e configuração de messages.tts.

Configuração

Referência completa de configuração, incluindo definições de messages.tts.

Provedores

Todos os provedores incluídos do OpenClaw.

Solução de problemas

Problemas comuns e etapas de depuração.