Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Inworld es un proveedor de texto a voz (TTS) en streaming. En OpenClaw sintetiza audio de respuesta saliente (MP3 de forma predeterminada, OGG_OPUS para notas de voz) y audio PCM para canales de telefonía como Voice Call. OpenClaw publica en el endpoint de TTS en streaming de Inworld, concatena los fragmentos de audio base64 devueltos en un único búfer y pasa el resultado al pipeline estándar de audio de respuesta.
PropiedadValor
ID del proveedorinworld
Pluginincluido, enabledByDefault: true
ContratospeechProviders (solo TTS)
Variable de entorno de autenticaciónINWORLD_API_KEY (HTTP Basic, credencial Base64 del panel)
URL basehttps://api.inworld.ai
Voz predeterminadaSarah
Modelo predeterminadoinworld-tts-1.5-max
SalidaMP3 (predeterminado), OGG_OPUS (notas de voz), PCM 22050 Hz (telefonía)
Sitio webinworld.ai
Documentacióndocs.inworld.ai/tts/tts

Primeros pasos

1

Configura tu clave de API

Copia la credencial desde tu panel de Inworld (Workspace > API Keys) y configúrala como una variable de entorno. El valor se envía literalmente como la credencial HTTP Basic, así que no vuelvas a codificarlo en Base64 ni lo conviertas en un token bearer.
INWORLD_API_KEY=<base64-credential-from-dashboard>
2

Selecciona Inworld en messages.tts

{
  messages: {
    tts: {
      auto: "always",
      provider: "inworld",
      providers: {
        inworld: {
          voiceId: "Sarah",
          modelId: "inworld-tts-1.5-max",
        },
      },
    },
  },
}
3

Envía un mensaje

Envía una respuesta a través de cualquier canal conectado. OpenClaw sintetiza el audio con Inworld y lo entrega como MP3 (u OGG_OPUS cuando el canal espera una nota de voz).

Opciones de configuración

OpciónRutaDescripción
apiKeymessages.tts.providers.inworld.apiKeyCredencial Base64 del panel. Recurre a INWORLD_API_KEY si no está configurada.
baseUrlmessages.tts.providers.inworld.baseUrlSobrescribe la URL base de la API de Inworld (predeterminada https://api.inworld.ai).
voiceIdmessages.tts.providers.inworld.voiceIdIdentificador de voz (predeterminado Sarah).
modelIdmessages.tts.providers.inworld.modelIdID del modelo TTS (predeterminado inworld-tts-1.5-max).
temperaturemessages.tts.providers.inworld.temperatureTemperatura de muestreo 0..2 (opcional).

Notas

Inworld usa autenticación HTTP Basic con una única cadena de credencial codificada en Base64. Cópiala literalmente desde el panel de Inworld. El proveedor la envía como Authorization: Basic <apiKey> sin ninguna codificación adicional, así que no la codifiques en Base64 tú mismo y no pases un token de estilo bearer. Consulta notas de autenticación de TTS para ver el mismo aviso.
IDs de modelo admitidos: inworld-tts-1.5-max (predeterminado), inworld-tts-1.5-mini, inworld-tts-1-max, inworld-tts-1.
Las respuestas usan MP3 de forma predeterminada. Cuando el destino del canal es voice-note, OpenClaw solicita a Inworld OGG_OPUS para que el audio se reproduzca como una burbuja de voz nativa. La síntesis de telefonía usa PCM sin procesar a 22050 Hz para alimentar el puente de telefonía.
Sobrescribe el host de la API con messages.tts.providers.inworld.baseUrl. Las barras finales se eliminan antes de enviar las solicitudes.

Relacionado

Texto a voz

Resumen de TTS, proveedores y configuración de messages.tts.

Configuración

Referencia completa de configuración, incluidos los ajustes de messages.tts.

Proveedores

Todos los proveedores incluidos de OpenClaw.

Solución de problemas

Problemas comunes y pasos de depuración.