> ## Documentation Index
> Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# ElevenLabs

OpenClaw टेक्स्ट-से-स्पीच के लिए ElevenLabs, Scribe v2 के साथ बैच स्पीच-से-टेक्स्ट,
और Scribe v2 Realtime के साथ स्ट्रीमिंग STT का उपयोग करता है।

| क्षमता                      | OpenClaw सतह                                                          | डिफ़ॉल्ट                 |
| --------------------------- | --------------------------------------------------------------------- | ------------------------ |
| टेक्स्ट-से-स्पीच            | `messages.tts` / `talk`                                               | `eleven_multilingual_v2` |
| बैच स्पीच-से-टेक्स्ट        | `tools.media.audio`                                                   | `scribe_v2`              |
| स्ट्रीमिंग स्पीच-से-टेक्स्ट | Voice Call स्ट्रीमिंग या Google Meet `realtime.transcriptionProvider` | `scribe_v2_realtime`     |

## प्रमाणीकरण

पर्यावरण में `ELEVENLABS_API_KEY` सेट करें। मौजूदा ElevenLabs टूलिंग के साथ
संगतता के लिए `XI_API_KEY` भी स्वीकार किया जाता है।

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
export ELEVENLABS_API_KEY="..."
```

## टेक्स्ट-से-स्पीच

```json5 theme={"theme":{"light":"min-light","dark":"min-dark"}}
{
  messages: {
    tts: {
      providers: {
        elevenlabs: {
          apiKey: "${ELEVENLABS_API_KEY}",
          speakerVoiceId: "pMsXgVXv3BLzUgSXRplE",
          modelId: "eleven_multilingual_v2",
        },
      },
    },
  },
}
```

ElevenLabs v3 TTS का उपयोग करने के लिए `modelId` को `eleven_v3` पर सेट करें।
OpenClaw मौजूदा इंस्टॉल के लिए `eleven_multilingual_v2` को डिफ़ॉल्ट के रूप में रखता है।

जब ElevenLabs चयनित `voice.tts`/`messages.tts` प्रदाता होता है, तो Discord वॉयस
चैनल ElevenLabs के स्ट्रीमिंग TTS एंडपॉइंट का उपयोग करते हैं। प्लेबैक OpenClaw के
पूरी ऑडियो फ़ाइल को पहले डाउनलोड करके लिखने की प्रतीक्षा करने के बजाय लौटाई गई
ऑडियो स्ट्रीम से शुरू होता है। `latencyTier` उन मॉडलों के लिए ElevenLabs के
`optimize_streaming_latency` क्वेरी पैरामीटर से मैप होता है जो इसे स्वीकार करते हैं; OpenClaw
`eleven_v3` के लिए वह पैरामीटर छोड़ देता है, क्योंकि वह इसे अस्वीकार करता है।

## स्पीच-से-टेक्स्ट

इनबाउंड ऑडियो अटैचमेंट और छोटे रिकॉर्ड किए गए वॉयस सेगमेंट के लिए Scribe v2 का उपयोग करें:

```json5 theme={"theme":{"light":"min-light","dark":"min-dark"}}
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "elevenlabs", model: "scribe_v2" }],
      },
    },
  },
}
```

OpenClaw `model_id: "scribe_v2"` के साथ multipart ऑडियो ElevenLabs
`/v1/speech-to-text` पर भेजता है। मौजूद होने पर भाषा संकेत `language_code` से मैप होते हैं।

## स्ट्रीमिंग STT

बंडल किया गया `elevenlabs` Plugin, Voice Call और Google Meet एजेंट-मोड स्ट्रीमिंग
ट्रांसक्रिप्शन के लिए Scribe v2 Realtime पंजीकृत करता है।

| सेटिंग         | कॉन्फ़िग पाथ                                                              | डिफ़ॉल्ट                                            |
| -------------- | ------------------------------------------------------------------------- | --------------------------------------------------- |
| API कुंजी      | `plugins.entries.voice-call.config.streaming.providers.elevenlabs.apiKey` | `ELEVENLABS_API_KEY` / `XI_API_KEY` पर वापस जाता है |
| मॉडल           | `...elevenlabs.modelId`                                                   | `scribe_v2_realtime`                                |
| ऑडियो फ़ॉर्मैट | `...elevenlabs.audioFormat`                                               | `ulaw_8000`                                         |
| सैंपल दर       | `...elevenlabs.sampleRate`                                                | `8000`                                              |
| कमिट रणनीति    | `...elevenlabs.commitStrategy`                                            | `vad`                                               |
| भाषा           | `...elevenlabs.languageCode`                                              | (सेट नहीं)                                          |

```json5 theme={"theme":{"light":"min-light","dark":"min-dark"}}
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "elevenlabs",
            providers: {
              elevenlabs: {
                apiKey: "${ELEVENLABS_API_KEY}",
                audioFormat: "ulaw_8000",
                commitStrategy: "vad",
                languageCode: "en",
              },
            },
          },
        },
      },
    },
  },
}
```

<Note>
  Voice Call, Twilio मीडिया को 8 kHz G.711 u-law के रूप में प्राप्त करता है। ElevenLabs रीयलटाइम
  प्रदाता `ulaw_8000` पर डिफ़ॉल्ट करता है, इसलिए टेलीफ़ोनी फ़्रेम ट्रांसकोडिंग के बिना
  फ़ॉरवर्ड किए जा सकते हैं।
</Note>

Google Meet एजेंट मोड के लिए,
`plugins.entries.google-meet.config.realtime.transcriptionProvider` को
`"elevenlabs"` पर सेट करें और उसी प्रदाता ब्लॉक को
`plugins.entries.google-meet.config.realtime.providers.elevenlabs` के अंतर्गत कॉन्फ़िगर करें।

## संबंधित

* [टेक्स्ट-से-स्पीच](/hi/tools/tts)
* [Google Meet](/hi/plugins/google-meet)
* [मॉडल चयन](/hi/concepts/model-providers)
