tools.media.audio के माध्यम से आने वाले
ऑडियो/voice-note ट्रांसक्रिप्शन और plugins.entries.voice-call.config.streaming के माध्यम से Voice Call
स्ट्रीमिंग STT के लिए किया जाता है।
बैच ट्रांसक्रिप्शन के लिए, OpenClaw पूरी ऑडियो फ़ाइल को Deepgram पर अपलोड करता है
और ट्रांसक्रिप्ट को उत्तर पाइपलाइन ({{Transcript}} +
[Audio] ब्लॉक) में इंजेक्ट करता है। Voice Call स्ट्रीमिंग के लिए, OpenClaw लाइव G.711
u-law फ़्रेम को Deepgram के WebSocket listen endpoint पर फ़ॉरवर्ड करता है और Deepgram द्वारा लौटाए जाने पर आंशिक या
अंतिम ट्रांसक्रिप्ट उत्सर्जित करता है।
| विवरण | मान |
|---|---|
| वेबसाइट | deepgram.com |
| दस्तावेज़ | developers.deepgram.com |
| प्रमाणीकरण | DEEPGRAM_API_KEY |
| डिफ़ॉल्ट मॉडल | nova-3 |
शुरू करना
कॉन्फ़िगरेशन विकल्प
| विकल्प | पथ | विवरण |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram model id (डिफ़ॉल्ट: nova-3) |
language | tools.media.audio.models[].language | भाषा संकेत (वैकल्पिक) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | भाषा पहचान सक्षम करें (वैकल्पिक) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | विराम चिह्न सक्षम करें (वैकल्पिक) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | smart formatting सक्षम करें (वैकल्पिक) |
- With language hint
- With Deepgram options
Voice Call स्ट्रीमिंग STT
बंडल किया गयाdeepgram Plugin, Voice Call Plugin के लिए एक realtime transcription provider भी पंजीकृत करता है।
| सेटिंग | कॉन्फ़िग पथ | डिफ़ॉल्ट |
|---|---|---|
| API key | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | DEEPGRAM_API_KEY पर fallback करता है |
| मॉडल | ...deepgram.model | nova-3 |
| भाषा | ...deepgram.language | (सेट नहीं) |
| एन्कोडिंग | ...deepgram.encoding | mulaw |
| सैंपल दर | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Interim results | ...deepgram.interimResults | true |
Voice Call को telephony audio 8 kHz G.711 u-law के रूप में प्राप्त होता है। Deepgram
streaming provider डिफ़ॉल्ट रूप से
encoding: "mulaw" और sampleRate: 8000 का उपयोग करता है, इसलिए
Twilio media frames सीधे फ़ॉरवर्ड किए जा सकते हैं।नोट्स
Authentication
Authentication
प्रमाणीकरण मानक provider auth order का पालन करता है।
DEEPGRAM_API_KEY
सबसे सरल path है।Proxy and custom endpoints
Proxy and custom endpoints
proxy का उपयोग करते समय
tools.media.audio.baseUrl और
tools.media.audio.headers के साथ endpoints या headers को override करें।Output behavior
Output behavior
आउटपुट अन्य providers जैसे ही audio rules का पालन करता है (size caps, timeouts,
transcript injection)।
संबंधित
Media tools
ऑडियो, इमेज, और वीडियो प्रोसेसिंग पाइपलाइन का अवलोकन।
Configuration
media tool settings सहित पूरा config reference।
Troubleshooting
सामान्य समस्याएँ और debugging steps।
FAQ
OpenClaw setup के बारे में अक्सर पूछे जाने वाले प्रश्न।