X-Microsoft-OutputFormat के माध्यम से भेजता है।
| विवरण | मान |
|---|---|
| वेबसाइट | Azure AI Speech |
| दस्तावेज़ | Speech REST टेक्स्ट-टू-स्पीच |
| प्रमाणीकरण | AZURE_SPEECH_KEY और AZURE_SPEECH_REGION |
| डिफ़ॉल्ट वॉइस | en-US-JennyNeural |
| डिफ़ॉल्ट फ़ाइल आउटपुट | audio-24khz-48kbitrate-mono-mp3 |
| डिफ़ॉल्ट वॉइस-नोट फ़ाइल | ogg-24khz-16bit-mono-opus |
शुरू करना
Azure Speech संसाधन बनाएँ
Azure पोर्टल में, Speech संसाधन बनाएँ। Resource Management > Keys and Endpoint से KEY 1 कॉपी करें,
और संसाधन स्थान कॉपी करें
जैसे
eastus।कॉन्फ़िगरेशन विकल्प
| विकल्प | पथ | विवरण |
|---|---|---|
apiKey | messages.tts.providers.azure-speech.apiKey | Azure Speech संसाधन कुंजी। AZURE_SPEECH_KEY, AZURE_SPEECH_API_KEY, या SPEECH_KEY पर फ़ॉलबैक करता है। |
region | messages.tts.providers.azure-speech.region | Azure Speech संसाधन क्षेत्र। AZURE_SPEECH_REGION या SPEECH_REGION पर फ़ॉलबैक करता है। |
endpoint | messages.tts.providers.azure-speech.endpoint | वैकल्पिक Azure Speech एंडपॉइंट/बेस URL ओवरराइड। |
baseUrl | messages.tts.providers.azure-speech.baseUrl | वैकल्पिक Azure Speech बेस URL ओवरराइड। |
speakerVoice | messages.tts.providers.azure-speech.speakerVoice | Azure वॉइस ShortName (डिफ़ॉल्ट en-US-JennyNeural)। लेगेसी उपनाम: voice। |
lang | messages.tts.providers.azure-speech.lang | SSML भाषा कोड (डिफ़ॉल्ट en-US)। |
outputFormat | messages.tts.providers.azure-speech.outputFormat | ऑडियो-फ़ाइल आउटपुट फ़ॉर्मैट (डिफ़ॉल्ट audio-24khz-48kbitrate-mono-mp3)। |
voiceNoteOutputFormat | messages.tts.providers.azure-speech.voiceNoteOutputFormat | वॉइस-नोट आउटपुट फ़ॉर्मैट (डिफ़ॉल्ट ogg-24khz-16bit-mono-opus)। |
नोट्स
प्रमाणीकरण
प्रमाणीकरण
Azure Speech, Azure OpenAI कुंजी नहीं, बल्कि Speech संसाधन कुंजी का उपयोग करता है। कुंजी
Ocp-Apim-Subscription-Key के रूप में भेजी जाती है; OpenClaw region से
https://<region>.tts.speech.microsoft.com निकालता है, जब तक कि आप
endpoint या baseUrl प्रदान नहीं करते।वॉइस नाम
वॉइस नाम
Azure Speech वॉइस
ShortName मान का उपयोग करें, उदाहरण के लिए
en-US-JennyNeural। बंडल किया गया प्रदाता उसी
Speech संसाधन के माध्यम से वॉइसों की सूची दे सकता है और deprecated या retired चिह्नित वॉइसों को फ़िल्टर करता है।ऑडियो आउटपुट
ऑडियो आउटपुट
Azure
audio-24khz-48kbitrate-mono-mp3,
ogg-24khz-16bit-mono-opus, और riff-24khz-16bit-mono-pcm जैसे आउटपुट फ़ॉर्मैट स्वीकार करता है। OpenClaw
voice-note लक्ष्यों के लिए Ogg/Opus का अनुरोध करता है, ताकि चैनल अतिरिक्त MP3 रूपांतरण के बिना मूल
वॉइस बबल भेज सकें।उपनाम
उपनाम
मौजूदा PRs और उपयोगकर्ता कॉन्फ़िग के लिए
azure को प्रदाता उपनाम के रूप में स्वीकार किया जाता है,
लेकिन नए कॉन्फ़िग में Azure
OpenAI मॉडल प्रदाताओं के साथ भ्रम से बचने के लिए azure-speech का उपयोग करना चाहिए।संबंधित
टेक्स्ट-टू-स्पीच
TTS अवलोकन, प्रदाता, और
messages.tts कॉन्फ़िग।कॉन्फ़िगरेशन
messages.tts सेटिंग्स सहित पूर्ण कॉन्फ़िग संदर्भ।प्रदाता
सभी बंडल किए गए OpenClaw प्रदाता।
समस्या निवारण
सामान्य समस्याएँ और डीबगिंग चरण।