tools.media.audio и для потокового STT голосовых вызовов через plugins.entries.voice-call.config.streaming.
Для пакетной транскрибации OpenClaw загружает полный аудиофайл в Deepgram и внедряет транскрипт в конвейер ответа (блок {{Transcript}} + [Audio]). Для потоковой передачи голосового вызова OpenClaw пересылает live-кадры G.711 u-law через WebSocket-эндпоинт Deepgram listen и выдает частичные или финальные транскрипты по мере их возврата Deepgram.
| Сведения | Значение |
|---|---|
| Сайт | deepgram.com |
| Документация | developers.deepgram.com |
| Аутентификация | DEEPGRAM_API_KEY |
| Модель по умолчанию | nova-3 |
Начало работы
Параметры конфигурации
| Параметр | Путь | Описание |
|---|---|---|
model | tools.media.audio.models[].model | Идентификатор модели Deepgram (по умолчанию: nova-3) |
language | tools.media.audio.models[].language | Подсказка языка (необязательно) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Включить определение языка (необязательно) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Включить пунктуацию (необязательно) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Включить интеллектуальное форматирование (необязательно) |
- С подсказкой языка
- С параметрами Deepgram
Потоковое STT для Voice Call
Встроенный Plugindeepgram также регистрирует поставщика транскрибации в реальном времени
для Plugin Voice Call.
| Настройка | Путь конфигурации | По умолчанию |
|---|---|---|
| Ключ API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | Использует DEEPGRAM_API_KEY |
| Модель | ...deepgram.model | nova-3 |
| Язык | ...deepgram.language | (не задано) |
| Кодирование | ...deepgram.encoding | mulaw |
| Частота дискретизации | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Промежуточные результаты | ...deepgram.interimResults | true |
Voice Call получает телефонный звук как 8 kHz G.711 u-law. Поставщик потоковой передачи Deepgram
по умолчанию использует
encoding: "mulaw" и sampleRate: 8000, поэтому
медиакадры Twilio можно пересылать напрямую.Примечания
Аутентификация
Аутентификация
Аутентификация следует стандартному порядку авторизации поставщиков.
DEEPGRAM_API_KEY —
самый простой путь.Прокси и пользовательские конечные точки
Прокси и пользовательские конечные точки
Переопределяйте конечные точки или заголовки с помощью
tools.media.audio.baseUrl и
tools.media.audio.headers при использовании прокси.Поведение вывода
Поведение вывода
Вывод следует тем же правилам для аудио, что и у других поставщиков (ограничения размера, тайм-ауты,
внедрение транскрипта).
Связанные материалы
Медиаинструменты
Обзор конвейера обработки аудио, изображений и видео.
Конфигурация
Полный справочник конфигурации, включая настройки медиаинструментов.
Устранение неполадок
Распространенные проблемы и шаги отладки.
Часто задаваемые вопросы
Часто задаваемые вопросы о настройке OpenClaw.