Files
iiEsaywebUI/docs/TTS_CMU_ARCTIC_SPEAKERS.md
2026-02-19 18:12:09 +00:00

2.9 KiB
Raw Blame History

TTS в Open WebUI: английские и русские голоса

Transformers (Локально) — только английский

В настройках Настройки → Речь при выборе системы синтеза речи «Transformers (Локально)» поле «Модель TTS» не является выпадающим списком — в него нужно вручную ввести имя спикера из набора CMU ARCTIC. Эти голоса только для английского языка, русского нет.

Доступные имена (вводить латиницей)

Имя Описание
bdl Мужской голос (США)
slt Женский голос (США)
clb Женский голос (США)
rms Мужской голос (США)
awb Мужской голос (шотландский)
jmk Мужской голос (канадский)
ksp Мужской голос (индийский)

Источник: Matthijs/cmu-arctic-xvectors

Рекомендация: начните с bdl или slt. При первом использовании TTS Open WebUI может скачать модели с Hugging Face.


Русский TTS: Edge TTS (рекомендуется)

Для русской озвучки нужен другой движок. Удобный бесплатный вариант — Edge TTS (голоса Microsoft). В проекте он уже добавлен в docker-compose.yml как сервис openai-edge-tts.

Что сделать в интерфейсе

  1. Настройки → Речь (Audio)
  2. Система синтеза речи: выберите OpenAI (или пункт, где задаётся URL API).
  3. Укажите:
    • TTS API URL: http://openai-edge-tts:5050/v1 (если Open WebUI в том же Docker Compose).
    • API ключ: your_api_key_here (дефолтный ключ Edge TTS).
  4. Голос TTS — введите один из русских голосов:
    • ru-RU-SvetlanaNeural — женский
    • ru-RU-DmitryNeural — мужской
  5. Сохраните настройки.

Все голоса Edge TTS (включая другие языки) можно послушать и выбрать: tts.travisvn.com.

Если Edge TTS ещё не запущен

Из каталога проекта:

docker compose up -d openai-edge-tts

После этого снова откройте настройки речи и выберите голос ru-RU-SvetlanaNeural или ru-RU-DmitryNeural.