52 lines
2.9 KiB
Markdown
52 lines
2.9 KiB
Markdown
|
|
# TTS в Open WebUI: английские и русские голоса
|
|||
|
|
|
|||
|
|
## Transformers (Локально) — только английский
|
|||
|
|
|
|||
|
|
В настройках **Настройки → Речь** при выборе системы синтеза речи **«Transformers (Локально)»** поле **«Модель TTS»** не является выпадающим списком — в него нужно **вручную ввести** имя спикера из набора CMU ARCTIC. Эти голоса **только для английского языка**, русского нет.
|
|||
|
|
|
|||
|
|
### Доступные имена (вводить латиницей)
|
|||
|
|
|
|||
|
|
| Имя | Описание |
|
|||
|
|
|------|------------------------|
|
|||
|
|
| `bdl` | Мужской голос (США) |
|
|||
|
|
| `slt` | Женский голос (США) |
|
|||
|
|
| `clb` | Женский голос (США) |
|
|||
|
|
| `rms` | Мужской голос (США) |
|
|||
|
|
| `awb` | Мужской голос (шотландский) |
|
|||
|
|
| `jmk` | Мужской голос (канадский) |
|
|||
|
|
| `ksp` | Мужской голос (индийский) |
|
|||
|
|
|
|||
|
|
Источник: [Matthijs/cmu-arctic-xvectors](https://huggingface.co/datasets/Matthijs/cmu-arctic-xvectors)
|
|||
|
|
|
|||
|
|
Рекомендация: начните с **`bdl`** или **`slt`**. При первом использовании TTS Open WebUI может скачать модели с Hugging Face.
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Русский TTS: Edge TTS (рекомендуется)
|
|||
|
|
|
|||
|
|
Для **русской** озвучки нужен другой движок. Удобный бесплатный вариант — **Edge TTS** (голоса Microsoft). В проекте он уже добавлен в `docker-compose.yml` как сервис `openai-edge-tts`.
|
|||
|
|
|
|||
|
|
### Что сделать в интерфейсе
|
|||
|
|
|
|||
|
|
1. **Настройки → Речь (Audio)**
|
|||
|
|
2. **Система синтеза речи:** выберите **OpenAI** (или пункт, где задаётся URL API).
|
|||
|
|
3. Укажите:
|
|||
|
|
- **TTS API URL:** `http://openai-edge-tts:5050/v1` (если Open WebUI в том же Docker Compose).
|
|||
|
|
- **API ключ:** `your_api_key_here` (дефолтный ключ Edge TTS).
|
|||
|
|
4. **Голос TTS** — введите один из русских голосов:
|
|||
|
|
- **`ru-RU-SvetlanaNeural`** — женский
|
|||
|
|
- **`ru-RU-DmitryNeural`** — мужской
|
|||
|
|
5. Сохраните настройки.
|
|||
|
|
|
|||
|
|
Все голоса Edge TTS (включая другие языки) можно послушать и выбрать: [tts.travisvn.com](https://tts.travisvn.com/).
|
|||
|
|
|
|||
|
|
### Если Edge TTS ещё не запущен
|
|||
|
|
|
|||
|
|
Из каталога проекта:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
docker compose up -d openai-edge-tts
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
После этого снова откройте настройки речи и выберите голос `ru-RU-SvetlanaNeural` или `ru-RU-DmitryNeural`.
|