Fish Audio MCP сервер
MCP сервер, который обеспечивает бесшовную интеграцию между Text-to-Speech API от Fish Audio и LLM вроде Claude, предоставляя возможности синтеза речи на естественном языке с клонированием голоса, мультиязычной поддержкой и потоковыми возможностями.
автор: da-okazaki
curl -fsSL https://vibebaza.com/i/fish-audio | bash
MCP сервер, который обеспечивает бесшовную интеграцию между Text-to-Speech API от Fish Audio и LLM вроде Claude, предоставляя возможности синтеза речи на естественном языке с клонированием голоса, мультиязычной поддержкой и потоковыми возможностями.
Установка
NPX (Прямой запуск)
npx @alanse/fish-audio-mcp-server
Глобальная установка через NPM
npm install -g @alanse/fish-audio-mcp-server
Из исходников
git clone https://github.com/da-okazaki/mcp-fish-audio-server.git
cd mcp-fish-audio-server
npm install
npm run build
npm run dev
Конфигурация
Режим одного голоса
{
"mcpServers": {
"fish-audio": {
"command": "npx",
"args": ["-y", "@alanse/fish-audio-mcp-server"],
"env": {
"FISH_API_KEY": "your_fish_audio_api_key_here",
"FISH_MODEL_ID": "speech-1.6",
"FISH_REFERENCE_ID": "your_voice_reference_id_here",
"FISH_OUTPUT_FORMAT": "mp3",
"FISH_STREAMING": "false",
"FISH_LATENCY": "balanced",
"FISH_MP3_BITRATE": "128",
"FISH_AUTO_PLAY": "false",
"AUDIO_OUTPUT_DIR": "~/.fish-audio-mcp/audio_output"
}
}
}
}
Режим нескольких голосов
{
"mcpServers": {
"fish-audio": {
"command": "npx",
"args": ["-y", "@alanse/fish-audio-mcp-server"],
"env": {
"FISH_API_KEY": "your_fish_audio_api_key_here",
"FISH_MODEL_ID": "speech-1.6",
"FISH_REFERENCES": "[{'reference_id':'id1','name':'Alice','tags':['female','english']},{'reference_id':'id2','name':'Bob','tags':['male','japanese']},{'reference_id':'id3','name':'Carol','tags':['female','japanese','anime']}]",
"FISH_DEFAULT_REFERENCE": "id1",
"FISH_OUTPUT_FORMAT": "mp3",
"FISH_STREAMING": "false",
"FISH_LATENCY": "balanced",
"FISH_MP3_BITRATE": "128",
"FISH_AUTO_PLAY": "false",
"AUDIO_OUTPUT_DIR": "~/.fish-audio-mcp/audio_output"
}
}
}
}
Доступные инструменты
| Инструмент | Описание |
|---|---|
fish_audio_tts |
Генерирует речь из текста с использованием TTS API от Fish Audio с поддержкой кастомных голосов, потокового вещания... |
fish_audio_list_references |
Показывает все настроенные голосовые референсы с их ID, именами и тегами |
Возможности
- Высококачественный TTS с современным синтезом речи
- Потоковая поддержка для стрима аудио в реальном времени и приложений с низкой задержкой
- Поддержка нескольких голосов с кастомными голосовыми моделями через референс ID
- Умный выбор голоса по ID, имени или тегам
- Управление голосовой библиотекой для настройки и управления несколькими голосовыми референсами
- Поддержка множества аудиоформатов (MP3, WAV, PCM, Opus)
- Возможности клонирования голоса для создания кастомных голосовых моделей
- Мультиязычная поддержка включая английский, японский, китайский и другие
- WebSocket стрим в реальном времени с живым воспроизведением
- Гибкая конфигурация через переменные окружения
Переменные окружения
Обязательные
FISH_API_KEY- Ваш API ключ Fish Audio
Опциональные
FISH_MODEL_ID- TTS модель для использования (s1, speech-1.5, speech-1.6)FISH_REFERENCE_ID- ID голосового референса по умолчанию (режим одного референса)FISH_REFERENCES- Множественные голосовые референсы в формате JSONFISH_DEFAULT_REFERENCE- ID референса по умолчанию при использовании нескольких референсовFISH_OUTPUT_FORMAT- Формат аудио по умолчанию (mp3, wav, pcm, opus)FISH_STREAMING- Включить потоковый режим (HTTP/WebSocket)FISH_LATENCY- Режим задержки (normal, balanced)FISH_MP3_BITRATE- Битрейт MP3 (64, 128, 192)
Примеры использования
Сгенерируй речь с текстом 'Привет, мир! Добро пожаловать в Fish Audio TTS.'
Сгенерируй речь с голосовой моделью xyz123 с текстом 'Это тест кастомного голоса'
Используй голос Alice чтобы сказать 'Привет от Alice'
Сгенерируй японскую речь с текстом 'こんにちは' аниме голосом
Какие голоса доступны?
Ресурсы
Примечания
Требуется API ключ Fish Audio. Поддерживает до 10,000 символов на TTS запрос. Приоритет выбора голоса: reference_id > reference_name > reference_tag > по умолчанию. Включает обработку ошибок для лимитов API, проблем с сетью и некорректных параметров.