MCP Бесплатно

Fish Audio MCP сервер

MCP сервер, который обеспечивает бесшовную интеграцию между Text-to-Speech API от Fish Audio и LLM вроде Claude, предоставляя возможности синтеза речи на естественном языке с клонированием голоса, мультиязычной поддержкой и потоковыми возможностями.

автор: da-okazaki

Установка
Копируй и вставляй в терминал
curl -fsSL https://vibebaza.com/i/fish-audio | bash

MCP сервер, который обеспечивает бесшовную интеграцию между Text-to-Speech API от Fish Audio и LLM вроде Claude, предоставляя возможности синтеза речи на естественном языке с клонированием голоса, мультиязычной поддержкой и потоковыми возможностями.

Установка

NPX (Прямой запуск)

npx @alanse/fish-audio-mcp-server

Глобальная установка через NPM

npm install -g @alanse/fish-audio-mcp-server

Из исходников

git clone https://github.com/da-okazaki/mcp-fish-audio-server.git
cd mcp-fish-audio-server
npm install
npm run build
npm run dev

Конфигурация

Режим одного голоса

{
  "mcpServers": {
    "fish-audio": {
      "command": "npx",
      "args": ["-y", "@alanse/fish-audio-mcp-server"],
      "env": {
        "FISH_API_KEY": "your_fish_audio_api_key_here",
        "FISH_MODEL_ID": "speech-1.6",
        "FISH_REFERENCE_ID": "your_voice_reference_id_here",
        "FISH_OUTPUT_FORMAT": "mp3",
        "FISH_STREAMING": "false",
        "FISH_LATENCY": "balanced",
        "FISH_MP3_BITRATE": "128",
        "FISH_AUTO_PLAY": "false",
        "AUDIO_OUTPUT_DIR": "~/.fish-audio-mcp/audio_output"
      }
    }
  }
}

Режим нескольких голосов

{
  "mcpServers": {
    "fish-audio": {
      "command": "npx",
      "args": ["-y", "@alanse/fish-audio-mcp-server"],
      "env": {
        "FISH_API_KEY": "your_fish_audio_api_key_here",
        "FISH_MODEL_ID": "speech-1.6",
        "FISH_REFERENCES": "[{'reference_id':'id1','name':'Alice','tags':['female','english']},{'reference_id':'id2','name':'Bob','tags':['male','japanese']},{'reference_id':'id3','name':'Carol','tags':['female','japanese','anime']}]",
        "FISH_DEFAULT_REFERENCE": "id1",
        "FISH_OUTPUT_FORMAT": "mp3",
        "FISH_STREAMING": "false",
        "FISH_LATENCY": "balanced",
        "FISH_MP3_BITRATE": "128",
        "FISH_AUTO_PLAY": "false",
        "AUDIO_OUTPUT_DIR": "~/.fish-audio-mcp/audio_output"
      }
    }
  }
}

Доступные инструменты

Инструмент Описание
fish_audio_tts Генерирует речь из текста с использованием TTS API от Fish Audio с поддержкой кастомных голосов, потокового вещания...
fish_audio_list_references Показывает все настроенные голосовые референсы с их ID, именами и тегами

Возможности

  • Высококачественный TTS с современным синтезом речи
  • Потоковая поддержка для стрима аудио в реальном времени и приложений с низкой задержкой
  • Поддержка нескольких голосов с кастомными голосовыми моделями через референс ID
  • Умный выбор голоса по ID, имени или тегам
  • Управление голосовой библиотекой для настройки и управления несколькими голосовыми референсами
  • Поддержка множества аудиоформатов (MP3, WAV, PCM, Opus)
  • Возможности клонирования голоса для создания кастомных голосовых моделей
  • Мультиязычная поддержка включая английский, японский, китайский и другие
  • WebSocket стрим в реальном времени с живым воспроизведением
  • Гибкая конфигурация через переменные окружения

Переменные окружения

Обязательные

  • FISH_API_KEY - Ваш API ключ Fish Audio

Опциональные

  • FISH_MODEL_ID - TTS модель для использования (s1, speech-1.5, speech-1.6)
  • FISH_REFERENCE_ID - ID голосового референса по умолчанию (режим одного референса)
  • FISH_REFERENCES - Множественные голосовые референсы в формате JSON
  • FISH_DEFAULT_REFERENCE - ID референса по умолчанию при использовании нескольких референсов
  • FISH_OUTPUT_FORMAT - Формат аудио по умолчанию (mp3, wav, pcm, opus)
  • FISH_STREAMING - Включить потоковый режим (HTTP/WebSocket)
  • FISH_LATENCY - Режим задержки (normal, balanced)
  • FISH_MP3_BITRATE - Битрейт MP3 (64, 128, 192)

Примеры использования

Сгенерируй речь с текстом 'Привет, мир! Добро пожаловать в Fish Audio TTS.'
Сгенерируй речь с голосовой моделью xyz123 с текстом 'Это тест кастомного голоса'
Используй голос Alice чтобы сказать 'Привет от Alice'
Сгенерируй японскую речь с текстом 'こんにちは' аниме голосом
Какие голоса доступны?

Ресурсы

Примечания

Требуется API ключ Fish Audio. Поддерживает до 10,000 символов на TTS запрос. Приоритет выбора голоса: reference_id > reference_name > reference_tag > по умолчанию. Включает обработку ошибок для лимитов API, проблем с сетью и некорректных параметров.

Zambulay Спонсор

Карта для оплаты Claude, ChatGPT и других AI