VoiceMode MCP сервер
Естественные голосовые разговоры для AI-помощников. VoiceMode добавляет человекоподобные голосовые взаимодействия в Claude Code и AI редакторы кода через Model Context Protocol (MCP).
автор: Community
curl -fsSL https://vibebaza.com/i/voicemode | bash
Естественные голосовые разговоры для AI-помощников. VoiceMode добавляет человекоподобные голосовые взаимодействия в Claude Code и AI редакторы кода через Model Context Protocol (MCP).
Установка
UV Tool Install
uv tool install voice-mode
Быстрая установка с зависимостями
curl -LsSf https://astral.sh/uv/install.sh | sh
uvx voice-mode-install
export OPENAI_API_KEY=your-openai-key
claude mcp add --scope user voicemode -- uvx --refresh voice-mode
claude converse
Claude Code (CLI)
claude mcp add --scope user voicemode uvx --refresh voice-mode
Из исходного кода
git clone https://github.com/mbailey/voicemode.git
cd voicemode
uv tool install -e .
NixOS Profile Install
nix profile install github:mbailey/voicemode
Конфигурация
Claude Code с переменными окружения
claude mcp add --scope user --env OPENAI_API_KEY=your-openai-key voicemode -- uvx --refresh voice-mode
Возможности
- Естественные голосовые разговоры с Claude Code - задавайте вопросы и слушайте ответы
- Поддерживает локальные голосовые модели - работает с любыми STT/TTS сервисами, совместимыми с OpenAI API
- Режим реального времени - низкая задержка голосовых взаимодействий с автоматическим выбором транспорта
- MCP интеграция - бесшовная работа с Claude Code (и другими MCP клиентами)
- Обнаружение тишины - автоматически останавливает запись, когда вы прекращаете говорить
- Множественные транспорты - локальный микрофон или коммуникация через LiveKit комнату (опционально)
Переменные окружения
Опциональные
OPENAI_API_KEY- OpenAI API ключ для сервисов преобразования речи в текст и текста в речьVOICEMODE_SAVE_AUDIO- Сохранять все аудиофайлы (как TTS вывод, так и STT ввод)
Примеры использования
Start a voice conversation with Claude using 'claude converse'
Ask questions verbally and hear responses through voice interactions
Use natural speech for coding assistance and AI conversations
Ресурсы
Примечания
Поддерживает Python 3.10-3.14. Работает на Linux, macOS, Windows (WSL) и NixOS. Требует системные аудио-зависимости (ffmpeg, portaudio и т.д.) и микрофон/динамики. LiveKit интеграция опциональна и требует Python 3.10-3.13. Локальные STT/TTS сервисы (Whisper.cpp, Kokoro) доступны для использования с акцентом на приватность.