mcp-voicevox

MCP.Pizza Chef: Krekun

The mcp-voicevox server integrates the VoiceVox text-to-speech engine with the Model Context Protocol, enabling LLMs like Claude to generate speech from text using various VoiceVox voices. It requires a running VoiceVox engine (local or remote) and Python 3.10+. This server facilitates real-time, high-quality voice synthesis accessible through MCP, supporting flexible voice selection and easy integration with Claude Desktop via uvx.

Use This MCP server To

Generate speech audio from text using VoiceVox voices Retrieve available VoiceVox voice options dynamically Integrate text-to-speech in AI workflows with Claude Desktop Customize voice synthesis by selecting different VoiceVox voices Enable real-time voice generation in chat or assistant applications

README

VoiceVox MCP サーバー

VoiceVox を介してテキスト読み上げ機能を提供する Model Context Protocol サーバーです。このサーバーにより、Claude は VoiceVox エンジンが提供する様々な音声を使用してテキストから音声を生成することができます。

前提条件

  • VoiceVox エンジンが動作していること(ローカルまたはリモートで)
  • Python 3.10 以上

インストール

uv の使用(推奨)

uv を使用する場合は特別なインストールは必要ありません。直接 uvx を使用して mcp-server-voicevox を実行します。

設定

VoiceVox エンジン

このサーバーは動作するために VoiceVox エンジンが必要です。エンジンの起動は手動で行う必要があります。 デフォルトでは http://localhost:50021 への接続を試みます。--voicevox-url 引数で別の URL を指定することができます。

VoiceVox エンジンは 公式 VoiceVox リポジトリ からダウンロードしてインストールできます。

Claude Desktop 用の設定

Claude Desktop の設定に追加:

uvx を使用する場合
"mcpServers": {
  "voicevox": {
    "command": "uvx",
    "args": ["mcp-server-voicevox", "--voicevox-url=http://localhost:50021"]
  }
}

利用可能なツール

  • get_voices - VoiceVox から利用可能な音声のリストを取得

    • 引数は必要ありません
  • text_to_speech - VoiceVox を使用してテキストを音声に変換

    • 必須引数:
      • text (文字列): 音声に変換するテキスト
    • オプション引数:
      • speaker_id (整数、デフォルト: 1): 使用する音声の ID
      • speed (数値、デフォルト: 1.3): 再生速度の倍率

特別な機能

  • 生成後の音声は、プラットフォーム固有の方法で自動的に再生されます:
    • Windows: デフォルトのシステムプレーヤーを使用
    • macOS: 内蔵の afplay ユーティリティを使用
    • Linux: まず aplay を試し、失敗した場合は xdg-open にフォールバック

ライセンス

mcp-server-voicevox は MIT ライセンスの下で提供されています。これは、MIT ライセンスの条件に従い、自由に使用、修正、配布することができることを意味します。

mcp-voicevox FAQ

How do I set up the VoiceVox engine for this MCP server?
Download and install the VoiceVox engine from its official repository, then run it locally or remotely, ensuring it is accessible at the configured URL (default http://localhost:50021).
What are the system requirements for running mcp-voicevox?
You need Python 3.10 or higher and a running VoiceVox engine instance, either locally or remotely.
How can I configure the server to connect to a remote VoiceVox engine?
Use the --voicevox-url argument to specify the URL of the remote VoiceVox engine when starting the server.
Is special installation required when using uvx to run mcp-voicevox?
No special installation is needed; you can run mcp-server-voicevox directly with uvx as recommended.
Can this server be used with LLMs other than Claude?
Yes, while it is demonstrated with Claude, the server can work with any MCP-compatible LLM such as OpenAI's GPT-4 or Anthropic's Claude.
What tools does the mcp-voicevox server provide?
It provides tools like get_voices to list available voices and text_to_speech to convert text into speech audio.
How do I integrate mcp-voicevox with Claude Desktop?
Add the mcp-voicevox server configuration to Claude Desktop's mcpServers settings, specifying the command and voicevox URL as shown in the documentation.
Can I customize the voice used for speech synthesis?
Yes, you can select from multiple voices provided by the VoiceVox engine using the get_voices tool.