VoiceStudio-MCP-server
VoiceCraft-MCP-Server は、Claude などの AI アシスタントと連携し、テキストを高品質な音声に変換する MCP (Model Context Protocol) サーバーです。
VoiceCraft-MCP-Server は、Claude などの AI アシスタントと連携し、テキストを高品質な音声に変換する MCP (Model Context Protocol) サーバーです。Kokoro の音声合成技術を活用して、自然で表現豊かな音声を生成します。
主な機能
- 🎯 AI アシスタントからのテキスト読み上げリクエストを処理
- 🌏 日本語と英語の自然な音声合成をサポート
- 🔊 テキスト読み上げと会話形式の音声生成
- ⚙️ 音声の速度やピッチなどのカスタマイズオプション
- 🧠 自動言語検出機能
背景
AI アシスタントとの対話をより自然で豊かなものにするために、テキスト応答を音声に変換する機能は重要です。VoiceCraft-MCP-Server は、Claude などの AI アシスタントと Kokoro 音声合成エンジンを橋渡しし、シームレスな音声体験を提供します。
クイックスタート
前提条件
- Python 3.8 以上
- uv パッケージマネージャー
- Kokoro 音声合成エンジン(実モードで使用する場合)
インストール
# リポジトリのクローン
git clone https://github.com/yourusername/VoiceStudio-MCP-Server.git
cd VoiceStudio-MCP-Server
# uvのインストール(まだインストールしていない場合)
# macOS/Linux
curl -sSf https://astral.sh/uv/install.sh | sh
# または Windows
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
# 仮想環境の作成とパッケージのインストール
make setup
# 環境変数の設定
cp .env.example .env
# .env ファイルをエディタで編集して必要な設定を追加
サーバーの起動
# 基本的な起動
make run
# または引数付きで起動
uv run src.main --host 127.0.0.1 --port 8080 --debug
# 開発モード(モック)での起動
MOCK_TTS=true make run
開発者向けコマンド
# テストの実行
make test
# コードのフォーマット
make format
# リントチェック
make lint
# キャッシュとビルドファイルのクリーンアップ
make clean
使用方法
Claude などの AI アシスタントから、以下のようなプロンプトを送信できます:
- 「この内容を日本語で読んで」
- 「英語で会話して」
- 「次のテキストを音声に変換して: こんにちは、世界」
AI アシスタントがこれらのリクエストを認識すると、MCP プロトコルを通じて VoiceCraft-MCP-Server にリクエストが送信され、音声が生成されます。
機能と設定
サポートされている言語
- 日本語
- 英語
※ 将来的に他の言語も追加予定です。
音声カスタマイズオプション
以下のオプションをサポートしています:
- 速度調整 (0.5 - 2.0)
- ピッチ調整 (-10.0 - 10.0)
- 音声タイプ選択 (利用可能な Kokoro の音声モデルに依存)
MCP プロトコルの統合
VoiceCraft-MCP-Server は、Model Context Protocol (MCP) を実装しており、Claude などの AI アシスタントと簡単に連携できます。MCP は AI システムが外部ツールやサービスと通信するための標準プロトコルです。
AI アシスタントの設定から、MCP サーバーとして VoiceCraft-MCP-Server を追加することで、テキスト読み上げ機能を有効化できます。
開発情報
プロジェクト構造
VoiceCraft-MCP-Server/
├── src/
│ ├── main.py # エントリーポイント
│ ├── mcp/ # MCP プロトコル実装
│ ├── kokoro/ # Kokoro 連携モジュール
│ ├── language/ # 言語処理モジュール
│ └── audio/ # 音声処理モジュール
├── tests/ # テストコード
├── docs/ # ドキュメント
├── examples/ # 使用例
├── requirements.txt # 依存パッケージ
└── README.md # このファイル
貢献
バグレポートや機能リクエスト、プルリクエストなど、あらゆる形での貢献を歓迎します。詳細は CONTRIBUTING.md を参照してください。
ライセンス
このプロジェクトは MIT ライセンス の下で公開されています。
謝辞
- Kokoro の優れた音声合成技術
- MCP (Model Context Protocol) の開発者の皆様
- オープンソースコミュニティの貢献者の皆様