チュートリアル
ボイスモード(トークモード)
ElevenLabs TTSを使用してOpenClawと自然な音声会話を楽しめます。
🎙️ トークモードとは?
トークモードはOpenClawとの自然な音声会話を可能にします。自然に話しかけると、ElevenLabsによるリアルな音声でAIが応答します。
仕組み:
ウェイクワードまたはプッシュトゥトークを待機→音声をテキストに変換(Whisper)→AIで処理(Claude、GPTなど)→応答を音声に変換(ElevenLabs)
トークモードにはテキスト読み上げ用のElevenLabs APIキーが必要です。音声認識にはWhisper(OpenAIまたはローカル)を使用します。
必要条件
ElevenLabs APIキー
必須
elevenlabs.ioで登録
プラットフォーム
macOS、iOS、Android
音声入力にはネイティブアプリが必要
権限
マイクへのアクセス
プロンプトが表示されたら許可
セットアップ手順
1
ElevenLabs APIキーを取得
ElevenLabsに登録してAPIキーを取得します:
- • elevenlabs.ioにアクセスしてアカウントを作成
- • プロフィール → APIキーに移動
- • APIキーをコピー
2
OpenClawを設定
openclaw.jsonにElevenLabsの設定を追加します:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true
}
}3
環境変数を設定
または、環境変数としてAPIキーを設定することもできます:
export ELEVENLABS_API_KEY="your_api_key_here"
4
トークモードを開始
OpenClawのメニューバーアプリまたはCLIからトークモードを有効にします:
- • OpenClawのメニューバーアイコンをクリック
- • 「トークモードを開始」を選択
- • またはコマンド実行: openclaw talk
すべての設定オプション
利用可能なすべての音声設定オプション:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true,
"stability": 0.5,
"similarityBoost": 0.75,
"style": 0.5,
"speakerBoost": true
}
}elevenlabs.apiKey— ElevenLabs APIキーelevenlabs.voiceId— 使用する音声ID(デフォルト: Rachel)elevenlabs.model— 使用するモデル(eleven_monolingual_v1、eleven_multilingual_v2)voice.wakeWord— 起動用ウェイクワード(デフォルト: 'Hey Claw')voice.pushToTalk— ウェイクワードの代わりにプッシュトゥトークを使用voice.silenceTimeout— 停止するまでの無音秒数(デフォルト: 2)
音声エイリアス
異なる音声パーソナリティを簡単に切り替えられます。
{
"talk": {
"voiceId": "default",
"voices": {
"default": "EXAVITQu4vr4xnSDxMaL",
"professional": "21m00Tcm4TlvDq8ikWAM",
"friendly": "AZnzlk1XvdvUeBnXmlld",
"narrator": "pNInz6obpgDQGcFmaJgB"
}
}
}利用可能な音声
デフォルト(Rachel)
温かみのある自然な女性の声
プロフェッショナル(Adam)
明瞭で威厳のある男性の声
フレンドリー(Bella)
カジュアルで親しみやすい女性の声
ナレーター(Antoni)
深みのある物語調の男性の声
「プロフェッショナルボイスを使用」と言うか、設定で変更して音声を切り替えます。
プラットフォーム機能
macOS
- ✓クイック切り替え付きメニューバーアプリ
- ✓プッシュトゥトーク用グローバルホットキー
- ✓システムオーディオ統合
- ✓ウェイクワード検出
iOS & Android
- ✓コンパニオンアプリでの音声入力
- ✓バックグラウンドでのウェイクワード検出
- ✓Bluetoothヘッドセット対応
- ✓触覚フィードバック
音声コマンド
音声コマンドでOpenClawを操作:
// Per-reply voice control
{
"voice": "narrator",
"speed": 1.1,
"stability": 0.8
}
This response will be spoken in the narrator voice at slightly faster speed.利用可能なコマンド
Stop— 現在の音声再生を停止Pause— 一時停止して追加入力を待機Cancel— 現在のリクエストをキャンセルRepeat— 最後の応答を繰り返すSlower/Faster— 音声速度を調整
メッセージのTTS
受信メッセージのテキスト読み上げを設定:
{
"tts": {
"enabled": true,
"mode": "tagged",
"provider": "elevenlabs",
"voiceId": "EXAVITQu4vr4xnSDxMaL"
}
}TTSモード
alwaysすべてのメッセージを読み上げ
最適な用途: ハンズフリー操作
inbound受信メッセージのみ読み上げ
最適な用途: 他のチャンネルから送信時
tagged@voiceタグ付きメッセージのみ読み上げ
最適な用途: 選択的な音声出力
対応プロバイダー
- ElevenLabs — ElevenLabs(最高品質)
- OpenAI — OpenAI TTS(高速、高品質)
💡 ヒントとベストプラクティス
- •静かな環境 — 音声認識は背景ノイズが少ない静かな環境で最も効果的です。
- •はっきりと話す — 通常のペースで話してください。文と文の間に少し間を置くと認識精度が向上します。
- •ヘッドフォンを使用 — ヘッドフォンはエコーを防ぎ、ウェイクワードの検出を改善します。
- •クレジットを確認 — ElevenLabsには使用制限があります。中断を避けるためにクレジットを監視してください。