チュートリアル

ボイスモード（トークモード）

ElevenLabs TTSを使用してOpenClawと自然な音声会話を楽しめます。

🎙️ トークモードとは？

トークモードはOpenClawとの自然な音声会話を可能にします。自然に話しかけると、ElevenLabsによるリアルな音声でAIが応答します。

仕組み：

ウェイクワードまたはプッシュトゥトークを待機→音声をテキストに変換（Whisper）→AIで処理（Claude、GPTなど）→応答を音声に変換（ElevenLabs）

トークモードにはテキスト読み上げ用のElevenLabs APIキーが必要です。音声認識にはWhisper（OpenAIまたはローカル）を使用します。

必要条件

ElevenLabs APIキー

必須

elevenlabs.ioで登録

プラットフォーム

macOS、iOS、Android

音声入力にはネイティブアプリが必要

権限

マイクへのアクセス

プロンプトが表示されたら許可

セットアップ手順

ElevenLabs APIキーを取得

ElevenLabsに登録してAPIキーを取得します：

• elevenlabs.ioにアクセスしてアカウントを作成
• プロフィール → APIキーに移動
• APIキーをコピー

OpenClawを設定

openclaw.jsonにElevenLabsの設定を追加します：

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true
  }
}

環境変数を設定

または、環境変数としてAPIキーを設定することもできます：

export ELEVENLABS_API_KEY="your_api_key_here"

トークモードを開始

OpenClawのメニューバーアプリまたはCLIからトークモードを有効にします：

• OpenClawのメニューバーアイコンをクリック
• 「トークモードを開始」を選択
• またはコマンド実行: openclaw talk

すべての設定オプション

利用可能なすべての音声設定オプション：

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true,
    "stability": 0.5,
    "similarityBoost": 0.75,
    "style": 0.5,
    "speakerBoost": true
  }
}

elevenlabs.apiKey — ElevenLabs APIキー
elevenlabs.voiceId — 使用する音声ID（デフォルト: Rachel）
elevenlabs.model — 使用するモデル（eleven_monolingual_v1、eleven_multilingual_v2）
voice.wakeWord — 起動用ウェイクワード（デフォルト: 'Hey Claw'）
voice.pushToTalk — ウェイクワードの代わりにプッシュトゥトークを使用
voice.silenceTimeout — 停止するまでの無音秒数（デフォルト: 2）

音声エイリアス

異なる音声パーソナリティを簡単に切り替えられます。

{
  "talk": {
    "voiceId": "default",
    "voices": {
      "default": "EXAVITQu4vr4xnSDxMaL",
      "professional": "21m00Tcm4TlvDq8ikWAM",
      "friendly": "AZnzlk1XvdvUeBnXmlld",
      "narrator": "pNInz6obpgDQGcFmaJgB"
    }
  }
}

利用可能な音声

デフォルト（Rachel）

温かみのある自然な女性の声

プロフェッショナル（Adam）

明瞭で威厳のある男性の声

フレンドリー（Bella）

カジュアルで親しみやすい女性の声

ナレーター（Antoni）

深みのある物語調の男性の声

「プロフェッショナルボイスを使用」と言うか、設定で変更して音声を切り替えます。

プラットフォーム機能

macOS

✓クイック切り替え付きメニューバーアプリ
✓プッシュトゥトーク用グローバルホットキー
✓システムオーディオ統合
✓ウェイクワード検出

iOS & Android

✓コンパニオンアプリでの音声入力
✓バックグラウンドでのウェイクワード検出
✓Bluetoothヘッドセット対応
✓触覚フィードバック

音声コマンド

音声コマンドでOpenClawを操作：

// Per-reply voice control
{
  "voice": "narrator",
  "speed": 1.1,
  "stability": 0.8
}

This response will be spoken in the narrator voice at slightly faster speed.

利用可能なコマンド

Stop — 現在の音声再生を停止
Pause — 一時停止して追加入力を待機
Cancel — 現在のリクエストをキャンセル
Repeat — 最後の応答を繰り返す
Slower/Faster — 音声速度を調整

メッセージのTTS

受信メッセージのテキスト読み上げを設定：

{
  "tts": {
    "enabled": true,
    "mode": "tagged",
    "provider": "elevenlabs",
    "voiceId": "EXAVITQu4vr4xnSDxMaL"
  }
}

TTSモード

always

すべてのメッセージを読み上げ

最適な用途: ハンズフリー操作

inbound

受信メッセージのみ読み上げ

最適な用途: 他のチャンネルから送信時

tagged

@voiceタグ付きメッセージのみ読み上げ

最適な用途: 選択的な音声出力

対応プロバイダー

ElevenLabs — ElevenLabs（最高品質）
OpenAI — OpenAI TTS（高速、高品質）

💡 ヒントとベストプラクティス

•静かな環境 — 音声認識は背景ノイズが少ない静かな環境で最も効果的です。
•はっきりと話す — 通常のペースで話してください。文と文の間に少し間を置くと認識精度が向上します。
•ヘッドフォンを使用 — ヘッドフォンはエコーを防ぎ、ウェイクワードの検出を改善します。
•クレジットを確認 — ElevenLabsには使用制限があります。中断を避けるためにクレジットを監視してください。

ボイスモード準備完了！

ハンズフリーでAIアシスタントと会話を始めましょう。

OpenClawをインストールスキルを探す