複数人の発言が混在して、誰の発言かわからなくなる
通常の文字起こしでは全発言がひとつのテキストになり、後から「これは誰の発言?」と追えない。話者識別を使うと発言者ごとにラベルが付き、議事録の可読性が大幅に上がります。
採用面接の評価に「誰がどう答えたか」の記録が必要
採用面接では「候補者の回答」と「面接官の質問」を分離して記録することが重要。話者識別により候補者の発言だけを抽出して評価シートに使えます。
ファイルアップロードと同時に話者分析を開始
音声ファイルをアップロードすると、文字起こしと並行して話者分離処理が自動で走ります。
pyannoteが声紋で話者を分離
pyannote.audioが声紋(音声特徴)をもとに話者を自動でクラスタリング。「Speaker A」「Speaker B」のようにラベル付けします。
話者名を編集して議事録に反映
自動生成された話者ラベルを実際の名前(例:「田中さん」)に変更可能。変更はAI議事録生成にも反映されます。
| 話者識別エンジン | pyannote.audio 3.1 |
| 推奨話者数 | 2〜6名(それ以上は精度低下の可能性あり) |
| 話者識別精度(社内テスト) | 80〜90%(クリアな音声、2〜4名) |
| 話者名の編集 | 対応 |
| タイムスタンプ | 話者ごとに付与 |
会議録音には機密情報が含まれます。Kaigi AIはデータの取り扱いを最高水準で管理しています。
日本の個人情報の保護に関する法律(個人情報保護法)に基づいた適切なデータ管理体制のもとサービスを提供しています。
すべての音声データ・議事録データはAWS東京リージョン(ap-northeast-1)で処理・保管します。データが日本国外に出ることはありません。
お客様がアップロードした音声・文字起こしデータをAIモデルのトレーニングに使用することは一切ありません。データはお客様のものです。
Q. 事前に話者の音声を登録する必要がありますか?
A. いいえ。事前登録は不要です。会議音声のみから自動でクラスタリングします。ただし特定人物の名前との紐付けは手動で行う必要があります。
Q. 話者数を事前に指定する必要がありますか?
A. 指定は不要ですが、参加者数が多い場合(7名以上)は精度が下がりやすいです。話者数を事前に指定するオプションも利用可能です(チームプラン以上)。
Q. 話者が重なって話した場合はどうなりますか?
A. 複数人が同時に発話している区間は、最も声量の大きい話者に割り当てられます。割り込み・被り発言は完全には分離できない場合があります。