機能一覧に戻る
👥
Speaker Identification

誰が何を言ったか、自動で分けて記録する

pyannote.audioによる話者ダイアライゼーションで、複数人が参加する会議でも発言者ごとに文字起こしを整理します。

こんな課題を解決します

複数人の発言が混在して、誰の発言かわからなくなる

通常の文字起こしでは全発言がひとつのテキストになり、後から「これは誰の発言?」と追えない。話者識別を使うと発言者ごとにラベルが付き、議事録の可読性が大幅に上がります。

採用面接の評価に「誰がどう答えたか」の記録が必要

採用面接では「候補者の回答」と「面接官の質問」を分離して記録することが重要。話者識別により候補者の発言だけを抽出して評価シートに使えます。

使い方

1

ファイルアップロードと同時に話者分析を開始

音声ファイルをアップロードすると、文字起こしと並行して話者分離処理が自動で走ります。

2

pyannoteが声紋で話者を分離

pyannote.audioが声紋(音声特徴)をもとに話者を自動でクラスタリング。「Speaker A」「Speaker B」のようにラベル付けします。

3

話者名を編集して議事録に反映

自動生成された話者ラベルを実際の名前(例:「田中さん」)に変更可能。変更はAI議事録生成にも反映されます。

仕様・スペック

話者識別エンジンpyannote.audio 3.1
推奨話者数2〜6名(それ以上は精度低下の可能性あり)
話者識別精度(社内テスト)80〜90%(クリアな音声、2〜4名)
話者名の編集対応
タイムスタンプ話者ごとに付与

企業情報セキュリティ要件への準拠

会議録音には機密情報が含まれます。Kaigi AIはデータの取り扱いを最高水準で管理しています。

個人情報保護法準拠

日本の個人情報の保護に関する法律(個人情報保護法)に基づいた適切なデータ管理体制のもとサービスを提供しています。

東京国内サーバー完全処理

すべての音声データ・議事録データはAWS東京リージョン(ap-northeast-1)で処理・保管します。データが日本国外に出ることはありません。

AI学習への二次利用なし

お客様がアップロードした音声・文字起こしデータをAIモデルのトレーニングに使用することは一切ありません。データはお客様のものです。

よくある質問

Q. 事前に話者の音声を登録する必要がありますか?

A. いいえ。事前登録は不要です。会議音声のみから自動でクラスタリングします。ただし特定人物の名前との紐付けは手動で行う必要があります。

Q. 話者数を事前に指定する必要がありますか?

A. 指定は不要ですが、参加者数が多い場合(7名以上)は精度が下がりやすいです。話者数を事前に指定するオプションも利用可能です(チームプラン以上)。

Q. 話者が重なって話した場合はどうなりますか?

A. 複数人が同時に発話している区間は、最も声量の大きい話者に割り当てられます。割り込み・被り発言は完全には分離できない場合があります。

話者識別(ダイアライゼーション)を、今日から無料で

月60分まで無料。クレジットカード不要・30秒でサインアップ。

無料で始める →