Speaker Identification

誰が何を言ったか、自動で分けて記録する

AIが発言の文脈から話者を推定し、複数人が参加する会議でも発言者ごとに文字起こしを整理します。

こんな課題を解決します

複数人の発言が混在して、誰の発言かわからなくなる

通常の文字起こしでは全発言がひとつのテキストになり、後から「これは誰の発言？」と追えない。話者識別を使うと発言者ごとにラベルが付き、議事録の可読性が大幅に上がります。

採用面接の評価に「誰がどう答えたか」の記録が必要

採用面接では「候補者の回答」と「面接官の質問」を分離して記録することが重要。話者識別により候補者の発言だけを抽出して評価シートに使えます。

文字起こしを生成

Whisperで音声を文字起こしし、タイムスタンプ付きの発言セグメントに分割します。

AIが文脈から話者を推定

Claude AIが発言内容と会話の流れから話者を推定し、「Speaker A」「Speaker B」のようにラベル付けします。声紋の事前登録は不要です。

話者名を編集して議事録に反映

自動生成された話者ラベルを実際の名前（例：「田中さん」）に変更可能。変更はAI議事録生成にも反映されます。

話者識別の方式	Claude AIによる文脈ベース推定（音声の声紋解析は行いません）
推奨話者数	2〜6名（それ以上は推定が難しくなる場合あり）
話者名の編集	対応
タイムスタンプ	話者ごとに付与

会議録音には機密情報が含まれます。Kaigi AIはデータの取り扱いを最高水準で管理しています。

日本の個人情報の保護に関する法律（個人情報保護法）に基づいた適切なデータ管理体制のもとサービスを提供しています。

すべての音声データ・議事録データはAWS東京リージョン（ap-northeast-1）で保管します。

お客様がアップロードした音声・文字起こしデータをAIモデルのトレーニングに使用することは一切ありません。データはお客様のものです。

Q. 事前に話者の音声を登録する必要がありますか？

A. いいえ。事前登録は不要です。AIが文字起こしの文脈から話者を推定します（声紋の解析は行いません）。特定人物の名前との紐付けは手動で行えます。

Q. 話者数を事前に指定する必要がありますか？

A. 指定は不要です。参加者が多い場合（7名以上）は文脈からの推定が難しくなることがあります。

Q. 話者が重なって話した場合はどうなりますか？

A. 発言が重なった区間は、文脈から判断できる範囲でラベル付けします。割り込み・被り発言は完全には分離できない場合があります。