複数人の声を聞き分けるコツ~下手なりの工夫で推理する~

eye catch

早速ですが、文字起こしのお仕事をされている方の中で、複数人の声の聞き分けが得意だという方はいらっしゃいますでしょうか。
おそらくあまり多くはないのではと思いますが…かく言う私も、正直とても苦手です。
私の文字起こし作業における最大の鬼門です…。

しかし、ありがたくいただくお仕事には聞き分けが必要な案件が少なからずありまして、避けては通れません。
(今まで最大15人の聞き分けをやったことがあります…正確性はいかほどだったか分かりませんが)
それでもこれまでに経験した約70件・102時間の案件を通して、自分なりのコツや工夫が定まってきました。
苦手な人間がやっている工夫ということで、参考になるかどうかは知れていますが、まとめて書いてみようと思います。

スポンサーリンク

基本的には工夫は3つ(教則本から抜粋)

こちらの本、お持ちの方も多いと思います。


国語好きを活かして在宅ワーク・副業を始める 文字起こし&テープ起こし即戦力ドリル

私の手元にある初版ですと115ページに、話者の聞き分けが難しい場合の対処法が3つ書かれています。

1)  名乗っているなど、話者を特定できる部分のタイムをメモする
2) 各話者について、声の特徴や話し方をできるだけ多くメモする
3) 声が聞こえる位置を手がかりにする
(株式会社エフスタイル発行・廿里美著・文字起こし&テープ起こし即戦力ドリル初版より抜粋)

私も基本的にはこの3つの工夫をしているので、以下私なりの工夫を付け加えながら述べていきたいと思います。

話者タイムをメモし、そこに立ち戻って都度付き合わせる

一番の基本作業はこれです。
新しい声が聞こえたら、とりあえずその時間をメモ(話者特定の基準となる発言を決める)して、名前が分からなければ取りあえず男性1、男性2…などと割り振って、後から名前が分かれば置き換えていきます。

明らかに「部長のスズキです。」などと言っている場合はすぐ特定できますが
後から別の人が「先ほどスズキさんがおっしゃっていた追加予算の件ですが…」などとヒントを出してくる
追加予算の話を出した人がスズキさんだと分かるパターンもよくあります。

たいていの案件では話者の全体人数を教えてもらえたり、より親切な場合だと録音時の座席表を見せてもらえたりするため、話者全員の最初の発現時のタイムをメモできた時点で(理屈上は)この作業は終わりです。

とはいえ…数えてみると1~2人多い(足りない場合も時々ありますが)ことは日常茶飯事。
同じ人なのに声が違って聞こえると、別の人としてカウントしてしまうことがよくあります。
そのときは明らかに違う人から除外していって、間違えたとおぼしき人2~3人に絞って聞き直します。

話者メモは2回目以降に完成していく

ちなみに、私は1回目(一通り書き起こすとき)で完璧な話者タイムメモを作れることはほぼありません。というか作るつもりもありません。
1回目では
・明らかに新しい人が話し始めたタイミング
・「これは後からのヒントになるぞ!」と思ったタイミング(発言の中で名前を呼んでいるなど)
・(次の項目にも関係しますが)明らかな特徴(方言、声色、口調)があればそれをメモします。
話者タイムメモ完全版を作れるのは2回目(聞き直し)の時のことが多いです。

各話者の特徴をメモする(声が聞こえる位置含む)

特徴をメモすると言っても、どんなものを特徴として捉えればいいのかはケースバイケースで難しいところですが…

私は以下のような特徴をメモすることが多いです。

・年齢…若そう おじさん おじいちゃん 私ぐらい
・声質…高い 低い 落ち着いている 爽やか系 むさ苦しい 柔らかい うるさい 偉そう かすれぎみ 苦しそう ため息多め 芸人の○○っぽい ○○さん(個人的知り合い)に似ている
口調、口癖、話し方の癖
「という中で」「という形」「~のほう」「というふうな~」
「でかい」「めっちゃ」などくだけた言葉を使う
出だしがいつも「だから」「むしろ」「逆に」「結局」「僕はね」「うん、そう、だからね」
語尾がいつも「~したわけ」「~だから」「(確認ではないのに)~よね」一文が長い 間が長め 早口 舌足らず(発音が滑る) キレ気味 他の人の発言にかぶせがち
特徴のある訛り ある専門用語の読み方が他の人と違う 英単語使いがち 倒置が多い
咳払いしてから話す 最後まではっきり発音しない
・話している内容から話者の立場を推測する
ある人の名前を呼び捨てにしているor○○くんと親しそうに呼ぶ
→発言者と名前が出た人は身内同士(同じ所属)である
発言者が冒頭に名乗るルールの会議なのに、名乗らないで発言した
→司会者である
※そもそもどういった立場の人がいて、その人たちはどういう関係にあるのかを理解するのが前提です。経験した中に住民と行政とコンサルタントの会議があったのですが、コンサルタントの位置付けが話の内容からは分かりづらく、最後まで聞いてようやく若干住民寄りの立場なんだと分かったことがありました。その他にもいろいろあるのですが、どうしても内容を引き合いに出さないと説明できないので、守秘義務との兼ね合いが難しく割愛します…。
・声が聞こえる位置
これに関しては、私は「手前、真ん中ぐらい、奥」ぐらいしか分かりません。
ヘッドホンの右or左のほうから聞こえる、という聞き分け方も存在するようですが…私が使っているヘッドホンの問題でしょうか。
ただ、結局は声質や癖で聞き分けるので、声が聞こえる位置はあくまで補助的な要素だと思っています。椅子に前のめりに座るか背もたれにもたれるかなど、ちょっとの距離の変化でも声が違って聞こえるので。

Express Scribeでの音声突き合わせの実践

話者メモを見ながら、これはどの人だろう?と思った人の発言がある都度、メモした時間(基準と決めた発言)に戻って突き合わせます。
私がExpress Scribeで実際にやっている操作は以下の通りです。
(注:2019年12月24日 Express Scribeの「しおり機能」使用の方法に書き換えました。読者の方から教えていただきました。M様、ありがとうございます。)

①(事前準備)メニュー内、しおりをクリックし、一番下の「しおり一覧を開く」をクリック
②下のほうにある「しおりの設定時に詳細を尋ねるプロンプトを表示」にチェックを入れる
③誰のものか突き止めたい発言があった時点で「しおり」→「しおりを設定する」
④しおりの詳細を入力してください と出るので、メモしたい話者名を記入。これで登録完了
⑤「しおり」→「しおり一覧」で登録した話者名が一覧で表示されるので、突き合わせたい箇所から必要の都度ここへ戻って聞き比べる。
※突き合わせたい箇所のタイムはCtrl+J「特定の時間へ移動」→コピーしてから、しおり一覧より基準と決めた発言を選んで聞き比べています。

メモは体裁より分かりやすさを重視

そもそも大前提として、メモは納品物ではないので、自分が作業しやすく分かりやすいことが第一です。
私もかなりくだけた言葉で書き殴っていますし、時には声から想像できる顔のイラストを描いてみたりします。
(あとでお名前で検索すると、イラストと似ても似つかない写真が出てきたりして、これはこれで一興です笑)

誰にも見せられないものができあがりますが、逆に誰にも見せてはいけないというところを逆手にとって(?)、自分だけに分かりやすく、作業が楽になるメモを作ればいいと割り切って楽しくやっています。
そして納品が終われば、復元不可能な状態にきっちり処分。これさえ守れば大丈夫です。

おわり。

error: コピーお断り、ごめんなさい