以下のようなケースで、話者の特徴を十分に捉えることが難しいため、話者人数予測や分離精度が悪化してしまう場合がございます。
・録音時間が短い
・音声に残響(雑音)が含まれる
・ネットワーク帯域等の問題で録音品質が悪い
・同じ集音環境で、話者の識別が難しい声音が存在する
・同じ集音環境で、発話量が少ない話者が複数いる
下記の注意事項にご注意いただくことで、話者分離の精度向上につながる可能性がございます。
■注意事項
・発話が明瞭でない
・声量が小さい
・途切れかかったような喋り方(1秒ほど無音でぽつぽつ発生するような)
・話者分離の精度が悪い/話者が認識されないケース
・空調等の環境音、周囲の音が混じってしまうような録音環境