Research Topics: Large Vocabulary Continuous Speech Recognition

大語彙連続音声認識

複数モデルの出力の共通部分を用いた信頼度

主として音響モデル・デコーダの異なる二つの大語彙連続音声認識モデルの間 で,出力の共通部分が正解単語である割合を網羅的に調査し, 高い信頼度が達成できるモデル組についての分析を行った.

機械学習を用いた複数モデルの出力の混合

従来の多数決法による複数モデルの出力の混合では,性能の低いモデルが 多数派となった場合に,混合結果の性能が多数派の性能の影響を受けてしまう. 個々のモデルの信頼性に応じて,信頼度の高い認識結果を選択に組み合わせる 混合規則を機械学習の手法により学習し,この混合規則を用いて 複数モデルの出力の混合を行う.

________________________________________________________________________
Written by Takehito Utsuro