2/2013
32/54

123ロエレクトロニカ社のCコンパイラを採用した。 今回利用した音声認識モジュールは,音声認識開始前に,以下3つのモードのいずれかを選択する必要がある。① 特定話者モード(SDモード) SVモードと合わせて任意のフレーズを32個登録できる。フレーズを登録学習させた話者と,一致する話者でないと認識ができないモード。 あらかじめ登録されている計25個のフレーズ(ワードセットは3種類)に対して,話者を特定せず認識できるモード。あらかじめ登録されているフレーズを表6に示す。 SIモードでは,音声認識開始前にワードセットNo.の指定が必要である。 登録したフレーズを最大5人の話者で区別して認識できるモード。同一フレーズでも話者を区別して認識可能。 音声認識モジュールは,エンドユーザへ以下のような反応を返す。 認識成功とは,学習登録したフレーズもしくはあらかじめ登録されているフレーズ(例えば「上」)を,話者が発声し一致した場合である。 認識失敗とは,制限時間内に話者が発声しないような無音声な場合,もしくは発声したが音声認識モジュールが認識できない雑音レベルだった場合である。登録フレーズ-30- 誤認識とは,認識失敗と異なり,話者が発声したフレーズとは想定外の学習登録したフレーズもしくはあらかじめ登録されているフレーズで認識した場合である(例えば,「上」と発声したのに「下」で認識した)。 平成24年11月2日(金)に対象者宅で,音声認識モジュールの各モードの動作検証を行った。下位コントローラーが未完成だったため,音声認識モジュールと付属のアプリケーションソフト(EasyVR)を利用し検証した。① 特定話者モード(SDモード)の動作結果 本来ならフレーズ登録した話者のみ認識するモードだが,フレーズ登録者以外の話者でも認識成功してしまった。 あらかじめ登録されているフレーズであれば,不特定の話者で認識した。ここで意図的にあらかじめ登録されているフレーズを含む歌を,対象者宅のTVから流した結果,認識成功してしまった。 フレーズ登録したそれぞれの話者で認識した。しかしながら,フレーズ登録した話者であっても,声のトーン,イントネーション,フレーズ時間(話す速度)によって誤認識および認識失敗することがわかった。 以上の結果から,テーブルを上昇下降する「上」と「下」があらかじめフレーズとして登録されている不特定話者モード(SIモード)を,下位コントローラーで採用することとした。 音声認識モジュールは,PICマイコンのUARTによる通信方法で制御できる。認識処理の流れを図18に示す。 ①認識開始コマンドでSIモードおよびワードセットを指定する。図18ではワードセットNo.2を指4.1.3 音声認識モジュールについて② 不特定話者モード(SIモード)③ 話者特定モード(SVモード) * 認識成功(Recognition OK) * 認識失敗(Recognition Error)表6 SIモード登録フレーズワードセットNo.アクション,進め,曲がれ,走れ,見ろ,攻撃,止まれ,こんにちは左,右,上,下,前,後ろゼロ,イチ,ニ,サン,ヨン,ゴ,ロク,ナナ,ハチ,キュウまたはク,ジュウ技能と技術 2/2013 * 誤認識(Error)4.1.4 音声認識モジュール各モードの動作検証② 不特定話者モード(SIモード)の動作結果③ 話者特定モード(SVモード)の動作結果4.2 不特定話者モード(SIモード)処理手順

元のページ  ../index.html#32

このブックを見る