"音声入力ソフト"( 自分の場合は DragonSpeech 7.0 )を活用した "口述筆記(ディクテーション)" に一時凝ったことがある。今でも思い出したように使うこともある。自分側と、ソフト側とが共に "ラーニング!" を積み重ねれば、まずまず使えるようになるのだが、キーボード入力の方がやはり容易いのでいつの間にか離れている......。
◆参照 君は話しはうまいが、文章を書く段になるとどうして小難しくなるんだ?( 当誌 2009.11.25 )
そんな折、もともと関心があった「音声認識......」という文字が目に飛び込んできた。下記引用サイト記事:音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」/CNET Japan/2012.04.09 であった。
"音声入力ソフト" では、相応に "苦労と努力(?)" を経てきただけに、え~? スマホのレベルでそんなことができるの? という疑問が先立った。
と言うのも、"音声入力 → テキスト変換" 処理というものは、"音声辞書データ" の "DB" を含めて、ソフト的には、結構、"重装備" となるはずだからである......。
が、よく読んでみると、<クラウド上で音声を解析 ...... 処理をクラウドに任せることにより、より正確で速い変換を可能にしている。>とあったからナルホドとガッテンした。
まあ、最近の話題でもある人工知能の "音声入力ソフト" である "Siri" にしても、"クラウド"(クライアント - サーバ型?)援用らしいから、スマホ単体機能ということでないならば可能だということにになるわけか......。
まだ "活用前" なので "何にもいえねぇ" わけだけど、もともと "音声入力ソフト" はビミョーなソフトであるため、<無理してすべてを音声で入力しようとするのではなく音声入力と手入力とを合わせて使用>というスタンスで臨むならば便利に使えるのかもしれない......。
音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」
音声認識メールクラウドは、デスクトップ版などで定評のある音声認識エンジン「AmiVoice」を基にして、クラウド上で音声を解析してテキストに変換するアプリだ。処理をクラウドに任せることにより、より正確で速い変換を可能にしている。
まず、音声認識を開始するにはインターネットへの接続が必要であることに注意する。インターネットに接続しなくても使用できる音声認識メールST版も提供されているが、認識精度は音声認識メールクラウドの方が数段上のため、クラウド版をお勧めする。
音声認識を開始するには、キーボードの上に表示されている丸いマイクアイコンをタップする。iPhoneのマイクに向かって話し始めると、認識されている様子が波線で表示され、話すのを止めると自動的に音声がテキストに変換されて画面に表示される。入力の操作方法は設定画面で変更することができ、マイクボタンを一度だけタップして話し始めるか、マイクボタンを押している間に話したことを変換するか、好みの動作を設定できる。
マイクボタンの左側に句点ボタンがあるのは、地味な機能だが便利だ。わかりやすい文章であれば自動的に句点が付くが、言いよどんだり一息おいただけの時に、いちいち句点が付くのでは面倒だ。しかし、キーボードから句点を入力するのは一手間かかる感じがする。その点、句点ボタンをポンとタップするだけで済むのはありがたい。
変換されたテキストを確定する前であれば、マイクボタンの右隣にある三角形のアイコンでカーソルを移動し、変換候補から別の漢字やかなを再選択することができる。もちろん、直接該当する語句をタップして変換し直すこともできる。入力の途中でアプリを終了してしまっても、自らテキストをクリアしない限りテキストが画面に残っているのも便利だ。
入力したテキストは、マイクボタンの左隣にある矢印アイコンをタップすることにより、メール、SMS、Evernote、カレンダーなどで使用できる。また、設定画面であらかじめ設定しておくことにより、Twitterやmixiボイスなどのソーシャルネットワーキングサービスに投稿することが可能だ。
音声認識入力の精度を上げるには、なるべく滑舌よく話し、イントネーションを標準語に近くするのがコツだ。慣れないうちは、無理してすべてを音声で入力しようとするのではなく音声入力と手入力とを合わせて使用し、結果的にテキスト入力の手間が軽減されればよいと考えて使うのがいいだろう。この文章も、そのようにして作成したものだ。
(1) 入力画面。中央のマイクボタンをタップして入力する。中央右端のキーボードアイコンをタップすると、キーボードが非表示になる (2) 入力中は、マイクボタンが赤くなり、音声の強弱に合わせて波線が表示される
(3) キーボードを非表示にすると表示される、画面左下の歯車アイコンをタップすると設定画面に移動する (4) 入力を確定する前なら、カーソルを移動して語句の再変換が可能
(5) 入力モードの切り替えは設定画面で行う。ワンタッチモードが最も楽だが、少しずつ話すような場合は「押しながら」または「切り替え」モードが便利だ (6) 使用するSNSの設定。使用しないサービスをオフにすると、選択肢が減って画面が見やすくなる
>>音声認識メール クラウドのダウンロードはこちらこちらから
( 音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」/CNET Japan/2012.04.09 )( ※引用者注 ―― 画像配置についてはカスタマイズしています。)
"音声入力ソフト" のような、従来のソフト常識では考えにくかったアプリケーションも、こうした "クラウド" 方式を援用することで、活用に堪えられる環境になったようである。今後、どのような興味深い "アプリ" が登場してくるのか期待できそうだ...... (2012.04.10)
コメントする