音声認識アプリも "クラウド" 方式ならば可能!? 「音声認識メール クラウド」! ......

| | コメント(0) | トラックバック(1)

 "音声入力ソフト"( 自分の場合は DragonSpeech 7.0 )を活用した "口述筆記(ディクテーション)" に一時凝ったことがある。今でも思い出したように使うこともある。自分側と、ソフト側とが共に "ラーニング!" を積み重ねれば、まずまず使えるようになるのだが、キーボード入力の方がやはり容易いのでいつの間にか離れている......。

◆参照 君は話しはうまいが、文章を書く段になるとどうして小難しくなるんだ?( 当誌 2009.11.25 )

 そんな折、もともと関心があった「音声認識......」という文字が目に飛び込んできた。下記引用サイト記事:音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」/CNET Japan/2012.04.09 であった。

 "音声入力ソフト" では、相応に "苦労と努力(?)" を経てきただけに、え~? スマホのレベルでそんなことができるの? という疑問が先立った。
 と言うのも、"音声入力 → テキスト変換" 処理というものは、"音声辞書データ" の "DB" を含めて、ソフト的には、結構、"重装備" となるはずだからである......。
 が、よく読んでみると、<クラウド上で音声を解析 ...... 処理をクラウドに任せることにより、より正確で速い変換を可能にしている。>とあったからナルホドとガッテンした。

 まあ、最近の話題でもある人工知能の "音声入力ソフト" である "Siri" にしても、"クラウド"(クライアント - サーバ型?)援用らしいから、スマホ単体機能ということでないならば可能だということにになるわけか......。
 まだ "活用前" なので "何にもいえねぇ" わけだけど、もともと "音声入力ソフト" はビミョーなソフトであるため、<無理してすべてを音声で入力しようとするのではなく音声入力と手入力とを合わせて使用>というスタンスで臨むならば便利に使えるのかもしれない......。

 音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」

 音声認識メールクラウドは、デスクトップ版などで定評のある音声認識エンジン「AmiVoice」を基にして、クラウド上で音声を解析してテキストに変換するアプリだ。処理をクラウドに任せることにより、より正確で速い変換を可能にしている。

 まず、音声認識を開始するにはインターネットへの接続が必要であることに注意する。インターネットに接続しなくても使用できる音声認識メールST版も提供されているが、認識精度は音声認識メールクラウドの方が数段上のため、クラウド版をお勧めする。

 音声認識を開始するには、キーボードの上に表示されている丸いマイクアイコンをタップする。iPhoneのマイクに向かって話し始めると、認識されている様子が波線で表示され、話すのを止めると自動的に音声がテキストに変換されて画面に表示される。入力の操作方法は設定画面で変更することができ、マイクボタンを一度だけタップして話し始めるか、マイクボタンを押している間に話したことを変換するか、好みの動作を設定できる。

 マイクボタンの左側に句点ボタンがあるのは、地味な機能だが便利だ。わかりやすい文章であれば自動的に句点が付くが、言いよどんだり一息おいただけの時に、いちいち句点が付くのでは面倒だ。しかし、キーボードから句点を入力するのは一手間かかる感じがする。その点、句点ボタンをポンとタップするだけで済むのはありがたい。

 変換されたテキストを確定する前であれば、マイクボタンの右隣にある三角形のアイコンでカーソルを移動し、変換候補から別の漢字やかなを再選択することができる。もちろん、直接該当する語句をタップして変換し直すこともできる。入力の途中でアプリを終了してしまっても、自らテキストをクリアしない限りテキストが画面に残っているのも便利だ。

 入力したテキストは、マイクボタンの左隣にある矢印アイコンをタップすることにより、メール、SMS、Evernote、カレンダーなどで使用できる。また、設定画面であらかじめ設定しておくことにより、Twitterやmixiボイスなどのソーシャルネットワーキングサービスに投稿することが可能だ。

 音声認識入力の精度を上げるには、なるべく滑舌よく話し、イントネーションを標準語に近くするのがコツだ。慣れないうちは、無理してすべてを音声で入力しようとするのではなく音声入力と手入力とを合わせて使用し、結果的にテキスト入力の手間が軽減されればよいと考えて使うのがいいだろう。この文章も、そのようにして作成したものだ。

 
(1) 入力画面。中央のマイクボタンをタップして入力する。中央右端のキーボードアイコンをタップすると、キーボードが非表示になる
(2) 入力中は、マイクボタンが赤くなり、音声の強弱に合わせて波線が表示される
 
 
 
 
(3) キーボードを非表示にすると表示される、画面左下の歯車アイコンをタップすると設定画面に移動する
(4) 入力を確定する前なら、カーソルを移動して語句の再変換が可能
 
 
 
(5) 入力モードの切り替えは設定画面で行う。ワンタッチモードが最も楽だが、少しずつ話すような場合は「押しながら」または「切り替え」モードが便利だ
(6) 使用するSNSの設定。使用しないサービスをオフにすると、選択肢が減って画面が見やすくなる
 

>>音声認識メール クラウドのダウンロードはこちらこちらから

音声認識で声をテキストに変換できるアプリ--「音声認識メール クラウド」/CNET Japan/2012.04.09

( ※引用者注 ―― 画像配置についてはカスタマイズしています。)

 "音声入力ソフト" のような、従来のソフト常識では考えにくかったアプリケーションも、こうした "クラウド" 方式を援用することで、活用に堪えられる環境になったようである。今後、どのような興味深い "アプリ" が登場してくるのか期待できそうだ...... (2012.04.10)













【 SE Assessment 】 【 プロジェクトα 再挑戦者たち 】








トラックバック(1)

このブログ記事を参照しているブログ一覧: 音声認識アプリも "クラウド" 方式ならば可能!? 「音声認識メール クラウド」! ......

このブログ記事に対するトラックバックURL: http://adhocrat.net/mt/mt-tb.cgi/1884

意味ブロ - ちょっと難しい言葉の意味まとめ - クラウドの意味 (2012年5月15日 08:10)

「新たなクラウドサービスを公開した。」 この「クラウド」はネット関連のニュースでよく見かける言葉です。 言葉としては昔からありましたが、 サービ... 続きを読む

コメントする

2020年11月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          














関連サイトへのリンク


  • 電子書籍(eBooks)制作にフォーカスしたサイト
  • 明けない夜はないことを確信するサイト
  • Green(地球環境改善)にフォーカスしたサイト
  • ソフトウェア技術者やSEのための評価と育成、人事考課制度を考えるサイト
  • さまざまな業種・業態でご利用可能なモバイル活用の予約システム!
  • 創作小説『海念と保兵衛』のサイト
  • 創作小説『かもめたちの行方』のサイト
  • 当ブログ推奨の商品を展示したAmazon ストアー!
  • 当AdhocBlogブログの過去のエントリー
  • 株式会社アドホクラット当時のサイト

★売れ筋! No.1!
家庭用"放射線測定器"

日本通信 bモバイルWiFi ルータ+1 ヶ月定額SIM BM-U300W-1M
価格:¥ 20,208
国内配送料無料 Amazon





このブログ記事について

このページは、yasuo hiroseが2012年4月10日 00:01に書いたブログ記事です。

ひとつ前のブログ記事は、
 「やはり新「iPad」のWi-Fi接続の問題は否めない?Appleでは"調査進行中"だという ......
です。

次のブログ記事は、
 「Microsoftは,"Windows XPユーザー"に「そろそろアップデートを」と呼び掛けるが ......
です。

最近のコンテンツは、
 インデックスページ
で見られます。

過去に書かれたものは、
 アーカイブのページ
で見られます。

年月別アーカイブ