"PDF 電子書籍"の"読み上げ"のプロセスには、"二重"の"誤読"が横たわっている!? ......

| | コメント(0) | トラックバック(0)

 昨日は、<"読み上げ"音声のサウンド・ファイル化>について書いた。つまり、"PDF 電子書籍" に関して、"Text 文書起こし" を済ませた上で "全文検索" のみならず、ほぼパーフェクトに近くなった "読み上げ" の "音声サウンド" を "mp3" ファイルへと加工して、 "デジタルミュージックプレイヤー" でもある "iPod touch" に収めてしまうという話であった。
 もちろん、自前で作成した "Text 文書" を対象とする場合は、話は実に簡単なことになろう。昨日紹介した<東芝音声合成コントロール サンプルアプリケーション SpeakPad Ver.1.1>を活用して、その自前 "Text 文書" をその "ワークエリア" に "コピペ" すれば済むことだからである。
 だから、昨日の話が多少とも意味や "ありがた味(み)" を持つのは、あくまでも "紙" 書籍の中に "テキスト" が "画像データ" として "埋もれている" 、そんな場合に限るわけだ。まさに、 "スキャナーやOCR" で武装(?)した "自炊派" の作業の文脈での "付録" 的な話題なのであった。

 したがって、事、"PDF 電子書籍" 作りに焦点を合わせ続けている昨今のこの日誌の流れからすれば余談でしかなかったかもしれない。
 が、余談ついでに今少し、<"読み上げ"音声のサウンド・ファイル化>周辺の話題にこだわってみる。
 と言うのも、単に一言で "読み上げ" 云々と言って済ませる事柄には、実は、二本の "危ない橋" が渡されているからなのだ。
 一つは、言わずと知れた "OCR" の性能の問題である。即ち、"画像データ" として "埋もれている" 文字もどきを "文字、テキスト" として正確に "認識・判読" するというプロセスは、結構、難易度が高い技術的処理だという点である。
  "自炊派" の作業文脈に即して言えば、スキャナーの付録という位置づけで付いてくる "OCR" の水準では、先ずまともな "読み上げ" を期待することはムリだとしか言いようがなかろう。あまりにも、"誤読" が多過ぎるからだ。元々、複雑な形態をした漢字を、それとして "認識・判読" するのは大変なことなのである。

 次に、二本目の "危ない橋" とは、仮に、漢字などの "文字、テキスト" が正しく "認識・判読" されたとしても、その文字の "読み方" が問題となる事を指す。
 これは "読み上げソフト" の性能の問題だと言える。文脈にふさわしい "読み方" を、人工的なプログラムが適切に選択し続けるということは、やはり、結構大変なことなのである。
 こうした "読み上げソフト" のシステム構造がどうなっているかの詳細は知らない。しかし、いわゆる "外国語翻訳ソフト" と同様に、"単語辞書" をはじめ、"文法" の知識も含んだ膨大なデータ・ベースが組込まれているに違いなかろう。
 それに加えて、ユーザの個々の事情を反映すべく、"ユーザ辞書" を蓄積・更新して行かなければ、場違いな "読み" が頻発してしまうことにもなろう。

 つまり、単に "読み上げ" と一言で片付けてしまう "人工的" 事柄は、"二重" の意味での "誤読" の危険に晒(さら)されている、ということなのである。二本の "危ない橋" が渡されていると言ったのはそういう意味なのである。
 もっとも、"書籍" などの "書き手" とて、"思い込み" や "偏見" に満ち満ちて執筆していないとも限らないし、また、"読み手・聴き手" とて "同じような了見" で受け止めているに違いない。問題視や危険視の対象とされるべきは、人工的なシステムに限らない、ということでもある。
 子供の頃、"伝言ゲーム" とか呼んだ遊びがあった。数人づつ分かれたニつのチームで競い合うゲームである。各々のチームの先頭の者の片耳に、審判のような者が何かある事を伝え、それを次々に同チームの隣の者にヒソヒソと伝達して行くのだ。そして、最後の者がその伝達をどう了解したのかを公表し合うというものである。
 人の世における "認識" や "理解" 、そして "伝達" という行為が、いかに "危ない橋" だらけで構成されているかをそれとなく知らされたものであった。
 しかし、こうした危なっかしい事情は何も変わっていないばかりか、いろいろな環境変化で今やグチャグチャとなっている気配がしないでもない......。
  "OCR" や "読み上げソフト" などの人工的プロダクツによる "誤読" なんぞは、可愛いものだと言うべきか...... (2010.10.08)













【 SE Assessment 】 【 プロジェクトα 再挑戦者たち 】








トラックバック(0)

このブログ記事を参照しているブログ一覧: "PDF 電子書籍"の"読み上げ"のプロセスには、"二重"の"誤読"が横たわっている!? ......

このブログ記事に対するトラックバックURL: http://adhocrat.net/mt/mt-tb.cgi/1276

コメントする

2020年11月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          














関連サイトへのリンク


  • 電子書籍(eBooks)制作にフォーカスしたサイト
  • 明けない夜はないことを確信するサイト
  • Green(地球環境改善)にフォーカスしたサイト
  • ソフトウェア技術者やSEのための評価と育成、人事考課制度を考えるサイト
  • さまざまな業種・業態でご利用可能なモバイル活用の予約システム!
  • 創作小説『海念と保兵衛』のサイト
  • 創作小説『かもめたちの行方』のサイト
  • 当ブログ推奨の商品を展示したAmazon ストアー!
  • 当AdhocBlogブログの過去のエントリー
  • 株式会社アドホクラット当時のサイト

★売れ筋! No.1!
家庭用"放射線測定器"

日本通信 bモバイルWiFi ルータ+1 ヶ月定額SIM BM-U300W-1M
価格:¥ 20,208
国内配送料無料 Amazon





このブログ記事について

このページは、yasuo hiroseが2010年10月 8日 01:04に書いたブログ記事です。

ひとつ前のブログ記事は、
 「"読み上げ"を可能にした"PDF 電子書籍"の音声を、"mp3"に変換の上"iPod touch"へ ......
です。

次のブログ記事は、
 「"電子書籍(eBook)"への関心は、"自炊"から"セルフ・パブリッシング"へと向かうか? ......
です。

最近のコンテンツは、
 インデックスページ
で見られます。

過去に書かれたものは、
 アーカイブのページ
で見られます。

年月別アーカイブ

最近のトラックバック