"ePub 変換"では、"自炊PDF"をValueUPさせたはずの"透明テキスト"部分は消える! ......

| | コメント(0) | トラックバック(0)

 "電子書籍(eBook)" と言えば何でも "ePub" 方式が良いと見なされがちでもある。
 と言う自分も、"ePub 電子書籍" があらゆる技術要素が盛り込まれたハイエンドの "eBook" 形式かという "思い込み" にとらわれてきた。
 が、従来、"PDF" 形式の良さを堪能していただけに、その "思い込み" からいくらか早く自由となれそうな気がしている。
 要は、"電子書籍(eBook)" に何を期待するのか、あるいはどのように利用するのかという "活用目的" に沿ってどんな "方式、フォーマット" が良いのかを決めるのが良さそうであり、"ePub 変換" 至上主義ではマズイということである。単に良さそうという感触だけで、何でもかんでも "ePub" 方式に傾いて、 "ePub 命" とする盲目さは禁物であるのかもしれない......。

 その典型例として、"自炊 PDF" というアプローチ、つまり、"蔵書" などをバラし、裁断し、それをオートフィーダー付きのスキャナーでスキャニングし、"PDF 変換" の上、自前の "電子書籍(eBook)" とする、といった "自給自足" のアプローチ、について述べたい。
 このアプローチでは、"OCR" 機能まで援用してスキャニング画像から "Text" を起こすこととて可能であり、首尾よく運べば、"全文検索" や "読み上げ" という極めて価値あるな副産物までを可能にしてくれたりする。
 この "PDF 電子書籍" の「八面六臂(はちめんろっぴ)」の可能性を実感するならば、これはこれでいいでないか......、別の形式に換えてしまうこともない、という意が強まるのである。
 ただ、もしこれらの「八面六臂」の可能性をしっかりと継承しつつ、さらに新たな可能性をもたらすような "新・形式(フォーマット)" があるのならば、それはそれに越したことはなかろう。
 だが、気になるのは、"ePub 電子書籍" というものが果たしてそれに値するものかどうか、なのである。案外、"PDF" の方が、"ePub" よりもメリット感が伴うという一面もあったりするようだ。
 また、以前にも書いたが、"電子書籍リーダー" 、電子タブレットは、概して "PDF 電子書籍" に、優待的かどうかは別にしてきちんと "市民権" を与えている実情を思えば、"ePub" 方式と "PDF" とは、同時並行的に "使い分け" をして行くスタンスこそが妥当なのではないかと思えてならない。

 さて、昨日は、"変則技(?)" だとか "裏技"(?) だとかと言って、いささかマニアチックなことを書いた。
 "PDF ファイルや電子書籍" における "フォント埋め込み" 問題のことだ。と言うよりも、"自炊 PDF" (画像ベースのファイル)に "透明テキスト" を加えた "PDF" において、 "フォント埋め込み" は可能となるのか? というテーマであった。
 言うまでもなく、スキャニングなどをしないで自前のテキスト入力から作成した "PDF" ファイルであれば、特に "フォント埋め込み" を気遣う必要はない。"仮想プリンタ" の方法を使えば簡単に可能となるからである。
 したがって問題は、「"自炊 PDF" (画像ベースのファイル)に "透明テキスト" を加えた "PDF" 」の場合だということになる。
 なお、通常、"フォント埋め込み" に関心が向けられるのは、ドキュメントの書き手が特殊な意向を込めて "フォント" の種類を選んでいる場合であろう。
 また、 "電子書籍" の場合には、もう少し必要度は高まり、日本語フォントが組込まれていない、"電子書籍リーダー" 、電子タブレットでも日本語表示が可能となるためだということになる。
 ところが、進め方に問題があったのかもしれないが、「"自炊 PDF" に "透明テキスト" を加えた "PDF" 」の場合の "フォント埋め込み" がなかなか上手く行かなかった。そこで、昨日のような "変則技(?)"、"裏技"(?) で臨んだのであった。
 その結果はまずまずであった。ちなみに、<PDFフォント○×チェッカー PDFにフォントがすべて埋め込まれているかを調査するオンラインサービス>での確認においても問題はなかった。

 ところで、あえてそのような "試み" をした理由は、他にもあった。むしろこちらの方が関心度は大であった。
 それは、 "Calibre" などを使って "PDF 電子書籍" の "ePub 変換" を実行した時に、 "透明テキスト付きPDF" の場合は、どんな結果になるのかを再確認することであった。
 これまでの結果では、"PDF" ファイルでは保持されていた "透明テキスト" 部分が、まったく "消し飛ぶ" ものであった。つまり、「"自炊 PDF" に "透明テキスト" を加えた "PDF" 」は、そこに小さくないバリューがあった "透明テキスト" 部分が、完全に "門前払い!" の処遇に終わっていたのである。"jpeg" 画像の連番ファイルの "PDF" ファイルとしてしか扱われていなかったのだ。
 もちろん、"Adobe PDF" における "透明テキスト" という仕様の詳細はわからないし、 "Calibre" による変換プロセスにも介入することはできない。できることと言えば、"あり得るケース" を残らず "試みてみる" こと以外ではない。
 そこで、もし "透明テキスト付きPDF" の場合でも、"フォント埋め込み" がなされたファイルの場合であったら結果がどうなるのか、をトライしようとしたのであった。

 が、結果は何ひとつ変わらなかった。要するに、"透明テキスト" 部分が "Text" として扱われ、再現されるのは "PDF 電子書籍" としての範疇に限られているわけなのである。言い換えれば、"自炊 PDF" をバリュー・アップさせた "透明テキスト" は、あくまでも "PDF 電子書籍" として使う場合だけに限定されており、"ePub 変換" をしてしまうと却(かえ)って価値が損なわれてしまうということになるわけだ。
 こうした点が、"電子書籍(eBook)" 作りで、 "ePub" が適切か、"PDF" が適切かは "活用目的" で決めるべきだと思う理由なのである...... (2010.11.01)














【 SE Assessment 】【 プロジェクトα 再挑戦者たち 】








トラックバック(0)

このブログ記事を参照しているブログ一覧: "ePub 変換"では、"自炊PDF"をValueUPさせたはずの"透明テキスト"部分は消える! ......

このブログ記事に対するトラックバックURL: http://adhocrat.net/mt/mt-tb.cgi/1300

コメントする

2012年4月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          















ウェブページ

関連サイトへのリンク



★売れ筋! No.1!
家庭用"放射線測定器"

日本通信 bモバイルWiFi ルータ+1 ヶ月定額SIM BM-U300W-1M
価格:¥ 20,208
国内配送料無料 Amazon





このブログ記事について

このページは、yasuo hiroseが2010年11月 1日 00:01に書いたブログ記事です。

ひとつ前のブログ記事は、
 「"透明テキスト付き"の"自炊 PDF"での、"フォント埋め込み"を"裏技"でやっつける? ......
です。

次のブログ記事は、
 「"自炊PDF"で起こされた"Text"をキープしつつ"ePub 変換"することも可能は可能! ......
です。

最近のコンテンツは、
 インデックスページ
で見られます。

過去に書かれたものは、
 アーカイブのページ
で見られます。

年月別アーカイブ

最近のトラックバック