やはり、"ePub 変換"/"PDF 変換" を問わず、"電子書籍(eBook)" の作成を目指すならば、"Web ページ(スクリプト)" に精通し、これを足場とすべきだなぁ、という思いを強めている。
この何日間か、"自炊 PDF" の "加工・編集" について書いてきた。"自炊 PDF" の "テキスト起こし" = "透明テキスト付き PDF 化" と、その "ePub 変換" に絡むいくつかの問題を中心にしてきた。
確かに、"自炊 PDF" の "テキスト起こし" というテーマは極めて "実用的なテーマ" であり、興味深い。だが、所詮、"自炊 PDF" は "画像ファイル" ベースなのであり、"テキスト" への変換作業というものは言ってみれば "おまけ" なのであろう。したがって "透明テキスト" が付加できるだけでも "儲けもの" なのである。それが達成された "PDF" すなわち "透明テキスト付き PDF" を貴重な成果だと見なしこそすれ、それを足場にして "ePub 変換" にまで......、と望むのは、欲張り過ぎなのかもしれない。
自分も欲張りな方ではあるが、"テキスト起こし" については "透明テキスト付き PDF" の段階で踏み止まるつもりでいる。ただ、"画像" 中心の "PDF" ならば、"ePub 変換" の必要性があれば "Calibre" にお任せしても悪くはないと思うが......。
"ePub 変換" が面目躍如となるのは、"(自前で)テキスト入力をした" 成果物を対象とした場合なのだろうと考えられる。もちろん、"ePub" が対象とするコンテンツは "テキスト" に限られるということを言っているのではない。もし、"テキスト" を扱わせたいならば、OCR からの "請売り(?)" 的で "日陰者(?)" の "テキスト" ではなくて、まともな "テキスト" を扱わせるべきだと......。
要するに、手元に "テキスト・ファイル" や "Web スクリプト" を調達できる場合にこそ、"ePub 変換" はその真価を発揮するのではないか、と。
この点は、何よりも "ePub 変換" の優れものソフト/"Sigil" が端的に示しているように思われる。 "テキスト・ファイル" はもちろんのこと、"Web スクリプト" を素材としてインプットするならば、単なる変換を超えた、"CSS" まで付け加えての文面の "整理整頓" をまで手助けしてくれるからだ。
そんな "Sigil" が基本とする "行動パターン(?)" は何かと言えば、要するに "Web スクリプト" ( "XML" に沿ったHTMLである "XHTML" ) なのである。いや、もっと遡(さかのぼ)って基本的な言い方をすすならば、そもそも "ePub" 方式というのは、"XHTML" スクリプトであると言っても間違いではないのである。
<簡単に言えば、拡張子が ".epub" のファイルというのは、一種の "圧縮ファイル" なのであって、このファイルを "zipファイル" を解凍するソフトにかけると、当該の電子書籍を構成する一連のファイルが出現するのである。
表現を換えると、".epub" というファイルは、一連の電子書籍構成ファイル複数が、"zipファイル" として "圧縮" され、最後に拡張子を ".zip" から ".epub" に差し替えられたものだったのである。
そして、その一連の電子書籍構成ファイル複数の中身というのは、 "XHTML1.1" ベースのスクリプト類や "jpeg などの画像ファイル" なのである。
ちなみに、 "~.opf" 、"~.ncx" 、"~.xhtml" 、"stylesheet.css" 、"mimetype" 、"~.jpg" 、"~.gif" などのファイルがあり、Webサイト作りを重ねてきた自分などからすればまさに馴染みのファイル類だったのである。
確かに、これらのフォーマットの詳細な仕様は特殊に定められていて、それはそれで新たにマスターしなければならないのだが、要するに "XHTML1.1" ベースだという点でにわかに肩の荷が軽くなった気がしたものであった。>(<"ePubフォーマット"とは"zip"ファイルなり!/解凍すれば"XHTML"関連ファイルが! (当日誌 2010.08.11)>)
だからこそ、"ePub 変換" に精通して行くには、何よりも "Web スクリプト" に慣れ親しんでゆくべきだと痛感するわけなのである...... (2010.11.03)
コメントする