"ePub 変換" をいろいろと進めていると、ふと、かつて "一太郎 ver.4" などで作成した "化石" 的(?)な文書ファイル類のことが思い起こされた。
当時、かなり根を詰めてキーを叩いて作り込んだ、自分にとっては相応に貴重なファイル類だったからかもしれない。
そして、これらを再活用できるファイル、できれば "ePub 変換" へと持ち込みたいものだと思ったのであった。
これは、ちょうど、気になる "蔵書" 類を "自炊 PDF" にしたり、さらに "ePub 変換" しようとする動機と似ている。放置しておけば見捨てることになりかねないと思えたわけだ。
しかし、"一太郎 ver.4" ファイルは、拡張子が ".jsw" であり、"MS-Word" で読み込み、再編集するのも一苦労......。おまけに、やたら "一太郎の罫線" を駆使して "表組み" 形式で作ったファイルが多かったので苦労もひとしお......。
が、とにかく "MS Word 2007" の土俵に乗せるまでは何とかなった。しかし、やはり "一太郎の罫線" を復元することは叶わず、罫線を模したぶつ切りの "記号文字" で置き換えられる始末だった。また、"表組み" 形式に近いものを望むと、"Windows メタファイル" を選ばざるを得ず、これは "図(画像)" となってしまいテキストが消失するので選択できなかった。
そこで、テキスト部分のみを活かし、"表組み" 構造については新たに "MS-Word" 上で作り直すことに決めた。
ところで、"MS Word" に持ち込めたなら、"PDF 変換" はもとより、"ePub 変換" も容易(たやす)いことかと高を括っていた。確かに、"PDF 変換" の方は問題はなかった。が、"html 化" を介しての "ePub 変換" については思いのほか難航している。
先ずは、"MS Word" 上でそのファイルを "html" ファイルに変換して保存する。"MS-Word" 上での "表組み" 形式部分については、変換された "html" ファイルでは "table 構造" のスクリプトとして書き換えられている。
で、この "html" ファイルを "Sigil" に読み込ませて、"ePub 変換" しようとしたのであった。ここまでは問題なかった。
だが、結局このアプローチは不調に終わった。"Sigil" 上では上手く行ったかに見えたのだが、"ePub ブックリーダー" 側( "iPad" を含む)が、"読み込み自体を拒絶!" したのであった。
ひょっとしたら、"ePub" 方式は "table 構造" のスクリプトを苦手とするのかと、まずは疑ってみた。この点を別のサンプルでテストをしてみたが、必ずしも "ePub" 方式が "table 構造" のスクリプトを苦手とするような形跡は無いように思えた......。
どうも、問題が発生したプロセスは、<"MS Word" 上での "表組み" が、"table 構造" の "html" ファイルへと書き換えられた時>ではないか、と推測せざるを得なかった。ここで、かなり複雑な "CSS" のコードを生み出していて、いかにも梃子摺っているかに見えたからなのだが......。
それならばと、"MS Word" が問題なく仕上げた "PDF ファイル" を、"Calibre" を使って "ePub 変換" をしてみることにした。こちらは、"ePub ブックリーダー" 側がすんなりと読み込むことは読み込んだものの、"見事"! "表組み" 形式="table 構造" 自体を消し飛ばして、裸のテキストにしていたのだった。やや唖然とさせられた。
いずれにしても、"表組み" ( "table 構造" )含みの MS-Word ファイルを "html" に変換した後のファイルからの "ePub変換" は、一筋縄では行かないようである...... (2010.12.20)
コメントする