"電子書籍"制作 に関心を持つ者ならば、何かと気になるのが "青空文庫" であり、その書式の "形式" がどうなっているのだろうか? という点でもあろう。
先日も、"i文庫HD(iPad専用App)" について書いた際、下記のように "青空文庫形式" が "意味ありげ" に言及されていたわけだ。
< このアプリで "青空文庫" を読むという一般的、ありきたりな利用法についてはおくとして、関心を向けたのは、次の点であった。
≪あなたが作ったファイルも i文庫HDで
あなたが書いた文章なども簡単に i 文 庫 H D で読むことができます。
テキストファイルや画像ファイルを、まるで出版された本のように楽しんで下さい。≫(カスタマイズ自在/i文庫HD/ベンダーサイト)
≪txtファイル
txtファイルはShift-JISまたはUTF8形式で、改行はCR+LFとなります。
txtファイル内の装飾形式は、青空文庫準拠の形式となります。
青空文庫形式についての詳細は青空文庫のページを参照して下さい。
拡張形式として、以下の形式をサポートします。
<PBR> 改ページ
<IMG SRC="xxx.jpg"> 挿絵、同zip内の画像ファイルを挿絵として表示します。≫(同上サイト)>(<"i文庫HD(iPad専用App)"で、"自炊PDF電子書籍"や"自作Textファイル"を読んでみる(当日誌 2010.12.01)>)
そこでこの間、"青空文庫形式" について調べにかかっていたのだったが、適当なサイトが見つからずあぐねていた。
が、漸く、これだこれだ! というサイト、<青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)に遭遇できた。そして何となく "青空文庫形式" の相貌が掴めそうな感触を得た。
ここから得た情報を自分なりの理解で、図式化すれば次のイメージになりそうだ。
①<入力ファイル>.........ソースとしての自作入力テキストファイル。
②<テキスト版>............①<入力ファイル>を<作成ルール=青空文庫書式>に則って編集(<校正作業>)した第二次テキストファイル。
③<XHTML版>...............②<テキスト版>が<XHTML変換プログラム>を介してブラウザ表示可能な "XHTML" ファイルに変換されたもの。これと "対" になった "aozora.css" というスタイルシートも設置されている。要するに、この<XHTML版>はブラウザでの( "横書き" )表示用ファイルなのである。
④ "ブックリーダー" 側アプリ......②<テキスト版>を転送すると、"ブックリーダー" 側アプリの青空文庫書式の "デコーダー・プログラム" (?)によって "青空文庫の縦書き" 仕様で変換表示されることになる......。
やはり、関心を向けるべきは、ブックリーダー" によって "縦書き" 仕様の表示がなされる、そのソース・データとなる ②<テキスト版>の作成だと思われる。
③<XHTML版>は、いわば ②<テキスト版>がルール通りに入力されているかどうかをチェックするためだと考えて良さそうである。
上記の、②<テキスト版>を正確に作成できれば、"i文庫HD(iPad専用App)" に転送して "青空文庫" と同様の "縦書き" スタイルで表示されることは確認できた。
ブラウザでの表示ではなくて、"ブックリーダー" 向けの "電子書籍" が狙いならば、③<XHTML版>は脇に置いて、②<テキスト版>を作り出すことに集中してもよさそうである。<XHTML変換プログラム>は、あくまで、②<テキスト版>の誤りを検出するチェックプログラムと見なして......。
以下、上記に関連する箇所に限定して、同サイトの情報を引用しておきたい。
<テキスト版とXHTML版
青空文庫のテキスト版は、 JIS X 0208で規定された文字を使って、Shift_JISで作っています。改行コードは、CR+LFです。
テキスト版には、作品本体に加えて、「青空文庫収録ファイルへの記載事項」で説明している、前付けと後付けを加えています。レイアウトやルビ、傍点、傍線等を記述する注記の書式は、サイドメニューの「注記一覧」で確認してください。
「入力ファイルを「テキスト版」に仕上げるために」からは、作り方に関する基本的な情報が得られます。>(<テキスト版とXHTML版/青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)
<何に使うの?
テキスト版の作成ルールを確認し、XHTML変換プログラムを利用することで、あなたは次のことができます。
あなたが青空文庫の入力、校正作業に携わっているのであれば、作業中のテキストがXHTML変換プログラムを通るか否か、通るとすればどう変換されるかを、自分で確かめられます。この確認によって、注記付けの誤りなど、作業ルールに外れている点がないかを、チェックできます。
あなたはまた、青空文庫の注記やタグ体系とこれに対応した表示ソフトを利用して、電子出版できます。XHTML変換プログラムはPublic Domainで公開されているので、これを手直しして、自分の要求に最適化できます。
あなたが青空文庫ファイルの表示ソフトを開発しているのであれば、このサイトから得られる情報とXHTML変換プログラムの動作結果を、仕様のよりどころにできます。
>(<何に使うの?/青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)
<変換してみる
「ファイルを選択」ボタンを使って、変換したいテキストファイルを指定し、「変換」ボタンを押すとXHTMLファイルを生成します。>(<変換してみる/青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)
<自分のPCで変換
稼働環境
1. Ruby1.9が稼働できる環境が必要です。
2. 入力ファイルも出力ファイルもShift_JISエンコード&改行コードはCR+LFとなります。
手順
1. ファイルをダウンロードします(ダウンロードはこちら)。
2. 適当なディレクトリ内に展開します。
3. テキストファイルを準備して、プログラムを起動します(詳しい使い方はこちら)。
4. 生成されたファイルをブラウザー等で表示します。>(<自分のPCで変換/青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)
<ダウンロード
ダウンロードファイル一覧
ダウンロードする前に、配布条件とサイトの利用規約を確認してください。
txt2xhtmlツール全部入り
○ txt2xhtmlツールを稼働させるために必要なファイルが全部はいってます
○ txt2xhtml-latest.tar.gz (md5 checksum: 6771d11ab7918e337b6041bf703eeeca)
○ txt2xhtml-latest.zip (md5 checksum: df8849c09735c28df13d751727b6b24d)
○ 更新日時: 平成22年6月28日>(<ダウンロード/青空文庫 組版案内 テキスト版のまとめ方、XHTML版への変換法>)
なお、<Ruby1.9>という "UNIX" の(エミュレータ)環境を Windows 上で構築するには、以下のサイトが参考となる。
<Ruby Install Guide::初心者のためのRubyインストールガイド>
その相貌が感触的にわかっただけの "青空文庫形式" ではあるが、理解を深めることができれば、<青空文庫の注記やタグ体系とこれに対応した表示ソフトを利用して、電子出版できます。>というメッセージに沿うことができそうかと思われる...... (2010.12.06)
コメントする