スキャナー"ScanSnap S1500"を使った雑誌記事のポータブルな"PDF 文書(書籍)"化 ......

| | コメント(0) | トラックバック(0)

 頼もしい助っ人のスキャナー "ScanSnap S1500" で、30ページほどの雑誌記事を "PDF 書籍" 化してみた。とにかく、 "紙の書籍" を "電子書籍" 化することに "習熟(?)" すべしと思い、手当たり次第にトライしているところなのである。
 実を言えば、 "紙の書籍" の本格的な "電子書籍" 化には、書籍を効率的・効果的にバラす "プラス 断裁機 裁断幅A4 PK-513L 26-106" が役立つことはわかっている。だが、これについては未だに入手していない。
 そこで、今回は、あくまでも試しの域を出ず、雑誌のページをバラし、ギザギザ部分を "カッティング・マット" の上でカッター・ナイフにて整えるというオール手作業で行ってみた。スキャナーのオート・フィーダーに引っかかって詰まるようなことだけを警戒してのことだったが、案ずるより産むが易しで、難無くあっと言う間にスキャニングは完了し "PDF 文書" 化されたものであった。
 ついでに、 "(全文)検索が可能なファイル" への変換(スキャナー内部の "OCR" 機能を使っての文字画像のテキスト化。 "透明テキスト付きPDF" ファイル化。)をも行ってみたが、さほどの時間もかからず完了した。あえてこの変換を行っておく理由は、出来上がった "PDF 文書" の閲覧時に、文書内の "キーワード検索" が可能となることや、文章の "コピペ(コピー&ペースト)" という再利用が可能となることをねらってのことなのである。

 いずれの作業も問題なく済ませ、PC上の "Adobe Acrobat" で閲覧してみた。
 雑誌記事でありながら、スキャニングされた活字の鮮明度はなかなかのものであり、その証拠に、上記の "(全文)検索が可能なファイル" への変換によって "透明テキスト付きPDF" ファイルだからこそ可能である、文章中の "テキスト" 選択から "クリップボードへのコピー" 、そして他のテキスト・エディター画面への "ペースト" というテスト作業も、ほぼパーフェクトに行うことができた。
 かつて、 "フラットベッド・スキャナー" を使っていた頃、同じように雑誌記事をスキャニングして、付属の "OCR" ソフトでテキストを起こした時のことが思い出された。
 とにかく、こうした処理には多大な所要時間がかかった。それだけではなく、テキストとして起こされた部分は全体の活字量の6~70%位の比率であっただろうか。しかも、やたらにリード・エラーによる "誤字" が多過ぎて、こりゃとても実用的とは言えないな......、と失望させられたものであった。それに比べると、まさに隔世の感ありである。

 そこで、この "PDF 文書(書籍)" を、手順にしたがって "iPod touch" のアプリ "iBooks"/"本棚 PDF" と、同アプリ "GoodReader" の双方へとアップロードしてみた。
 雑誌記事の原稿サイズはA4サイズであったため、"iPod touch" の初期画面ではさすがに読みにくさはある。だが、拡大表示してスクロールさせるならば何とか読める。
 だから、こうして気になった雑誌記事をバラして "PDF 文書(書籍)" 化しておくならば、実にポータブルなスタイルで再活用できるものだと意を強めるばかりであった。
 とかく、雑誌というものは、保存したいほどに気になる記事というのはほんの一部なのであろう。そのために "質量のある雑誌" を丸ごと保存しておかなければならないというのは、何と理不尽なことかと思い続けてきた。かと言って、バラした "紙" の記事を保存しておくと、結局は再読することもなく "黄ばむ" のが落ちであることも、経験上知らされているところである。

 この間、 "ePubフォーマット" による "電子書籍" 作りにもこだわってきたが、既存の "蔵書" をバラしての "電子書籍" 化ということを主眼とするならば、まさに、 "PDF 文書(書籍)" 化で十分目的が果たされると思えてきた。
  "PDF 文書(書籍)" をさらに "ePubフォーマット" 化するという目論見は、意外と手間だけが嵩んでしまいエコノミーだとは言えないのかもしれない...... (2010.08.12)













【 SE Assessment 】 【 プロジェクトα 再挑戦者たち 】








トラックバック(0)

このブログ記事を参照しているブログ一覧: スキャナー"ScanSnap S1500"を使った雑誌記事のポータブルな"PDF 文書(書籍)"化 ......

このブログ記事に対するトラックバックURL: http://adhocrat.net/mt/mt-tb.cgi/1219

コメントする

2020年11月

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          














関連サイトへのリンク


  • 電子書籍(eBooks)制作にフォーカスしたサイト
  • 明けない夜はないことを確信するサイト
  • Green(地球環境改善)にフォーカスしたサイト
  • ソフトウェア技術者やSEのための評価と育成、人事考課制度を考えるサイト
  • さまざまな業種・業態でご利用可能なモバイル活用の予約システム!
  • 創作小説『海念と保兵衛』のサイト
  • 創作小説『かもめたちの行方』のサイト
  • 当ブログ推奨の商品を展示したAmazon ストアー!
  • 当AdhocBlogブログの過去のエントリー
  • 株式会社アドホクラット当時のサイト

★売れ筋! No.1!
家庭用"放射線測定器"

日本通信 bモバイルWiFi ルータ+1 ヶ月定額SIM BM-U300W-1M
価格:¥ 20,208
国内配送料無料 Amazon





このブログ記事について

このページは、yasuo hiroseが2010年8月12日 00:01に書いたブログ記事です。

ひとつ前のブログ記事は、
 「"ePubフォーマット"とは"zip"ファイルなり!/解凍すれば"XHTML"関連ファイルが! ......
です。

次のブログ記事は、
 「"PDF ⇒ ePub" 変換ソフト"Calibre"の優秀さと、"ePub"仕様に対する理解度不足!? ......
です。

最近のコンテンツは、
 インデックスページ
で見られます。

過去に書かれたものは、
 アーカイブのページ
で見られます。

年月別アーカイブ

最近のトラックバック