本の取り込み(書籍のデータ化)を振り返ってみた(1)

デジタル機器

先日、「本の取り込み(書籍のデータ化)を始めたのはいつだったかな?」と思い、昔取り込んだ PDF ファイルや当時の作業フォルダを見直してみたのですが、なんと始めてからもう 10 年も経っていました。

10 年一区切りということで、「本の取り込み」について少し振り返ってみたいと思います。

<取り込みを始めたきっかけ>

コンピュータとの付き合いはかなり長く、パソコンの黎明期からいろいろな雑誌を買っていたのですが、途中から「日経バイト」という雑誌がメインの購読誌になりました。

この雑誌は当時書店で販売されていたコンピュータ関連の他の雑誌より、かなり深くまで掘り下げた記事が多く、またボリュームもあったため、これを読んでおけば当時のほとんどの技術を押さえられると感じていた本でした。

そして読み続けること十数年、段ボールに入れた「日経バイト」が押し入れを圧迫していき、本来の生活用品の収納に支障をきたすようになってきました。

そこで考えた末に「よし、これをスキャナでパソコンに取り込んでしまおう!」と思い立ったのが書籍のデータ化のきっかけです。

<フラットベッドスキャナでの取り込みに挫折>

確か 2002 年頃だったと思いますが、最初に計画したのが書籍をカッターでバラバラにして、フラットベッドスキャナーで 1 枚ずつ取り込む方法でした。

計画したときは「多少手間がかかるかもしれないけど、地道にやっていけば何とかなるかな?」と思っていたのですが、実際に始めて見ると予想以上にというか、予想をはるかに超えた手間がかかりました。

まず、カッターでバラバラにするのに一苦労。2 〜 3 冊程度なら気にならないのですが、5 冊以上となると時間もかかるし、手の疲労度が大きくなります。これが延々と続くと思うと最後までやりきる自信が揺らいできました。

そして、スキャンで決定的に断念しました。

当時、エプソンのフラットベッドスキャナー*1を使っていたのですが、A4 一枚の片面をカラー 300dpi で取り込むのに数分かかりました*2

仮に片面の取り込みを 1 分とすると、原稿のセットと取り込み開始の操作を入れて 1 ページに 2 分 30 秒。当時の日経バイトは薄い紙質で広告が山ほどあったので 1 冊でだいたい 150 枚(300 ページ)となり、2 分 30 秒 x 150 ページ = 375 分( 6.25 時間以上)かかる計算になります。

十数年分の日経バイトは 200 冊弱はあったため、毎週土・日をすべて作業に当てても約 2 年かかってしまうことがわかり、今回の計画は中止しようという結論に達しました。

*1 うろ覚えですが、GT-9500 だったような気がします。
*2 これも正確に覚えていませんが、1 分以内では到底取り込めなかったと思います。

<救世主「Scansnap fi-5110 EOX」が登場>

「日経バイト」の取り込みを断念してから 2 年、さらに保管中の冊数が増えて、家族からの「押し入れに物が入らないんだよねー」の声が日増しに大きくなってきていました(辛かったです^^;)。

そんな 2004 年の年末、どこかのメーカーが信じられないスピードでスキャンするドキュメントスキャナーを出しているという情報をキャッチしました。前回のフラットベッドスキャナの取り込み速度の遅さを経験していたこともあったため、半信半疑で調査を始めたのですが、その仕様をみて驚きました。

  • オートドキュメントフィーダー搭載 最大 50 枚セット( 1 枚ずつ入れ替える必要なし!)
  • 両面同時読み取り(手で裏返す必要なし!)
  • カラー 300 dpi 毎分 5 枚(毎分 5 枚!)

さらに当時、単品で購入すると 3 万円位した Adobe Acrobat がバンドルされています。ということは、スキャンしたあとに、バラバラになっている画像データをまとめる必要がないという事になります。

ScanSnap fi-5110EOX

最初はとても信じられませんでした。1 枚片面でスキャンするのに、あんなに時間がかかっていたのが両面同時読み取りで 1 分間に 5 枚取り込めるなんて、大げさではなく、どんな魔法を使ったんだろうとまで思いました。

ネット上で Scansnap fi-5110 EOX が動作している動画を発見して見たときは、あんなに早く排出されて、本当にスキャンされているのか心配になったほどでした。

仕様どおりに動作すれば、50 枚が 10 分で取り込めるので、一冊 150 ページとすると、用紙セットの時間を入れても約 30 分強でスキャンできます。

冬のボーナスのタイミングだったこともあり、ほとんど躊躇することなく「購入」ボタンを「ポチッ」とクリックしていました。

そして、本の解体をカッターでやろうとして手間取った前回の反省を踏まえて、個人で扱える最も効率のよさそうな裁断機を時間かけて探したところ、プラス PK-513*3 がよさそうだったので同じタイミングで注文しました。

*3 今ではガイドライン用の光源が電球から LED になっているみたいで時代の流れを感じます。

この翌年から開始した、取り込み作業からのことは、次の記事に書きたいと思います。

コメント

タイトルとURLをコピーしました