本の取り込み(書籍のデータ化)を振り返ってみた(2)

ライフハック

※ この記事は「本の取り込み(書籍のデータ化)を振り返ってみた(1)」の続きとなります。

<いよいよ膨大な量の日経バイトを取り込みを開始する>

押し入れから「日経バイト」が詰まった段ボール箱を引っ張り出してきて、発行年ごとに整理しました。

そして、整理した中から取りだした一冊目の本を裁断するときは、すごく緊張したのを覚えています。

最初のうちは裁断のコツがわからず、どのくらいの切りしろで切ったらいいのかわからくて、危うく本文の印刷されているところまで裁断しそうになったことがありました。

Plus_PK513.jpg
また、スキャン作業も本の紙の状態(厚さや乾燥具合など)によってたびたび詰まったり、数ページを一度に吸い込んで、表面のページだけスキャンしてしまうことなどがありました。

紙詰まりはスキャナが停止するのでいいのですが、一度に数ページ吸い込まれたままスキャンが続行してしまうと、出来上がった本のデータにページ抜けが起こってしまいます(「Scansnap fi-5110 EOX」は現行の機種と違って、まだ超音波による紙の重なり検知機能がなかったために、紙の状態によってはよく起こりました)。

ですので、取り込んだ本のデータはページ抜けがないかどうか、必ず全ページを確認する必要がありました。さらにこの他にも、ページの向きや傾きの自動補正が誤動作していないか、といったことも同時に確認していました。

取り込み時のいろいろなコツを会得して、安定して取り込みが行えるようになったときの、平均的な一冊分の作業時間は 25 分 〜 30 分くらいだったと思います。
こうして、コツコツと「日経バイト」のデータ化が始まり、数ヶ月かけて当時の最新号までの取り込みを終えることができました*1

*1 このときに驚いたのが Scansnap の耐久性です。毎日 1 時間〜 1 時間半、ほぼ連続でスキャンするなど、かなり酷使したのですが(トータルで 6 万ページ以上をスキャンしたと思います)一度も壊れませんでした。

<持っている書籍のほとんどを取り込む>

取り込みが終わり、保管していた数箱分の段ボールが片付いたときの爽快感はなんともいえませんでした。

エクスプローラ(当時は Windows をバリバリ使っていました)を開くと、年ごとに「日経バイト」のサムネールがずらっと並び、ダブルクリックですぐに開けます。昔の号を読みたい時に段ボール箱を開いて、ごそごそと探していたときが懐かしかったです。

こうなると本棚に並んでいる本はもちろん、行き場がなくてその辺に山積みで放置してある本なども取り込んでしまいたくなります。

技術書、文庫本、漫画、週刊誌*2、捨てるに捨てられなかった子供の頃の教科書・・・、ほとんどの書籍を取り込みました。ただし、写真集だけは Scansnap の設定をどんなに変えても、取り込んだ画像のクオリティが維持できなかったため、最初に一冊行って他は紙のまま残してあります。

こうして、家の本棚は別の用途の収納家具に変わり、それに代わって、取り込んだデータ用のハードディスクが増えました。

*2 中央の大きな留め具をはずさずに裁断して裁断機の歯がかけてしまったこともありました。替え刃は本体の 3 分の 1 くらいの値段がしますので、実践する方は十分なご注意を!

<苦労して取り込んだ日経バイトのデータを失う>

取り込んだ本の貴重なデータはパソコンの内蔵ハードディスクの中とは別に、ケースなしの外付けハードディスク 2 つ(正・副)にバックアップ、つまり全部で 3 つに同じ物を持つようにしていました。

3 つもハードディスクに保管していたので、すっかり安心しきって DVD-R などの光メディアにはコピーを取っていなかったのですが、これが大失敗になりました。
この頃使っていたパソコンは完全自作のフルタワー型の Windows 機だったのですが、筐体の大きさを活かしハードディスクを何台も搭載して、システム領域は RAID-0、データ領域は RAID-5 などを組んで使っていました。なので、家の中にはケースなしのハードディスクがごろごろ転がっていました。

ある時、システム領域を格納している RAID-0 構成のハードディスクに障害が発生しために、別のハードディスクで RAID-0 を組み直してシステムの再インストールを行うことにしました。

この日は当日中にどうしてもパソコンを使って処理したいことがあり、かなり焦った状態で再インストールを進めてしまいました。そして、あろうことかシステム領域を格納するための RAID-0 構成の作成に「日経バイト」の取り込みデータをバックアップしてある 2 本のハードディスクを使ってしまったのです。

つまり、保存してあった 3 つ(内蔵と外付け x 2)のデータがすべて消失してしまうことに・・・。

今までの記事の中で「十数年分の日経バイト」と書いてきたのは、データを消失してしまったために、正確にいつから購読を始めたのか特定できなかったためなのです。

ただ、スキャンを開始したときに 180 〜 190 冊くらいの数だったことを覚えていたので 15 〜 16 年分くらいはあったと思います。

このときは、本の総額とかスキャンにかけた工数、そして何よりも、もう二度と同じデータが手に入らない*3ことにショックを受けて 1 ヶ月くらい精神的なダメージが抜けませんでした。

現在は Mac をメインに使っているので、日々のバックアップは Time Machine を利用、さらに Dropbox 上にも保存してあるため、だいぶリスクは減っていると思います。しかし、この事故を経験しているため、定期的に DVD-R に焼くことが習慣になっています。

*3 日経バイトの過去記事を集約した DVD は販売されていますが 1997 年以降の内容となり、保有していた 1980 年代後半(おそらく 1987 頃から)の内容は含まれていません。また、当然だとは思いますが、集約 DVD には当時の広告がまったく含まれておらず、記事のみが収録されています。
今回の記事も長くなってしまったので、次に書きたかった

<書籍のデータ化のメリットとデメリット>
<自分で取り込むか?電子書籍を買うか?>

については、次回の記事に掲載したいと思います(ほんとに、まとめ力が不足していてすいません・・・)。


<追記>
1980 年後半 〜 1990 年前半くらいまでの日経バイトの広告について
1980 年代後半〜 1990 年代前半までの「日経バイト」は、紙がとても薄くページ数が多めでした。記事も多くて内容も濃いのですが、膨大な量の広告も掲載されていました。特集が組まれた月には 400 ページ近くあった号もあったと思います。
後に取り込んだ当時の「日経バイト」を画面上で見ていて、「広告もその時代を示す立派な資料」なんだなとしみじみと思いました。大企業はもちろん、これから発展していくパソコンに夢を持った中小のたくさんの会社が、ハードソフトを問わず、いろいろなアイデアの製品を次々と発表していく様子がわかりました。
また、当時の広告を見ていると、その時に自分に起こっていた出来事や流行っていた音楽などの時代の空気感みたいなものが思い出されました。

コメント

タイトルとURLをコピーしました