年末の大掃除のシーズンですね。年賀状の準備そっちのけで部屋を片付けています。最近ハマっているのが雑誌の整理。数年間溜め込んだサウンド&レコーディングマガジンを片っ端から PDF 化。9月に買った ScanSnap でガンガンスキャンして検索できる PDF に。本棚や押し入れのサンレコ5年分を処理。凄い分量ですよ。
サンレコ1冊から、気に入った特集記事、インタビュー、機材レビューを中心にカッターで切り出し。 ScanSnap (Amazon)にセットし、ボタン1発。あとは ScanSnap のソフトでいらないページを削除して、ファイル名をリネームして作業完了。慣れてきてサクサク進むようになった。だいたい1冊を3分くらいで完了できる。
「ScanSnap は大きい方を買えば良かったかな」と思うところもありますが、まぁ、サンレコくらいなら ScanSnap S300 で十分です。
前の投稿にも書きましたが、 Intel Mac 以降のMac ユーザは白い Mac モデルを買わないように。 Mac モデルでは OCR 機能がないので「検索できる PDF 」を作れません。 Windows XP / Vista で PDF を作ったあとに Mac に持ってくればスキャンした原稿の内容も検索できて最高です。
郵送物や雑誌は片っ端からスキャンしてます。来年は省スペースを徹底するつもりです。
コメント
んー、詳しく検証してないんですけど、キーワード検索に使う分には満足できるぐらいの精度はありそうです。変換はけっこう時間かかります。同時に画像の抽出とか傾き補正とかはじめちゃうから(OCR認識だけにする方法が分かってない(^^;) )。
ファイルサイズもスリムになるので、Acrobatくぐらせるのはわりと気に入ってます。
なるほど、Adobe Acrobat Pro の OCR 機能を使うんですね。
http://www.adobe.com/jp/products/acrobatpro/features/
でも、Mac 専用のS300Mには Acrobat Pro が付いてこないので、自分で用意するか、S510M ならいいはずだと。
Acrobat Pro の OCR って精度どうですか?
僕も先日ようやく入手して、昨日からガンガンと読み込ませています。過去数十年の切り抜きの山をすべてデジタル化する計画にようやく着手できた次第です。
Acrobat ProでOCRかければいいやと割り切ってMac版を買いました。
二度手間ではあるけれど、バッチ処理でフォルダ内のPDFを一括してOCR認識できるし、そこそこ認識してくれているので、Spotlight検索用ならこれでもなんとかなるかと。