関東学院中学校高等学校様の記念史「関東学院百年史」はとても分厚い書籍で総ページ数1023ページになります。そのなかから「ラグビー部」に関して書かれているページがどこなのかを知りたい、とのご要望が届きました。
目次を確認しても「ラグビー部」の記述はありません。これはもうLet’sスキャニング!!デジタルデータをOCR化して検索できるようにしちゃいましょう。
■スキャニング作業工程
今年1月に当社に導入された本を壊さずスキャニングできるマシン「スキャンロボット」を使ってスキャニングをスタート。見開いた本の両ページを吸着させ、空気を吹き込むことでページを送りながらスキャニングをしていくので効率的にスキャニングが可能。実際のスキャニング時間は約45分でした。
■OCR化により検索可能に!
スキャニングしたデータをさらにOCR化(光化学文字認識のこと。紙の文書をデジタル形式に変換)し、編集や検索が可能な状態の透明テキスト付きPDFデータにします。(画像の文字の裏に検索可能なテキストが張り付いているイメージです。)
その後、PDFデータのファイルを開き、「ラグビー部」と検索をかけると、3か所がヒット!
エンターキーで検索を進めると、392ページに「ラグビー部」のことが書かれた記述を見事発見できました。大量ページのなかから目視で記述を探すのは途方もない作業だと感じていたので、デジタル化のすごさを実感した感動の瞬間でした。
大川印刷はこれからもお客様のご要望に寄り添いながら、「こんなのあったらいいな」の実現にむけて行動します。
■関東学院中学校高等学校の森田校長先生にコメントをいただきました。
関東学院に校長として奉職して3年。関東学院は今年で創立140年を迎える伝統校であるがゆえに、その歴史を学ぶことは容易ではありません。
関東学院の歴史を振り返る時に参考にしていたのが法人が纏めた「関東学院百年史」。創立時バプテスト神学校には生徒が何人いたのか、東京学院はどこにあったのか、三春台の野球部が甲子園まであと一歩だったのは何年のことか、など事あるごとに1000ページ近くある百年史のページを繰っては該当する記述を探していました。
この度大川社長から「スキャンロボット」を導入されたと連絡をいただき、「百年史」をお預けして全ページをスキャニング、さらにOCR化していただいたところ、ファイルに検索をかけると簡単にその該当箇所がヒットするのでした。
クリスチャンスクールで必ず用いられる聖書はネット上の検索が充実していて、2段組み2000ページの書籍がキーワードを用いれば、書名から、章から、節から、瞬時に検索できます。「スキャンロボット」を用いれば同じことが、手持ちの書籍、資料等でも簡単にできることがわかりました。感動です。
学校に保管されている書籍、膨大な資料等もこの技術を用いれば引っ張り出して探す手間は大きく削減されますね。
【代表・大川からのコメント】
関東学院中学校高等学校の森田校長先生からご相談頂き、「関東学院百年史」のスキャニングと検索可能な状態にするOCRのテストをさせて頂きました。
校長先生のお話ではこれまでも100年史を読んで勉強していたが、ある特定の名称などを見つけたくても見つけられず困っていたと。そこで今回のテストをしてみようということになりました。
結果、ハードディスクに入れたデータを森田校長先生のパソコンに接続して準備完了。
探されていたという「ラグビー部」という言葉を検索すると瞬時に3件がヒットしました。そしてそのそれぞれをご覧になり「これだけスピーディーに検索できれば、その他の研究や大学における研究にも役立つのではないか?」 とおっしゃっていただけました。
この度は弊社のスキャニングサービスをご利用いただきまして、誠にありがとうございました。