概要

Google Colabを用いたNDL"古典籍"OCRアプリを作成しました。以下のURLからお試しいただけます。

https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/NDL古典籍OCRの実行例.ipynb

NDL古典籍OCRの説明は以下です。

https://github.com/ndl-lab/ndlkotenocr_cli

また、ノートブックの作成にあたっては、@blue0620さんのノートブックを参考にしています。ありがとうございます!

https://twitter.com/blue0620/status/1617888733323485184

今回作成したノートブックでは、入力フォーマットの追加や、Googleドライブへの保存機能などを追加しています。

使い方

NDLOCRアプリの使い方とほぼ同様です。以下の動画を参考にしてください。

https://youtu.be/46p7ZZSul0o

工夫

工夫した点として、認識結果をIIIFマニフェストの形に変換し、Miradorビューアで閲覧できるようにしました。具体的には、以下のような出力が得られます。

後者のリンクをクリックすることで、以下のようなMiradorビューアが表示され、認識結果を確認することができます。

このIIIFマニフェストファイルも、Googleドライブに格納しています。

参考

NDLOCRのチュートリアルについては、以下を参考にしてください。

/ja/posts/b6712981af3384/


動画版(生成AIによる自動生成): この記事の内容をずんだもん×四国めたんの掛け合いで解説しています。自動生成のため、内容に誤りがある可能性があります。正確な情報は記事本文をご参照ください。