🔍KotenOCR: 近代OCRの検出重複を解消する(NMS追加とクラスフィルタリング)
KotenOCRの近代OCRモード(NDLOCR-Lite)で検出結果が重複する問題を修正。NMSの追加とline_*クラスフィルタリングにより、本家ndlocr-liteと同等の検出精度を実現しました。
iosocrndlonnx
KotenOCRの近代OCRモード(NDLOCR-Lite)で検出結果が重複する問題を修正。NMSの追加とline_*クラスフィルタリングにより、本家ndlocr-liteと同等の検出精度を実現しました。

KotenOCR v1.3.0で、既存の古典籍(くずし字)OCRに加えて近代活字OCR(NDLOCR-Lite)に対応しました。確認画面でのワンタップ切り替え、認識処理の並列化による高速化などの変更点をまとめます。

NDL古典籍OCR-Liteモデルをスマートフォンに載せて、完全オフラインでくずし字を認識するiOSアプリ「KotenOCR」を開発しました。技術構成や開発の背景を紹介します。

Azureの仮想マシンを用いたNDLOCRのGradioアプリ構築

ndlocr_cli(NDLOCR(ver.2.1)アプリケーションを試すことができるGradioアプリを作成しました。

NDL古典籍OCR-Lite(ndlkotenocr-lite)をMac OSで使用する

NDLTSR (NDL Table Structure Recognition)を試す

NDLOCRおよびNDL古典籍OCRのver.2を用いたノートブックを作成しました。

mdxでNDL古典籍OCRを実行する

NDL-DocLデータセット(資料画像レイアウトデータセット)の変換と可視化

NDL OCRでルビのテキスト化を行えるようにしていただきました。