KotenOCR:くずし字をオフラインで認識するiOSアプリの開発と公開
NDL古典籍OCR-Liteモデルをスマートフォンに載せて、完全オフラインでくずし字を認識するiOSアプリ「KotenOCR」を開発しました。技術構成や開発の背景を紹介します。
iosocrkuzushijiswiftonnxndlclassical-japanese
台本(フルテキスト)
動画の掛け合いを書き起こしたものです。音声を再生しづらい場合はこちらをお読みください。
オープニング
- KotenOCR: くずし字をオフラインで認識する iOS アプリ
- NDL 古典籍 OCR-Lite モデルをスマートフォンに搭載
- ずんだもん
- こんにちは。今日は古典籍のくずし字をオフラインで認識できる iOS アプリ「KotenOCR」を紹介します。
- めたん
- くずし字というのはどんな文字ですか?
- ずんだもん
- 古典籍に書かれた変体仮名や草書体の漢字で、専門家でも読むのが容易ではない書体です。
- めたん
- スマートフォンでオフラインで使えるのはどうして珍しいのですか?
- ずんだもん
- 調査した限り、既存のモバイルアプリはクラウド通信が必要なものが多く、完全オフラインで動くものは見当たりませんでした。
- めたん
- 国立国会図書館のモデルを使っているんですね。
背景と既存ツールの状況
- NDL 古典籍 OCR-Lite はデスクトップ/Web/CLI 対応でモバイル版なし
- miwo・古文書カメラはクラウド通信が必要
- めたん
- くずし字を認識できる既存のツールはどんなものがありますか?
- ずんだもん
- NDL 古典籍 OCR-Lite はデスクトップ版・Web 版・CLI 対応ですが、PC 環境が必要です。
- めたん
- モバイルアプリはありませんか?
- ずんだもん
- miwo や古文書カメラといったモバイルアプリはありますが、どちらもインターネット接続が必要です。
- めたん
- そこで NDL のモデルをスマートフォンに載せることにしたのですね。
- ずんだもん
- はい。ONNX 形式のモデルをアプリにバンドルして、完全オフラインで動作させることにしました。
KotenOCR の主な機能と使い方
- 写真を撮るだけでくずし字を自動認識
- iOS 16 以上、iPhone/iPad 対応、App Store で無料公開
- めたん
- KotenOCR の主な機能を教えてください。
- ずんだもん
- 完全オフライン動作、iPhone と iPad 対応、スキャン履歴の保存、TXT と PDF エクスポート、認識する範囲のトリミング機能があります。
- めたん
- 使い方はどのくらい簡単ですか?
- ずんだもん
- 古典籍の写真を撮影するか、ライブラリから選択するだけで AI が自動でくずし字を認識します。
- めたん
- App Store からダウンロードできますか?
- ずんだもん
- はい。無料で公開されています。iOS 16 以上の iPhone と iPad で利用できます。
OCR パイプラインの技術構成
- RTMDet でテキスト領域を検出、PARSeq で文字を認識
- ONNX Runtime を使ってモデルをオンデバイスで推論
- めたん
- OCR の処理フローはどのようになっていますか?
- ずんだもん
- 写真を撮影後、トリミング、テキスト領域検出、文字認識、読み順決定の順で処理が進みます。
- めたん
- どんなモデルを使っていますか?
- ずんだもん
- テキスト領域検出に RTMDet、文字認識に PARSeq を使っています。7141 文字の NDLmoji 文字集合に対応しています。
- めたん
- iOS での推論はどうやって実現していますか?
- ずんだもん
- ONNX Runtime を使って直接推論します。Core ML への変換は不要で、ONNX ファイルをそのまま利用できます。モデルの合計サイズは約 80 MB です。
現代語訳機能と今後の展望
- ローカル AI(Apple Foundation Models)でオフライン翻訳
- Flutter 版で Android 対応も予定
- めたん
- 認識したくずし字を現代語に訳す機能もありますか?
- ずんだもん
- はい。iOS 26 以降では Apple Foundation Models を使ったオフライン翻訳ができます。クラウド API も利用できます。
- めたん
- 開発にはどんなツールを使いましたか?
- ずんだもん
- Claude Code をはじめとする AI コーディングツールを活用しました。App Store Connect API で審査提出プロセスも自動化しています。
- めたん
- Android 版の予定はありますか?
- ずんだもん
- 現在 Flutter 版を開発中です。これにより Android でも利用できるようになる予定です。
まとめ
- NDL モデルを iOS に載せて完全オフラインのくずし字 OCR を実現
- App Store から無料で利用可能
- めたん
- 今日の内容を整理してください。
- ずんだもん
- 国立国会図書館の NDL 古典籍 OCR-Lite モデルを iOS 上に載せて、完全オフラインでくずし字を認識できる KotenOCR を開発しました。
- めたん
- 写真を撮るだけで認識できるのは現場での利用に向いていますね。
- ずんだもん
- 図書館や現地調査など、インターネット環境が制限される場所でも使えるのが特徴です。
- めたん
- 古典籍研究の一助になりそうですね。
- ずんだもん
- くずし字 OCR に興味のある方はぜひ App Store からお試しください。