KotenOCR:くずし字をオフラインで認識するiOSアプリの開発と公開

NDL古典籍OCR-Liteモデルをスマートフォンに載せて、完全オフラインでくずし字を認識するiOSアプリ「KotenOCR」を開発しました。技術構成や開発の背景を紹介します。

iosocrkuzushijiswiftonnxndlclassical-japanese

台本(フルテキスト)

動画の掛け合いを書き起こしたものです。音声を再生しづらい場合はこちらをお読みください。

オープニング

  • KotenOCR: くずし字をオフラインで認識する iOS アプリ
  • NDL 古典籍 OCR-Lite モデルをスマートフォンに搭載
ずんだもん
こんにちは。今日は古典籍のくずし字をオフラインで認識できる iOS アプリ「KotenOCR」を紹介します。
めたん
くずし字というのはどんな文字ですか?
ずんだもん
古典籍に書かれた変体仮名や草書体の漢字で、専門家でも読むのが容易ではない書体です。
めたん
スマートフォンでオフラインで使えるのはどうして珍しいのですか?
ずんだもん
調査した限り、既存のモバイルアプリはクラウド通信が必要なものが多く、完全オフラインで動くものは見当たりませんでした。
めたん
国立国会図書館のモデルを使っているんですね。

背景と既存ツールの状況

  • NDL 古典籍 OCR-Lite はデスクトップ/Web/CLI 対応でモバイル版なし
  • miwo・古文書カメラはクラウド通信が必要
めたん
くずし字を認識できる既存のツールはどんなものがありますか?
ずんだもん
NDL 古典籍 OCR-Lite はデスクトップ版・Web 版・CLI 対応ですが、PC 環境が必要です。
めたん
モバイルアプリはありませんか?
ずんだもん
miwo や古文書カメラといったモバイルアプリはありますが、どちらもインターネット接続が必要です。
めたん
そこで NDL のモデルをスマートフォンに載せることにしたのですね。
ずんだもん
はい。ONNX 形式のモデルをアプリにバンドルして、完全オフラインで動作させることにしました。

KotenOCR の主な機能と使い方

  • 写真を撮るだけでくずし字を自動認識
  • iOS 16 以上、iPhone/iPad 対応、App Store で無料公開
めたん
KotenOCR の主な機能を教えてください。
ずんだもん
完全オフライン動作、iPhone と iPad 対応、スキャン履歴の保存、TXT と PDF エクスポート、認識する範囲のトリミング機能があります。
めたん
使い方はどのくらい簡単ですか?
ずんだもん
古典籍の写真を撮影するか、ライブラリから選択するだけで AI が自動でくずし字を認識します。
めたん
App Store からダウンロードできますか?
ずんだもん
はい。無料で公開されています。iOS 16 以上の iPhone と iPad で利用できます。

OCR パイプラインの技術構成

  • RTMDet でテキスト領域を検出、PARSeq で文字を認識
  • ONNX Runtime を使ってモデルをオンデバイスで推論
めたん
OCR の処理フローはどのようになっていますか?
ずんだもん
写真を撮影後、トリミング、テキスト領域検出、文字認識、読み順決定の順で処理が進みます。
めたん
どんなモデルを使っていますか?
ずんだもん
テキスト領域検出に RTMDet、文字認識に PARSeq を使っています。7141 文字の NDLmoji 文字集合に対応しています。
めたん
iOS での推論はどうやって実現していますか?
ずんだもん
ONNX Runtime を使って直接推論します。Core ML への変換は不要で、ONNX ファイルをそのまま利用できます。モデルの合計サイズは約 80 MB です。

現代語訳機能と今後の展望

  • ローカル AI(Apple Foundation Models)でオフライン翻訳
  • Flutter 版で Android 対応も予定
めたん
認識したくずし字を現代語に訳す機能もありますか?
ずんだもん
はい。iOS 26 以降では Apple Foundation Models を使ったオフライン翻訳ができます。クラウド API も利用できます。
めたん
開発にはどんなツールを使いましたか?
ずんだもん
Claude Code をはじめとする AI コーディングツールを活用しました。App Store Connect API で審査提出プロセスも自動化しています。
めたん
Android 版の予定はありますか?
ずんだもん
現在 Flutter 版を開発中です。これにより Android でも利用できるようになる予定です。

まとめ

  • NDL モデルを iOS に載せて完全オフラインのくずし字 OCR を実現
  • App Store から無料で利用可能
めたん
今日の内容を整理してください。
ずんだもん
国立国会図書館の NDL 古典籍 OCR-Lite モデルを iOS 上に載せて、完全オフラインでくずし字を認識できる KotenOCR を開発しました。
めたん
写真を撮るだけで認識できるのは現場での利用に向いていますね。
ずんだもん
図書館や現地調査など、インターネット環境が制限される場所でも使えるのが特徴です。
めたん
古典籍研究の一助になりそうですね。
ずんだもん
くずし字 OCR に興味のある方はぜひ App Store からお試しください。