すべてのタグ

TAG

#ocr

56件の記事

Mirador (4.0.0) の Annotations タブに OCR が出ない — supplementing motivation の落とし穴

IIIF Presentation 3 で OCR テキストを `motivation: "supplementing"` のアノテーションとして配信したら、Annona など他の viewer では出るのに Mirador 4.0.0 (projectmirador.org/embed) の Annotations タブだけ空、という現象に遭遇しました。実際に配信されている Mirador bundle を読み解いた結果、`config.annotations.filteredMotivations` のリリース版デフォルトが `['oa:commenting', 'oa:tagging', 'sc:painting', 'commenting', 'tagging']` で `supplementing` を許可していないことが判明しました。`['commenting', 'supplementing']` の配列で両対応する方法と、関連する仕様・Cookbook recipe の正しい参照を整理します。

iiifmiradorannotationpresentation-api

NDL古典籍OCR-LiteとCloud Vision APIの出力差 — 酉蓮社所蔵嘉興版大蔵経『大般若経』105画像での観測

酉蓮社(旧増上寺報恩蔵)所蔵の嘉興版大蔵経のうち『大般若波羅蜜多經』巻571〜575(IIIF経由で取得した105画像)に対して、国立国会図書館のNDL古典籍OCR-Liteと Cloud Vision API DOCUMENT_TEXT_DETECTION を並べて適用し、それぞれの出力に現れた誤りの傾向を観測した記録です。NDLは仮名混入の誤検出が12頁、VisionはカラースケールやIIIF添付要素(蔵書ラベル等)の混入が105頁全てで発生しました。

ocrndl-koten-ocrgoogle-vision-apiiiif

📚DH週間トピックス — 2026年4月19日週

DH週間トピックス — 2026年4月19日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

📚DH週間トピックス — 2026年4月12日週

DH週間トピックス — 2026年4月12日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

📚DH週間トピックス — 2026年4月5日週

DH週間トピックス — 2026年4月5日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

📖NDLOCR-LiteをPythonスクリプトからライブラリとして呼び出す方法

国立国会図書館が公開する日本語OCR「NDLOCR-Lite」をCLIではなくPythonスクリプトからimportして呼び出す方法と、その際のハマりどころをまとめます。

ndlocrocrpythonjapanese-ocr

KotenOCR Android版の開発記録 — FlutterからKotlinへの移行とその理由

古典籍OCRアプリKotenOCRのAndroid版をFlutterで開発し、Kotlin Nativeへ移行した記録。パフォーマンスベンチマーク、API修正による18倍高速化、AI開発でのフレームワーク選定について。

flutterkotlinonnxruntimeocr

📚DH週間トピックス — 2026年3月28日週

DH週間トピックス — 2026年3月28日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

🔍KotenOCR: 近代OCRの検出重複を解消する(NMS追加とクラスフィルタリング)

KotenOCRの近代OCRモード(NDLOCR-Lite)で検出結果が重複する問題を修正。NMSの追加とline_*クラスフィルタリングにより、本家ndlocr-liteと同等の検出精度を実現しました。

iosocrndlonnx

📜KotenOCR v1.3.0:古典籍と近代活字の両対応OCRモードを追加

KotenOCR v1.3.0で、既存の古典籍(くずし字)OCRに加えて近代活字OCR(NDLOCR-Lite)に対応しました。確認画面でのワンタップ切り替え、認識処理の並列化による高速化などの変更点をまとめます。

iosocrkuzushijindl

📚DH週間トピックス — 2026年3月21日週

DH週間トピックス — 2026年3月21日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

Swift ConcurrencyでOCR認識処理を並列化し最大6.7倍高速化する

iOSアプリのOCRパイプラインで、withThrowingTaskGroupによる認識処理の並列化を行い、検出領域数に応じて1.4〜6.7倍の高速化を得た記録。

iosswiftconcurrencyocr

📜KotenOCR:くずし字をオフラインで認識するiOSアプリの開発と公開

NDL古典籍OCR-Liteモデルをスマートフォンに載せて、完全オフラインでくずし字を認識するiOSアプリ「KotenOCR」を開発しました。技術構成や開発の背景を紹介します。

iosocrkuzushijiswift

✍️Transkribus:AIによる手書き文字認識で歴史文書を読み解く

100以上の言語に対応するAIベースの手書き文字認識プラットフォームTranskribusの概要と、歴史文書のテキスト化におけるDH研究での活用法を紹介する。

transkribusocrhtrhandwriting

📚DH週間トピックス — 2026年2月22日週

DH週間トピックス — 2026年2月22日週

dh-weeklydigitalhumanitiesデジタルアーカイブocr

🐷BDRC Tibetan OCR:チベット語OCRツールの紹介と実装事例

BDRC Tibetan OCR:チベット語OCRツールの紹介と実装事例

ocr

📝Azure OpenAI GPT-4 vs Document Intelligence: 日本語縦書きOCRの比較検証

Azure OpenAI GPT-4 vs Document Intelligence: 日本語縦書きOCRの比較検証

azureocrllm

🐈LLMによる原稿用紙OCR性能比較:縦書き日本語の認識精度検証

LLMによる原稿用紙OCR性能比較:縦書き日本語の認識精度検証

ocrllm

😊PDFの透明テキスト抽出における順序保持の課題と解決策

PDFの透明テキスト抽出における順序保持の課題と解決策

pdfocr

😸TEI ODDファイルのカスタマイゼーション:NDL古典籍OCRの事例

TEI ODDファイルのカスタマイゼーション:NDL古典籍OCRの事例

ocrrngteiroma

👌NDL古典籍OCR-lite Next.js版の開発

NDL古典籍OCR-lite Next.js版の開発

nextjsrngocrroma

🌟Azure Container AppsでNDL古典籍OCR Liteを用いたスケーラブルOCR処理システム

Azure Container AppsでNDL古典籍OCR Liteを用いたスケーラブルOCR処理システム

dockerazureocr

🐈DToC: Dynamic Table of Contextsを試す

DToC: Dynamic Table of Contextsを試す

ocrxmlteigemini

🙄NDL古典籍OCR-Liteを用いて、IIIFマニフェストファイルからTEI/XMLファイルを作成する

NDL古典籍OCR-Liteを用いて、IIIFマニフェストファイルからTEI/XMLファイルを作成する

ocrhuggingfaceiiiftei

😸その2:NDL古典籍OCR-Liteを用いたアノテーション付きIIIFマニフェストファイルとTEI/XMLファイルの作成

その2:NDL古典籍OCR-Liteを用いたアノテーション付きIIIFマニフェストファイルとTEI/XMLファイルの作成

nextjsocrmonorepoiiif

🎉IIIFマニフェストファイルからOCR結果を含むTEI_XMLファイルを作成するプログラム

IIIFマニフェストファイルからOCR結果を含むTEI_XMLファイルを作成するプログラム

colabocriiiftei

📑校異源氏物語に対する類似テキスト検索アプリを作成しました。

校異源氏物語に対する類似テキスト検索アプリを作成しました。

pythonocrhuggingfacetei

🦔Azureの仮想マシンを用いたNDLOCRのGradioアプリ構築

Azureの仮想マシンを用いたNDLOCRのGradioアプリ構築

azuregpuocrndl

🎉ndlocr_cli(NDLOCR(ver.2.1)アプリケーションを試すことができるGradioアプリを作成しました。

ndlocr_cli(NDLOCR(ver.2.1)アプリケーションを試すことができるGradioアプリを作成しました。

azureocrndlgradio

🔥NDL古典籍OCR-Liteを用いたGradio Appを作成しました。

NDL古典籍OCR-Liteを用いたGradio Appを作成しました。

dockerocrgradio

🔥NDL古典籍OCR-Lite(ndlkotenocr-lite)をMac OSで使用する

NDL古典籍OCR-Lite(ndlkotenocr-lite)をMac OSで使用する

ocrndl

🙆Google Cloud Vision APIを用いて、単一ページから構成される透明テキスト付きPDFを作成する

Google Cloud Vision APIを用いて、単一ページから構成される透明テキスト付きPDFを作成する

pythonpdfocr

📖縦書きに対応したText Overlay pluginを導入済みのMiradorのリポジトリ

縦書きに対応したText Overlay pluginを導入済みのMiradorのリポジトリ

ocriiifmirador

😺画像ファイルに対してGoogle Cloud Visionを適用して、IIIFマニフェストおよびTEI/XMLファイルを作成する

画像ファイルに対してGoogle Cloud Visionを適用して、IIIFマニフェストおよびTEI/XMLファイルを作成する

pythonocriiiftei

📘ndlocr_cli実行時の共有メモリ不足への対応ほか

ndlocr_cli実行時の共有メモリ不足への対応ほか

ocrndlocr

🔖ndlocr_cliをdockerでインストールした後の容量

ndlocr_cliをdockerでインストールした後の容量

ocrmdx

📝NDLOCRおよびNDL古典籍OCRのver.2を用いたノートブックを作成しました。

NDLOCRおよびNDL古典籍OCRのver.2を用いたノートブックを作成しました。

colabocriiifndl

💭mdxでNDL古典籍OCRを実行する

mdxでNDL古典籍OCRを実行する

ocrndlmdxjp

📝Mirador3プラグイン開発: Text Overlay pluginで縦書き対応を行う

Mirador3プラグイン開発: Text Overlay pluginで縦書き対応を行う

ocrxmliiifmirador

📌ALTO (Analyzed Layout and Text Object) XMLについて

ALTO (Analyzed Layout and Text Object) XMLについて

ocrxmlalto

💭Google Colabを用いたNDL古典籍OCRチュートリアルの不具合の修正および機能追加を行いました。

Google Colabを用いたNDL古典籍OCRチュートリアルの不具合の修正および機能追加を行いました。

pythoncolabocriiif

🐡Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリ

Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリ

awsocrhuggingface

💡NDL古典籍OCRをAmazon EC2のCPU環境で実行する

NDL古典籍OCRをAmazon EC2のCPU環境で実行する

awsec2ocr

🙆‍♀️Amazon SageMaker Studioを用いたNDL古典籍OCRの実行

Amazon SageMaker Studioを用いたNDL古典籍OCRの実行

awsocr

👋Google Colabを用いたNDL

Google Colabを用いたNDL

pythonmachinelearningocrndlocr

💭NDL-DocLデータセットとYOLOv5を用いたレイアウト抽出モデルを作成しました。

NDL-DocLデータセットとYOLOv5を用いたレイアウト抽出モデルを作成しました。

colabyoloocrdetection

🌟NDL OCRでルビのテキスト化を行えるようにしていただきました。

NDL OCRでルビのテキスト化を行えるようにしていただきました。

colabocrndl

🐡Google Colabを用いたNDLOCRアプリの使い方の動画を作成しました。

Google Colabを用いたNDLOCRアプリの使い方の動画を作成しました。

ocrcolab

🐥Google Colabを用いたgcv2hocrの実行例:Google Vision APIを用いた透明テキスト付きPDFファイルの作成

Google Colabを用いたgcv2hocrの実行例:Google Vision APIを用いた透明テキスト付きPDFファイルの作成

colabocrgcv

🐥Google Colabを用いたNDLOCRアプリのVersion 2を作成しました。

Google Colabを用いたNDLOCRアプリのVersion 2を作成しました。

colabocr

📚Google Colabを用いたNDLOCRの実行にかかる時間について

Google Colabを用いたNDLOCRの実行にかかる時間について

pythonmachinelearningcolabocr

👌Google Colabを用いたNDLOCRアプリの実行(Google Driveを用いた画像の入力と結果の保存)

Google Colabを用いたNDLOCRアプリの実行(Google Driveを用いた画像の入力と結果の保存)

machinelearningcolabocr

👋Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行

Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行

dockermachinelearningocr

📌「NDL OCR x IIIF」アプリにTEI/XML形式でダウンロードする機能を追加しました。

「NDL OCR x IIIF」アプリにTEI/XML形式でダウンロードする機能を追加しました。

ocriiiftei

💬【開発編】国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリを作成しました。

【開発編】国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリを作成しました。

awsocriiif

🐥国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリを作成しました。

国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリを作成しました。

ocriiif