デジタル人文学(DH)関連の新規ツール開発・公開情報を週次でまとめています。
NDL OCR-Lite のモバイル対応・段組み認識対応
国立国会図書館が開発した古典籍OCRエンジン「NDL OCR-Lite」のWebアプリケーション版がモバイル対応および段組み認識機能に対応しました。iPhone、iPad、Android端末でカメラや写真ライブラリから画像を選択してOCR処理が可能になったとのことです。また、段組みレイアウトの認識にも対応し、複雑な文書構造の処理精度が向上したようです。
@blue0620の投稿およびGitHub更新情報より
軽量AIモデルQwen 3.5 9Bの数学問題解答性能
@blue0620による投稿で、軽量AIモデル「Qwen 3.5 9B」をローカルサーバで動作させたところ、東京大学の数学問題を解答できたとの報告がありました。軽量モデルでありながら高い性能を示しており、今後の自治体等での活用可能性が示唆されています。
@blue0620の投稿より
筑摩書房版芥川龍之介全集専用OCRスクリプト
NDL OCR-Liteを活用した、筑摩書房版芥川龍之介全集の特殊なレイアウト(本文2段・脚注1段)に対応した専用OCRスクリプトが開発されました。本文と脚注を分離して作品ごとに整理する機能を持つとのことです。
@tolle_et_legeの投稿より
本記事は X投稿・GitHub更新・カレントアウェアネス・ポータルから自動収集した情報を基に生成しています。