本記事はAIにより自動生成されています。内容に抜け漏れや不正確な記述が含まれる可能性があります。情報源は X投稿・GitHub更新・カレントアウェアネス・ポータルです。

デジタル人文学(DH)関連の新規ツール開発・公開情報を週次でまとめています。

くずし字認識AI「そらまる くずし字認識」が公開

橋本雄太氏(国立歴史民俗博物館)により、くずし字の単文字認識AI「そらまる くずし字認識」が公開されました。Kaggleくずし字認識コンペデータセットおよび史料編纂所くずし字データセットで公開されている86万字を学習に使用し、3,673字種の認識が可能とのことです。認識結果の信頼度によってキャラクターの表情やセリフが変化する仕様となっています。

また、このツールは「みんなで翻刻」の翻刻エディタにも組み込み済みで、翻刻支援機能として活用できるとのことです。認識モデルはHugging FaceでCC BY-SA 4.0ライセンスで公開されており、ONNX形式のためWebアプリに組み込んで使用することが可能です。