
📚LoRAによる書名からのNDC(日本十進分類法)自動分類の試み
国立国会図書館サーチAPIから書誌データを取得し、LoRAにより小型日本語LLMをファインチューニングすることで、書名のみからNDC(日本十進分類法)の第1次区分を推定するモデルを構築する実践的チュートリアル。
llmlorapythonnlp

国立国会図書館サーチAPIから書誌データを取得し、LoRAにより小型日本語LLMをファインチューニングすることで、書名のみからNDC(日本十進分類法)の第1次区分を推定するモデルを構築する実践的チュートリアル。

ワードクラウド、KWIC、共起分析、トピックモデリングなど多彩なテキスト分析機能をブラウザ上で提供するVoyant Toolsの使い方とDH研究での活用法を紹介する。