はじめに
質的データ分析(QDA: Qualitative Data Analysis)は、インタビュー記録、フィールドノート、歴史文書などのテキストデータにタグやコードを付与し、パターンやテーマを見出す研究手法です。従来、NVivo や ATLAS.ti といった商用ソフトウェアが広く利用されてきましたが、高額なライセンス費用が研究者や学生にとって障壁となることがありました。
本記事では、NVivo や ATLAS.ti の代替として注目されている無料のオープンソース質的データ分析ツール Taguette を紹介します。
Taguette とは
Taguette は、テキストデータの質的分析を行うためのオープンソースツールです。BSD ライセンスで公開されており、完全無料で利用できます。ニューヨーク大学の研究者によって開発され、学術研究の民主化を目的としています。
Web ブラウザ上で動作するシンプルなインターフェースを特徴とし、プログラミングの知識がなくても直感的に使い始めることができます。
主な機能
テキストのタグ付け・コーディング
Taguette のコア機能は、テキストの選択範囲にタグ(コード)を付与することです。文書を読みながら重要な箇所を選択し、あらかじめ定義したタグや新しいタグを割り当てます。タグは階層的に管理でき、カテゴリごとに整理できます。
ハイライト表示
タグ付けされたテキストはハイライト表示され、どの部分にどのタグが付けられているかを視覚的に確認できます。複数のタグが同一テキストに付けられている場合も、一目で把握できます。
エクスポート機能
分析結果をさまざまな形式でエクスポートできます。
- HTML — ブラウザで閲覧可能な形式
- CSV — 表計算ソフトやデータ分析ツールで利用可能
- XLSX — Excel 形式
- DOCX — Word 形式
- コード付きドキュメント — タグごとにまとめられたテキスト抽出
プロジェクト管理
複数のドキュメントをプロジェクトとしてまとめて管理できます。同じタグセットを複数の文書に適用し、横断的な分析を行うことが可能です。
コラボレーション
Web ベースのインターフェースにより、複数の研究者が同じプロジェクトで共同作業できます。サーバーにインストールすることで、チームでの利用も容易です。
対応ファイル形式
Taguette は以下の形式のドキュメントを読み込めます。
- DOCX(Word)
- HTML
- TXT(プレーンテキスト)
- EPUB
- ODT(OpenDocument)
- Markdown
導入方法
Taguette はいくつかの方法で利用できます。
オンライン版
app.taguette.org にアクセスするだけで、インストール不要で利用を開始できます。
ローカルインストール
Python 環境があれば、pip でインストールできます。
pip install taguette
taguette
Docker を使う方法もあります。
docker run -p 7465:7465 remram/taguette
DH における活用例
歴史文書の分析
歴史文書のテキストにテーマや人物名、地名などのタグを付け、文書全体を通じたパターンを分析できます。例えば、複数の日記や書簡にタグを付けて、特定のテーマがどの時期に多く言及されているかを調査できます。
インタビュー調査
デジタルヒューマニティーズのプロジェクトにおけるインタビュー記録の分析に Taguette を活用できます。話者の発言にテーマ別のコードを付与し、共通するテーマや相違点を体系的に整理できます。
文学テキストの分析
小説や詩などの文学テキストにモチーフ、登場人物の感情、修辞技法などのタグを付けて分析できます。コードごとに該当箇所を抽出して比較することで、作品の構造やテーマを深く理解できます。
教育での利用
高額な商用ソフトウェアの代替として、授業や学生の研究プロジェクトで Taguette を活用できます。無料でありながら質的分析の基本的なワークフローを学べるため、研究方法論の教育に最適です。
まとめ
Taguette は、質的データ分析に必要な基本機能を備えた無料のオープンソースツールです。高額な商用ソフトウェアの代替として、研究者や学生が気軽に質的分析を始められる環境を提供します。Web ブラウザから利用でき、導入の敷居が低い点も魅力です。DH 研究におけるテキスト分析の入門ツールとして、ぜひ試してみてください。