TL;DR
Gephi Lite は、ネットワーク可視化ツールとして定評のあるGephiのブラウザ版である。インストール不要で、GEXFファイルを読み込むだけでForceAtlas2レイアウト、コミュニティ検出、各種統計量の計算が可能である。人物関係、引用ネットワーク、共起ネットワークなど、DH研究で頻出するネットワーク分析に最適なツールである。
Gephi Liteとは
Gephiは2008年に公開されたオープンソースのネットワーク可視化・分析ソフトウェアであり、「ネットワークのPhotoshop」とも呼ばれるほど広く利用されている。Gephi Liteはそのブラウザ版として開発され、デスクトップアプリのインストールなしにネットワーク分析を行えるようになった。
主な特徴は以下の通りである。
- ブラウザで動作:WebGLを活用し、大規模ネットワークもスムーズに描画
- ForceAtlas2レイアウト:Gephiの代表的なレイアウトアルゴリズムをブラウザ上で実行可能
- コミュニティ検出:Louvain法によるコミュニティ(クラスタ)の自動検出
- 統計量の計算:次数中心性、媒介中心性、PageRankなどのネットワーク指標を算出
- GEXF対応:Gephiのネイティブ形式であるGEXFファイルの読み込み・書き出しに対応
使い方
1. データの準備
ネットワークデータをGEXF形式で準備する。GEXFはXMLベースのグラフ記述フォーマットで、ノード(頂点)とエッジ(辺)の情報を含む。Pythonのnetworkxライブラリなどでプログラマティックに生成することも可能である。
<?xml version="1.0" encoding="UTF-8"?>
<gexf xmlns="http://gexf.net/1.3">
<graph defaultedgetype="undirected">
<nodes>
<node id="1" label="Person A"/>
<node id="2" label="Person B"/>
</nodes>
<edges>
<edge source="1" target="2" weight="3"/>
</edges>
</graph>
</gexf>
2. ファイルの読み込み
Gephi Lite にアクセスし、GEXFファイルをアップロードする。読み込みが完了すると、ネットワークが画面上に表示される。
3. レイアウトの適用
ForceAtlas2を実行すると、ノード間の引力と斥力に基づいて自動的にレイアウトが最適化される。関連性の高いノード同士が近くに配置され、ネットワークの構造が視覚的に明確になる。
4. 分析と可視化
- ノードサイズ:次数やPageRankに基づいてノードサイズを変更し、重要なノードを強調
- ノード色:コミュニティ検出の結果に基づいて色分けし、クラスタ構造を明示
- フィルタリング:次数やウェイトに基づくフィルタで、重要な関係のみを表示
DH研究における活用例
書簡ネットワーク分析
歴史的な人物間の書簡データから、差出人・受取人をノード、書簡をエッジとしたネットワークを構築できる。中心性の高い人物を特定することで、知的交流のハブとなった人物を発見できる。
引用ネットワーク分析
学術論文の引用関係をネットワークとして可視化し、研究分野の構造や影響力のある論文を特定できる。コミュニティ検出により、研究のサブフィールドの境界を明らかにすることもできる。
共起ネットワーク分析
テキストデータから抽出した共起関係をネットワークとして表現し、概念間の関係性を分析できる。Voyant Toolsなどで生成した共起データをGEXF形式に変換して読み込むことも可能である。
地理的ネットワーク
交易路や移動経路を地名ノードと経路エッジで表現し、歴史的な交通・物流ネットワークの構造を分析できる。
デスクトップ版Gephiとの比較
| 特徴 | Gephi Lite | Gephi(デスクトップ) |
|---|---|---|
| インストール | 不要 | Java環境必要 |
| 大規模ネットワーク | 中規模まで | 大規模対応 |
| プラグイン | なし | 豊富 |
| レイアウト | ForceAtlas2 | 多数対応 |
| エクスポート | GEXF、PNG | GEXF、PDF、SVGなど |
| 共有 | URLで可能 | ファイル共有 |
Gephi Liteは手軽さと共有のしやすさが魅力であるが、100万ノード超のような大規模ネットワークや高度なプラグイン機能が必要な場合はデスクトップ版が適している。
まとめ
Gephi Liteは、ネットワーク分析の敷居を大幅に下げるツールである。ブラウザさえあればForceAtlas2レイアウトやコミュニティ検出といった本格的な分析が可能であり、DH研究における人物関係、引用関係、共起関係など様々なネットワークの探索的分析に最適である。