はじめに
TEI(Text Encoding Initiative)は、人文学のテキストをデジタル化する際の国際標準として広く採用されている XML マークアップ言語です。古典籍、書簡、碑文、辞書など、さまざまなテキスト資料を構造化された形式で記述できます。
しかし、TEI XML で符号化されたテキストを、読みやすい形で Web 上に公開するには、相応の技術的知識が必要です。本記事では、TEI XML のデジタルエディションを簡単に出版できるプラットフォーム TEI Publisher を紹介します。
TEI Publisher とは
TEI Publisher は、eXist-db XML データベース上で動作するデジタルエディション出版プラットフォームです。TEI XML で符号化されたテキストを、カスタマイズ可能な美しい Web ページとして公開できます。
e-editiones コミュニティによって開発・メンテナンスされており、オープンソースとして公開されています。学術的なテキスト出版のためのワンストップソリューションを目指しています。
主な機能
カスタマイズ可能な表示
ODD(One Document Does it all)仕様に基づく処理モデルにより、TEI XML の各要素をどのように表示するかを柔軟に定義できます。XSLT を直接書く必要はなく、GUI ベースのエディタで表示ルールを設定できます。
ファクシミリ表示
原本のデジタル画像(ファクシミリ)とテキストの翻刻を並べて表示できます。IIIF Image API にも対応しており、高解像度画像のズーム表示が可能です。テキストの特定箇所と画像の対応する領域をリンクさせることもできます。
全文検索
eXist-db の全文検索エンジンにより、テキスト全体を高速に検索できます。Lucene ベースのインデックスにより、大量のテキストでも即座に結果を返します。ファセット検索やハイライト表示にも対応しています。
REST API
テキストデータやメタデータにプログラムからアクセスするための REST API が提供されています。外部のアプリケーションやツールとの連携が容易で、データの再利用を促進します。
レスポンシブデザイン
生成される Web ページはレスポンシブデザインに対応しており、PC、タブレット、スマートフォンなど、さまざまなデバイスで適切に表示されます。
多言語・多文字体系対応
ラテン文字はもちろん、アラビア文字、漢字、デーヴァナーガリーなど、多様な文字体系に対応しています。右から左に書く言語(RTL)もサポートしています。
導入方法
TEI Publisher は eXist-db 上で動作します。Docker を使った導入が推奨されています。
docker run -p 8080:8080 existdb/teipublisher:latest
起動後、ブラウザで http://localhost:8080/exist/apps/tei-publisher/ にアクセスすると、TEI Publisher のインターフェースが表示されます。サンプルのテキストが含まれているため、すぐに機能を試すことができます。
DH における活用例
批判的校訂版(クリティカルエディション)の出版
複数の写本を比較して作成した批判的校訂版を、TEI Publisher を使って Web 上に公開できます。校異情報(アパラトゥス)や注釈を含むリッチなデジタルエディションを構築できます。
書簡集の公開
個人の書簡集を TEI XML で符号化し、TEI Publisher で公開することで、日付や差出人・宛先による検索、全文検索が可能な書簡データベースを構築できます。
辞書・語彙集の公開
TEI の辞書モジュール(TEI Dictionaries)を使って符号化された辞書データを、TEI Publisher で検索可能な Web 辞書として公開できます。
教育利用
学生が TEI XML の符号化を学ぶ際に、TEI Publisher を使ってすぐに結果を Web ページとして確認できるため、学習のモチベーション向上に寄与します。
技術的な特徴
TEI Publisher は以下の技術スタックで構成されています。
- eXist-db — ネイティブ XML データベース
- XQuery / XSLT — データの処理・変換
- Web Components — フロントエンドのカスタム要素
- ODD — 表示モデルの定義
- CETEIcean — TEI XML のブラウザ内レンダリング
まとめ
TEI Publisher は、TEI XML のデジタルエディションを Web 上に出版するための包括的なプラットフォームです。カスタマイズ可能な表示、ファクシミリ連携、全文検索、REST API など、学術的なテキスト出版に必要な機能を一通り備えています。Docker による簡単な導入と、GUI ベースの設定により、技術的な障壁を低くしています。デジタルエディションの出版を検討している研究者に、ぜひお勧めしたいツールです。