ホーム 記事一覧 ブック DH週間トピックス 検索 このサイトについて
English
Transkribus:AIによる手書き文字認識で歴史文書を読み解く

Transkribus:AIによる手書き文字認識で歴史文書を読み解く

TL;DR Transkribus は、AIベースの手書き文字認識(HTR: Handwritten Text Recognition)プラットフォームである。100以上の言語に対応し、印刷文字だけでなく手書き文字の認識が可能である。カスタムモデルの学習機能により、特定の筆跡や書体に最適化した認識精度の向上が図れる。歴史文書のテキスト化において、DH研究者にとって不可欠なツールとなっている。 Transkribusとは Transkribusは、オーストリアのインスブルック大学で開始されたプロジェクトに端を発し、現在はREAD-COOP SCE(欧州協同組合)によって運営されている。EU の Horizon 2020 プログラムなどの支援を受けて開発が進められてきた。 主な特徴は以下の通りである。 HTR(手書き文字認識):ディープラーニングベースの手書き文字認識エンジン 100以上の言語:ラテン文字、キリル文字、アラビア文字、ヘブライ文字など多様な文字体系に対応 カスタムモデル学習:自分のデータで認識モデルを学習させ、特定の文書に特化した高精度な認識が可能 レイアウト解析:ページ内のテキスト領域、行、段落を自動的に検出 協調作業:チームでの共同作業に対応し、大規模なテキスト化プロジェクトを効率的に進められる 主要機能 テキスト認識(HTR/OCR) Transkribusの中核機能である。事前学習済みの汎用モデルを使えば、すぐにテキスト認識を開始できる。公開されているモデルには、中世ラテン語写本、近世ドイツ語の亀甲文字(Kurrent)、英語の筆記体など、様々な時代・言語に対応したものがある。 カスタムモデルの学習 最も強力な機能の一つである。約50ページ分のGround Truth(正解テキスト付き画像)を用意すれば、特定の筆跡や書体に特化したモデルを学習できる。学習済みモデルは他のユーザーと共有することも可能である。 レイアウト解析 文書画像のレイアウトを自動的に解析し、テキスト領域(TextRegion)、行(TextLine)、ベースラインを検出する。複雑なレイアウト(多段組み、表、マージン書き込みなど)にも対応している。 Transkribus Lite ブラウザベースのインターフェースで、インストール不要で利用できる。基本的なHTR機能とレイアウト解析が利用可能であり、手軽に試したい場合に適している。 使い方 基本的なワークフロー アカウント作成:Transkribusでアカウントを作成する 文書のアップロード:画像ファイル(JPEG、PNG、TIFF)やPDFをアップロードする レイアウト解析:自動レイアウト解析を実行し、テキスト領域と行を検出する モデル選択:適切なHTRモデルを選択する(公開モデル一覧から検索可能) テキスト認識実行:選択したモデルでHTRを実行する 結果の確認・修正:認識結果を画像と照合しながら確認・修正する エクスポート:TEI-XML、PAGE XML、ALTO XML、プレーンテキストなどの形式でエクスポートする 料金体系 Transkribusは従量課金制を採用している。無料枠(月500クレジット)があり、小規模な利用であれば無料で始められる。大規模プロジェクトにはサブスクリプションプランが用意されている。 DH研究における活用例 歴史文書のテキスト化 アーカイブに眠る手書き文書をテキスト化し、全文検索可能なデジタルアーカイブを構築できる。例えば、江戸時代の古文書や明治期の手書き公文書のテキスト化に活用できる。 大規模コーパスの構築 カスタムモデルの学習と自動認識を組み合わせることで、数千ページ規模の文書を効率的にテキスト化し、テキストマイニングや言語学的分析のためのコーパスを構築できる。 比較文書学 同一テキストの異なる写本をそれぞれテキスト化し、テキストの異同を分析する比較文書学(Stemmatology)に活用できる。TEI-XML形式でのエクスポートにより、Critical Editionの作成にもつなげられる。 市民参加型プロジェクト Transkribusの協調作業機能を活用し、ボランティアによるクラウドソーシング型のテキスト化プロジェクトを運営できる。品質管理機能により、市民参加型でも高品質な成果を得られる。 他ツールとの比較 特徴 Transkribus Google Cloud Vision Tesseract OCR HTR(手書き) 高精度 基本的 非対応 カスタムモデル 可能 AutoML利用 学習可能 歴史文書対応 特化 汎用 汎用 レイアウト解析 高度 基本的 基本的 料金 従量課金 従量課金 無料(OSS) 出力形式 TEI/ALTO/PAGE JSON テキスト/hOCR まとめ Transkribusは、歴史文書のテキスト化において最も実績のあるプラットフォームである。AIベースのHTRエンジンとカスタムモデル学習機能により、様々な時代・言語の手書き文書に対応できる。DH研究において、テキスト化は多くの分析の出発点であり、Transkribusはその基盤を提供する重要なツールである。 ...

Voyant Tools:ブラウザで完結するテキスト分析プラットフォーム

Voyant Tools:ブラウザで完結するテキスト分析プラットフォーム

TL;DR Voyant Tools はブラウザ上で動作するテキスト分析プラットフォームである。テキストデータをペーストまたはアップロードするだけで、ワードクラウド、KWIC(Key Word In Context)、共起分析、トピックモデリング、TF-IDFなど多彩な分析を即座に実行できる。日本語の形態素解析にも対応しており、DHにおけるテキストマイニングの標準的なツールとして広く利用されている。 Voyant Toolsとは Voyant Toolsは、Stéfan SinclairとGeoffrey Rockwellによって開発されたオープンソースのテキスト分析環境である。2003年の初版から20年以上の歴史を持ち、DH分野で最も広く使われているテキスト分析ツールの一つである。 主な特徴は以下の通りである。 完全ブラウザベース:voyant-tools.org にアクセスするだけで利用開始できる 24種類以上のツール:ワードクラウド、頻度分析、KWIC、共起ネットワーク、トレンドグラフなど 多言語対応:英語はもちろん、日本語・中国語・韓国語など多言語テキストを分析可能 コーパス共有:分析結果をURLで共有でき、再現性の高い研究が可能 API提供:プログラマティックなアクセスも可能 主要な分析機能 Cirrus(ワードクラウド) テキスト内の高頻度語をワードクラウドとして可視化する。ストップワード(除外語)のカスタマイズにより、分析対象言語に応じた適切なフィルタリングが可能である。 KWIC(コンコーダンス) 特定のキーワードが文脈の中でどのように使われているかを一覧表示する。前後の文脈を確認しながら、用語の使用パターンを分析できる。 Trends(頻度推移) 文書全体を通じた語句の出現頻度の変化を折れ線グラフで表示する。複数の語句を同時に追跡でき、テキスト内のテーマの推移を分析できる。 Links(共起ネットワーク) 単語間の共起関係をネットワークグラフとして可視化する。どの語が頻繁に一緒に使われているかを構造的に把握できる。 Topics(トピックモデリング) LDAベースのトピックモデリングにより、テキストコーパスに含まれる潜在的なトピックを自動的に抽出する。 使い方 基本的なワークフロー Voyant Tools にアクセスする テキストを入力エリアにペーストするか、ファイル(TXT、PDF、HTML、XMLなど)をアップロードする 「Reveal」ボタンをクリックすると、複数の分析パネルが同時に表示される 各パネルの設定を調整し、分析を深める エクスポートボタンから画像やデータをダウンロードする 日本語テキストの分析 Voyant Toolsは日本語の形態素解析に対応しており、日本語テキストの分析が可能である。テキストをアップロードする際に言語設定を「Japanese」に指定すると、適切な分節化が行われる。ただし、専門用語や固有名詞の分節精度には限界があるため、結果を確認しながら分析を進めることが推奨される。 DH研究における活用例 文学作品の比較分析 複数の文学作品をコーパスとして読み込み、作品間の語彙の違いや共通する表現パターンを分析できる。例えば、夏目漱石の前期と後期の作品で使用語彙がどのように変化したかを定量的に示すことができる。 歴史文書の分析 新聞記事のデジタルアーカイブを対象に、特定の社会問題に関する言説の変遷を時系列で追跡できる。TrendsツールとKWICを組み合わせることで、量的分析と質的分析を同時に行える。 学術論文のサーベイ 研究分野の論文アブストラクトを大量に集めてトピックモデリングを適用すれば、分野全体の研究動向を把握できる。 他ツールとの比較 特徴 Voyant Tools AntConc KH Coder 動作環境 ブラウザ デスクトップ デスクトップ 日本語対応 あり 限定的 充実 可視化 豊富 基本的 豊富 プログラミング 不要 不要 不要 共有機能 URL共有 なし なし まとめ Voyant Toolsは、テキスト分析の専門知識やプログラミングスキルがなくても、豊富な分析機能を手軽に利用できる強力なプラットフォームである。特にDH研究の入門段階で、テキストデータの概要を素早く把握するのに最適である。URLベースのコーパス共有機能により、研究の再現性も確保できる。 ...

Wikidata Query Service:SPARQLで探る知識グラフ活用ガイド

Wikidata Query Service:SPARQLで探る知識グラフ活用ガイド

はじめに デジタル・ヒューマニティーズの研究において、構造化されたデータは極めて重要なリソースです。人物、場所、作品、出来事などの情報が機械可読な形で整理されていれば、大規模なデータ分析や異なるデータセット間の連携が可能になります。 Wikidata は、ウィキメディア財団が運営する自由な知識ベースで、1億件以上の項目(アイテム)を収録しています。そして Wikidata Query Service は、このデータベースに対してSPARQLクエリを実行し、結果をさまざまな形式で可視化できる無料のWebサービスです。 Wikidata Query Serviceの特徴 1. SPARQLによる柔軟な検索 SPARQL(スパークル)は、RDF(Resource Description Framework)データを検索するためのクエリ言語です。SQLに似た構文で、Wikidataの知識グラフに対して複雑な条件での検索を行えます。 例えば、「日本出身で、ノーベル賞を受賞した人物の一覧」や「17世紀にヨーロッパで出版された書籍のうち、現在デジタル化されているもの」といった、複数の条件を組み合わせた高度な検索が可能です。 2. 多様な結果表示 クエリの結果は、以下のような形式で表示できます。 テーブル: 標準的な表形式での表示 地図: 座標データを含む結果を地図上にプロット タイムライン: 時間情報を持つデータの時系列表示 バブルチャート: 数値データの比較 折れ線グラフ / 棒グラフ: 統計的な可視化 ツリーマップ: 階層的データの表示 画像グリッド: 画像URLを含むデータのギャラリー表示 3. 豊富なサンプルクエリ Wikidata Query Serviceには、多数のサンプルクエリ(Examples)が用意されています。SPARQLに不慣れな方でも、サンプルを参考にしながら自分のクエリを組み立てることができます。 4. Linked Open Data との連携 Wikidataは Linked Open Data(LOD)の中核的なハブとして機能しています。各アイテムは一意のURI(例:Q42 = ダグラス・アダムズ)を持ち、他の知識ベース(DBpedia、VIAF、GNDなど)とのリンク情報を含んでいます。 SPARQLの基本 基本的なクエリ構造 SPARQLクエリの基本構造は以下の通りです。 SELECT ?item ?itemLabel WHERE { ?item wdt:P31 wd:Q5 . # instance of: human ?item wdt:P27 wd:Q17 . # country of citizenship: Japan ?item wdt:P166 wd:Q35637 . # award received: Nobel Prize SERVICE wikibase:label { bd:serviceParam wikibase:language "ja,en" . } } wdt:P31 はプロパティ「分類(instance of)」 wd:Q5 はアイテム「人間(human)」 SERVICE wikibase:label は自動的にラベル(名称)を取得する構文 よく使うプロパティ プロパティ 意味 例 P31 分類(instance of) Q5(人間)、Q515(都市) P17 国 Q17(日本) P27 国籍 P569 生年月日 P570 没年月日 P625 座標 P18 画像 P106 職業 DH研究での活用例 歴史人物の分析 特定の時代・地域の人物データを抽出し、職業分布や活動地域を分析できます。 ...

TETRAS-IIIF:Mirador 4向けアノテーション・動画・マルチユーザー拡張

TETRAS-IIIF:Mirador 4向けアノテーション・動画・マルチユーザー拡張

TETRAS-IIIFとは TETRAS-IIIFは、フランスのオープンソース企業Tetras Libre SARLを中心に開発が進められている、Mirador 4向けのプラグイン・ツール群です。アノテーション編集、動画対応、マルチユーザー協調など、Miradorの機能を大幅に拡張する複数のプロジェクトで構成されています。 従来のmirador-annotationsプラグインの課題を解決し、最新のReact 18/19、MUI 5/7に対応した次世代のアノテーション基盤を提供しています。 Mirador Annotation Editor(MAE) 概要 Mirador Annotation Editor(MAE)は、Mirador 4向けのアノテーション作成・編集プラグインです。従来のmirador-annotationsの後継として位置づけられており、Apache 2.0ライセンスで公開されています。 デモ: https://tetras-iiif.github.io/mirador-annotation-editor/ npm: mirador-annotation-editor 主な特徴 Konva.jsベースの描画エンジン mirador-annotationsがPaper.jsを使用していたのに対し、MAEはKonva.jsを採用しています。矩形、楕円、ポリゴン、フリーハンドなどの図形描画に加え、テキストや画像のオーバーレイにも対応しています。 テンプレートシステム MAEの特徴的な機能として「テンプレート」があります。アノテーションの構造をあらかじめ定義しておくことで、統一的なフォーマットでのアノテーション作成が可能になります。たとえば、コメントテンプレートでは見出しと本文を含むHTML構造が自動的に生成されます。 Dublin Coreメタデータ アノテーションにDublin Coreベースのメタデータを付与できます。作成者、日付、言語などの標準的なメタデータフィールドにより、アノテーションの管理・検索が容易になります。 アダプターアーキテクチャ アノテーションの永続化について柔軟なアダプター機構を備えています。ローカルストレージへの保存は標準で提供されており、IIIFアノテーションサーバーへの接続も可能です。 クロスマニフェストリンク 異なるマニフェスト間でアノテーションをリンクする機能を持ちます。これにより、複数のIIIFドキュメントにまたがるアノテーションのネットワークを構築できます。 MAEV(Mirador Annotation Editor for Video) 概要 MAEVは、MAEの機能を動画にまで拡張したプラグインです。IIIF Presentation API 3.0の動画コンテンツに対して、空間的・時間的なアノテーションを付与できます。 デモ: https://tetras-iiif.github.io/mirador-annotation-editor-video/ npm: mirador-annotation-editor-video ライセンス: GPL-3.0 動画アノテーションの特徴 動画アノテーションでは、画像アノテーションの空間的なターゲティング(画面上のどこ)に加えて、時間的なターゲティング(いつ)が可能です。特定の時刻範囲に限定したアノテーションを作成でき、動画の再生に合わせてアノテーションが表示されます。 MAEVの利用にはmirador-videoフォークが必要です。 mirador-video mirador-videoは、Mirador 4のフォークで、動画の表示・アノテーション・フィルタリング機能を追加したものです。React 18/19およびMUI 7に対応しており、Apache 2.0ライセンスで公開されています。 npmのエイリアス機能を使って、通常のMiradorの代わりにインストールできます。 npm install mirador@npm:mirador-video@^1.2.8 Mirador Multi User(MMU) 概要 Mirador Multi User(MMU)は、Miradorをマルチユーザー対応の協調ワークスペースに拡張するプラットフォームです。AGPL-3.0ライセンスで公開されています。 ライブインスタンス: https://app.mirador-multi-user.com/ Webサイト: https://www.mirador-multi-user.com/ 主な機能 ユーザー管理: ユーザーの登録・認証・権限管理 メディアコレクション管理: IIIFマニフェストの整理と共有 プロジェクトスナップショット: ワークスペースの状態を保存・復元 タグとテンプレート: プロジェクト単位でのアノテーションテンプレート管理 管理ダッシュボード: 利用状況の監視と管理 バックエンドはNestJSで構築され、MariaDBをデータベースとして使用しています。Docker/Caddyによるデプロイに対応しています。 ...

IIIF Georeference Viewer:地理参照コンテンツを地図上で可視化するツール

IIIF Georeference Viewer:地理参照コンテンツを地図上で可視化するツール

はじめに デジタルアーカイブや人文学研究の分野では、歴史地図や古写真などの資料を地理的な文脈の中で閲覧したいというニーズが増えています。IIIF(International Image Interoperability Framework)は画像の相互運用性を高めるための国際標準ですが、近年ではIIIF Georeference Extensionによって、IIIF画像に地理座標情報を付与できるようになりました。 今回紹介する IIIF Georeference Viewer(iiif_geo)は、こうした地理参照付きIIIFコンテンツを対話的な地図上で可視化するためのWebアプリケーションです。 IIIF Georeference Extensionとは IIIF Georeference Extensionは、IIIFマニフェストやキャンバスに地理座標情報を埋め込むための仕様です。これにより、歴史地図などのIIIF画像を現代の地図上に正確に重ね合わせることが可能になります。 従来、歴史地図のジオリファレンスにはGIS専用ソフトウェアが必要でしたが、この拡張仕様を活用することで、Webブラウザ上で手軽に地理参照コンテンツを閲覧・比較できるようになります。 IIIF Georeference Viewerの機能 動的なURL読み込み クエリパラメータを使って、任意のIIIFマニフェストやGeoJSONファイルをURLから直接読み込むことができます。例えば以下のようなURLでデモを確認できます。 デモサイト: https://nakamura196.github.io/iiif_geo/ 対応するデータ形式 IIIF Manifest — IIIF Presentation API 3.0のマニフェスト IIIF Canvas — 個別のキャンバスオブジェクト Linked Places Format — 歴史的な地名データの標準フォーマット GeoJSON — 広く使われている地理データフォーマット インタラクティブな地図表示 LeafletおよびMapLibre GLを使用した地図表示では、マーカーのクラスタリングによって大量のポイントデータも効率的に表示できます。ベースマップの切り替えも可能で、航空写真や地理院タイルなど複数の背景地図を選択できます。 分割ペインレイアウト 画面を分割して、左側に地図、右側にIIIF画像のディープズーム表示(OpenSeadragon)を配置するレイアウトに対応しています。歴史地図と現代地図を並べて比較する際に便利です。 ディープズーム OpenSeadragonによる高解像度画像のディープズームに対応しています。巨大な歴史地図でも、細部まで拡大して閲覧することが可能です。 多言語対応 日本語と英語のバイリンガルUIを備えており、国際的な利用にも対応しています。 技術スタック 本ツールは以下の技術で構成されています。 技術 用途 Nuxt 4 / Vue 3 アプリケーションフレームワーク Leaflet 2Dタイル地図表示 MapLibre GL ベクタータイル地図表示 OpenSeadragon IIIF画像のディープズーム GitHub Pages ホスティング Nuxt 4の静的サイト生成(SSG)機能を利用してGitHub Pagesにデプロイしているため、サーバーサイドの運用コストが不要です。 ...

Mirador:IIIFコンテンツを比較・注釈できる高機能ビューア

Mirador:IIIFコンテンツを比較・注釈できる高機能ビューア

Miradorとは Miradorは、IIIF(International Image Interoperability Framework)に対応したオープンソースの画像ビューアです。MITライセンスで公開されており、ハーバード大学やスタンフォード大学をはじめとする世界中の大学、図書館、美術館、博物館で広く採用されています。 Miradorの最大の特徴は、複数の画像をマルチウィンドウで同時に表示し、比較・分析できる点にあります。デジタルヒューマニティーズの研究や、文化財のデジタルアーカイブにおいて欠かせないツールの一つとなっています。 主な機能 マルチウィンドウによる画像比較 Miradorのワークスペースでは、複数のウィンドウを自由に配置し、異なる資料を並べて比較することができます。たとえば、同じ写本の異なる所蔵機関のデジタル画像を横に並べて、テキストの異同を確認するといった作業が可能です。ウィンドウのサイズや配置は自由にドラッグ操作で変更でき、研究の目的に合わせた柔軟なレイアウトを構成できます。 高精細画像のディープズーム MiradorはOpenSeadragonを内部で使用しており、数万ピクセル規模の高精細画像でもスムーズに拡大・縮小・移動が可能です。IIIF Image APIに準拠した画像サーバーから、表示に必要な部分だけを動的に読み込むため、巨大な画像でもストレスなく閲覧できます。 アノテーション機能 IIIF Presentation API 3.0のアノテーション仕様に対応しており、画像上の特定領域にテキストやタグを付与できます。既存のアノテーションの閲覧だけでなく、プラグインを導入することで新規アノテーションの作成も可能です。研究者が画像の特定箇所についてコメントや分析結果を記録する用途に活用されています。 コンパニオンウィンドウ 各画像ウィンドウにはコンパニオンウィンドウと呼ばれるサイドパネルが備わっており、メタデータの表示、レイヤーの切り替え、目次(構造ナビゲーション)、検索などの機能を提供します。マニフェストに含まれるメタデータを確認しながら画像を閲覧できるため、資料の文脈を理解しやすくなっています。 デモを試してみよう Miradorの公式サイトでは、デモページが公開されています。ブラウザ上ですぐに試すことができるので、実際の操作感を確認するのに最適です。 デモページでは、あらかじめいくつかのIIIFマニフェストが読み込まれています。左上の「+」ボタンから新しいウィンドウを追加し、複数のコンテンツを並べて表示してみましょう。また、外部のIIIFマニフェストURLを入力して、任意のコンテンツを読み込むこともできます。 プラグインエコシステム Miradorはプラグインアーキテクチャを採用しており、機能を柔軟に拡張できます。コミュニティによって開発されているプラグインには以下のようなものがあります。 mirador-annotations: W3C Web Annotationに準拠したアノテーションの作成・編集 mirador-image-tools: 画像の明るさ・コントラスト調整、反転、グレースケール変換 mirador-share-plugin: ビューの共有URL生成 mirador-dl-plugin: 画像のダウンロード機能 プラグインはReactコンポーネントとして実装されており、JavaScriptの知識があれば独自のプラグインを開発することも可能です。 導入事例と活用シーン 大学・研究機関 ハーバード大学やスタンフォード大学、イェール大学など、多くの大学図書館がデジタルコレクションの閲覧インターフェースとしてMiradorを採用しています。手稿や古地図、歴史的写真などの高精細画像を、研究者が詳細に分析するためのツールとして活用されています。 美術館・博物館 絵画や工芸品のデジタル画像を高精細で提供する美術館でも採用が進んでいます。複数の作品を比較しながら鑑賞したり、修復前後の画像を並べて確認するといった活用が可能です。 デジタルヒューマニティーズ テキスト校訂、図像学的比較、地図の時系列比較など、デジタルヒューマニティーズの研究手法とIIIF・Miradorの親和性は非常に高いものがあります。異なる機関が所蔵する同一テキストの写本を並べて比較するなど、従来は物理的に困難だった作業をブラウザ上で実現できます。 技術的な特徴 Mirador 3はReactとReduxで構築されており、モダンなフロントエンドアーキテクチャを採用しています。IIIF Presentation API 3.0および2.1に対応しており、幅広いIIIFコンテンツを表示できます。また、npmパッケージとして公開されているため、既存のWebアプリケーションに組み込むことも容易です。 npm install mirador 設定はJSON形式で記述でき、表示するマニフェストやウィンドウの初期配置、UIの表示・非表示などを細かく制御できます。 まとめ Miradorは、IIIFエコシステムにおける中核的なビューアとして確固たる地位を築いています。マルチウィンドウ比較、ディープズーム、アノテーション、プラグイン拡張という豊富な機能を備えながら、オープンソースかつMITライセンスで提供されている点は大きな魅力です。 デジタルアーカイブやデジタルヒューマニティーズに関わる方はもちろん、高精細画像を扱うあらゆる分野の方にとって、Miradorは一度試してみる価値のあるツールです。まずはデモページで、その使い勝手を体験してみてください。

Tify:軽量・高速なIIIFドキュメントビューア

Tify:軽量・高速なIIIFドキュメントビューア

はじめに デジタルアーカイブやデジタルヒューマニティーズの分野では、IIIF(International Image Interoperability Framework)に対応したビューアの選択は重要な課題です。Mirador や Universal Viewer(UV)といった高機能なビューアが広く知られていますが、「もっと軽量で、すばやく表示できるビューアがほしい」という場面も少なくありません。 そこで紹介したいのが Tify です。Tifyは、ドイツのゲッティンゲン大学図書館(SUB Göttingen)を中心に開発されている、軽量・高速なIIIFドキュメントビューアです。 Tifyとは Tifyは、IIIFマニフェストを読み込んで資料を閲覧するためのWebベースのビューアです。Vue.jsで構築されており、MITライセンスのもとオープンソースとして公開されています。公式サイト(https://tify.rocks/)でデモを試すことができます。 最大の特徴は、その軽量さと表示速度です。JavaScriptバンドルのサイズが小さく、読み込みから表示までの時間が非常に短いため、ユーザーにストレスを感じさせません。特にモバイル端末での閲覧体験は優れており、レスポンシブデザインによってスマートフォンやタブレットでも快適に操作できます。 主な機能 IIIF Presentation API対応 TifyはIIIF Presentation API 2.1および3.0の両方に対応しています。既存のIIIFマニフェストをそのまま利用できるため、すでにIIIF対応の画像配信基盤を持つ機関であれば、すぐに導入が可能です。 ページナビゲーションとサムネイル 複数ページの資料をサムネイル一覧から選択して移動できます。書籍や手稿など、ページ数の多い資料を閲覧する際に便利です。サムネイルパネルは画面横に表示され、直感的なナビゲーションが可能です。 目次(Structures)表示 IIIFマニフェストにStructures(Range)が定義されている場合、目次として表示されます。章立てのある書籍や、セクションごとに区切られた資料において、目的の箇所へすばやくジャンプできます。 OCR全文検索 OCRデータが関連付けられたマニフェストでは、全文検索機能を利用できます。検索キーワードを入力すると、該当箇所がハイライト表示され、資料内の情報を効率的に探索できます。これは特に、大量のテキストを含む歴史資料の調査において強力な機能です。 メタデータとアノテーション マニフェストに含まれるメタデータ(タイトル、著者、所蔵機関など)を構造的に表示します。また、アノテーション(注釈)の表示にも対応しており、研究者が付与した情報を閲覧することが可能です。 導入の容易さ Tifyの大きな利点の一つは、埋め込みの手軽さです。基本的には、HTMLに1つのスクリプトタグを追加し、マニフェストURLを指定するだけで動作します。 <div id="tify"></div> <script type="module"> import Tify from 'https://cdn.jsdelivr.net/npm/tify/dist/tify.js'; new Tify({ container: '#tify', manifestUrl: 'https://example.org/manifest.json', }); </script> npmパッケージとしてもインストールでき、Vue.jsプロジェクトへの組み込みも容易です。設定オプションも豊富で、表示言語や初期ページ、パネルの表示・非表示などを柔軟にカスタマイズできます。 他のIIIFビューアとの比較 IIIFビューアの代表格であるMiradorやUniversal Viewerとの違いを簡単に整理します。 Mirador は、複数のマニフェストを同時に開いて比較閲覧ができる高機能なビューアです。研究用途での利用に適していますが、その分、ファイルサイズが大きく、表示速度はやや遅くなります。プラグインによる拡張性も高い反面、初期設定の複雑さがあります。 Universal Viewer(UV) は、画像だけでなく音声や動画など多様なメディアタイプに対応しています。汎用性が高い一方、Tifyと比較するとバンドルサイズは大きくなります。 Tify は、これらのビューアと比べてシンプルで軽量という立ち位置です。複数マニフェストの同時比較やマルチメディア対応は持ちませんが、単一の文書を快適に閲覧するという用途においては最適な選択肢の一つです。デジタルアーカイブのポータルサイトやコレクション展示ページなど、閲覧の快適さを重視する場面で威力を発揮します。 利用事例 Tifyは主にドイツの図書館・文化機関で採用されています。開発元であるゲッティンゲン大学図書館(SUB Göttingen)をはじめ、複数の機関がデジタルコレクションの閲覧インターフェースとしてTifyを利用しています。軽量であることから、既存のWebサイトへの組み込みが容易で、CMS(コンテンツ管理システム)との統合事例も見られます。 まとめ Tifyは、「軽量・高速・モバイル対応」を軸としたIIIFドキュメントビューアです。高機能なMiradorやUVとは異なるアプローチで、閲覧のシンプルさと快適さを追求しています。 IIIFマニフェストを手軽に表示したい場面、モバイルユーザーへの対応を重視する場面、既存のWebページへ軽量なビューアを埋め込みたい場面において、Tifyは有力な選択肢となるでしょう。MITライセンスで提供されているため、商用・非商用を問わず自由に利用できます。 公式サイト: https://tify.rocks/ GitHub: https://github.com/tify-iiif-viewer/tify デモ: https://tify.rocks/demo.html

Universal Viewer:画像・音声・動画・3Dに対応したIIIFビューア

Universal Viewer:画像・音声・動画・3Dに対応したIIIFビューア

Universal Viewerとは Universal Viewer(UV)は、IIIF(International Image Interoperability Framework)に準拠したオープンソースのビューアである。最大の特徴は、その名の通り「ユニバーサル」であること。画像だけでなく、音声、動画、3Dモデル、PDFなど、多様なメディア形式をひとつのビューアで閲覧できる。MITライセンスで公開されており、TypeScriptで実装されている。 IIIFビューアといえばMiradorが有名だが、Universal Viewerは画像以外のメディアへの対応力で際立っている。デモページでは、実際にさまざまな形式のコンテンツを試すことができる。 多様なメディア形式への対応 Universal Viewerが対応するメディア形式は幅広い。 画像:高解像度の画像をスムーズにズーム・パンできる。IIIF Image APIに対応しているため、タイル画像の効率的な配信が可能だ。Deep Zoomにも対応しており、巨大な画像でもストレスなく閲覧できる。 音声・動画:IIIF Presentation API 3で定義された音声や動画コンテンツを再生できる。タイムラインベースのナビゲーションにより、長いコンテンツでも目的の箇所にすばやくアクセスできる。 3Dモデル:博物館の収蔵品や建築モデルなど、3Dコンテンツの表示にも対応している。ブラウザ上で回転・拡大しながら立体的に閲覧できるのは大きな魅力だ。 PDF:PDF文書もビューア内で直接閲覧可能。デジタル化された文書資料をそのまま提供する場合に便利である。 採用している主な機関 Universal Viewerは、世界中の図書館・博物館・アーカイブで採用されている。 大英図書館(British Library):膨大なデジタルコレクションの閲覧にUVを使用している。 ウェルカム図書館(Wellcome Library):医学史関連の資料をUVで公開している。UVの開発にも深く関わってきた機関のひとつだ。 ウェールズ国立図書館(National Library of Wales):ウェールズの歴史的資料をUVで提供している。 Internet Archive:大規模なデジタルアーカイブの閲覧にUVを活用している。 このように、大規模な機関がプロダクション環境で採用している実績は、UVの安定性と信頼性を示している。 主な機能 ツリーナビゲーション 複数ページからなる写本や書籍を閲覧する際に、ツリー構造でページを一覧表示し、目的のページにジャンプできる。IIIF Manifestに含まれるStructures(Range)情報を利用して、章立てや論理的な構造に沿ったナビゲーションを提供する。これは特にデジタル化された古典籍や写本の閲覧で威力を発揮する。 サムネイルパネル 全ページのサムネイルを一覧表示するパネルを備えている。目的のページを視覚的に探すことができ、大量のページを含むコンテンツの閲覧を効率化する。 マニフェスト内検索 IIIF Content Search APIに対応しており、テキストが付与されたマニフェスト内での全文検索が可能だ。OCRされた文書であれば、キーワードで目的の箇所を素早く見つけられる。 フルスクリーンモード ブラウザ全体を使ったフルスクリーン表示に対応しており、没入感のある閲覧体験を提供する。 埋め込み IFRAMEタグを使って外部のWebページにUVを埋め込むことができる。デジタルコレクションを自機関のWebサイトに組み込みたい場合に便利である。設定はJSONベースで柔軟にカスタマイズできる。 IIIF Presentation API 2と3への対応 Universal ViewerはIIIF Presentation API 2と3の両方に対応している。API 3では音声・動画のサポートが強化されており、UVはこの仕様にいち早く対応したビューアのひとつだ。既存のAPI 2のマニフェストも引き続き問題なく表示でき、移行期にある機関にとって心強い選択肢となる。 他のIIIFビューアとの比較 IIIFビューアにはいくつかの選択肢がある。簡単に比較してみよう。 ビューア 画像 音声/動画 3D 注釈編集 比較表示 Universal Viewer ○ ○ ○ △ △ Mirador ○ △ × ○ ○ OpenSeadragon ○ × × × × Miradorは注釈の編集や複数マニフェストの比較表示に強みがある。研究用途で画像を詳細に分析したい場合はMiradorが適している。 ...