解説動画

デジタルアーカイブの技術要素(TEI・RDF など)を、1要素=1本でやさしく解説する「DA技術入門」シリーズです。各回に読み上げ原稿(テキスト)も掲載しています。

fixity入門 ― デジタル資料の「変わっていない」を確かめる動画 2本AI実験

fixity入門 ― デジタル資料の「変わっていない」を確かめる

長期保存したデジタル資料が壊れたり書き換わったりしていないか――その「変わっていないこと(fixity、固定性)」を確かめる考え方を、初学者向けに概念から解説します。ファイルから短い指紋を作るハッシュ(チェックサム)、保存時と後の指紋の照合、定期点検、OAIS・BagIt・PREMISとのつながりまでを図で見ていきます。

fixityChecksumHashDigital Preservation
ALTO・PAGE入門 ― OCRの結果を「座標つき」で残す動画 2本AI実験

ALTO・PAGE入門 ― OCRの結果を「座標つき」で残す

OCR・HTRの結果を、ただの文字列でなく『画像のどこに何があったか』という座標つきで残す二つの標準 ALTO と PAGE を、初学者向けに概念から解説します。ページ→領域→行→単語の入れ子、座標が画像とテキストを結ぶ意味、ALTO(電子化・METS)とPAGE(解析・正解データ)の違い、IIIFやTEIへの橋渡しまでを図で見ていきます。

ALTOPAGEOCRHTR
Webアーカイブ入門 ― 消えるWebをWARCで残す動画 2本AI実験

Webアーカイブ入門 ― 消えるWebをWARCで残す

刻々と書き換わり消えていくWebページを、研究や記録のために『丸ごと』残す考え方と標準を、初学者向けに概念から解説します。リンク切れと内容の移ろい、集める・残す・再生するの三段階、WARCが通信のやりとりごと束ねて残す仕組み、WACZ、長期保存(OAIS)・改変検知(fixity)とのつながりまでを図で見ていきます。

WARCWeb ArchivingWACZDigital Preservation
Dublin Core入門 ― メタデータの共通語彙動画 2本AI実験

Dublin Core入門 ― メタデータの共通語彙

資料を説明するための最小限の共通メタデータ語彙 Dublin Core(ダブリンコア/ISO 15836)を、初学者向けに概念から解説します。なぜ共通の語彙が役立つか、15の基本要素(DCMES)と「任意・繰り返し可」という性質、単純DC(unqualified)と限定DC(DCMI Metadata Terms:細分化・符号化スキーム)の違い、アプリケーションプロファイル・クロスウォーク、OAI-PMH の oai_dc、RDF/Linked Data での使われ方まで。Omeka・OAI-PMH・RDF・METS の各回が前提にしてきたメタデータの土台。仕様で事実確認し独自に構成した実験的な動画です。

Dublin CoreDCMIISO 15836Metadata
RDFスキーマ・OWL入門 ― データに「意味」を与える動画 2本AI実験

RDFスキーマ・OWL入門 ― データに「意味」を与える

RDFのデータに用語の意味を与える RDF Schema(RDFS)と OWL を、初学者向けに概念から解説します。クラスと階層(subClassOf)、プロパティの domain/range、宣言した意味から機械が新事実を導く「推論」、OWL(sameAs/inverseOf/制約)、推論エンジン、検証の SHACL との違い(推論↔検証)、共有語彙(schema.org/Dublin Core/FOAF/CIDOC CRM)まで。RDF・SPARQL・SHACL入門の続編。CC ライセンス教材を参照した独自構成・実験的な動画です。

RDFSOWLRDFLinked Data
RO-Crate入門 ― 研究データを「箱」にまとめる動画 2本AI実験

RO-Crate入門 ― 研究データを「箱」にまとめる

研究データを、その説明(メタデータ)と一緒に、ひとつの「箱(crate)」にまとめて持ち運べるようにする軽量な方法 RO-Crate を、初学者向けに概念から解説する約14分の動画。crate=ro-crate-metadata.json を含むディレクトリ、メタデータは主に schema.org 語彙の JSON-LD、Root/Data/Contextual の3種のエンティティ、機械可読・FAIR・持ち運び、ツール(Crate-O・ro-crate-py)や採用例(WorkflowHub 等)までを図で見る。実装の細部には踏み込まない。

RO-CrateResearch DataJSON-LDschema.org
Web Annotation と Mirador ― 画像に「注釈」をつける動画 2本AI実験

Web Annotation と Mirador ― 画像に「注釈」をつける

注釈を、ツールに閉じない共有可能なデータにするW3C標準 Web Annotation と、それを画像上で付けて見るIIIFビューア Mirador を、初学者向けに概念から解説する約15分の動画。注釈=body(中身)+target(対象)、セレクタで「部分」を指す、JSON-LD で注釈自身がIRIを持つ、motivation、そして Mirador で画像の領域に注釈を付ける実践までを図で見る。実装の細部には踏み込まない。

Web AnnotationMiradorIIIFAnnotation
OAIS入門 ― デジタル長期保存の参照モデル動画 2本AI実験

OAIS入門 ― デジタル長期保存の参照モデル

デジタル情報の長期保存のための参照モデル OAIS(開放型アーカイブ情報システム/ISO 14721)を、初学者向けに概念から解説します。なぜ長期保存が難しいか、登場人物(生産者・消費者・管理)と指定コミュニティ、情報パッケージ SIP・AIP・DIP、AIP=Content Information+PDI(来歴・参照・固定値・文脈)、6つの機能(取り込み・保管・データ管理・管理・保存計画・アクセス)まで。PREMIS・METS・BagIt との関係も整理します。仕様で事実確認し独自に構成した実験的な動画です。

OAISISO 14721Digital PreservationAIP
SHACL入門 ― RDFの「形」を検証する動画 2本AI実験

SHACL入門 ― RDFの「形」を検証する

RDFグラフが「期待した形」になっているかを検証する SHACL を、初学者向けに概念から解説します。シェイプ(ノード/プロパティシェイプ)、個数・型・クラスなどの制約、適合/違反の検証レポート、もう一つのシェイプ言語 ShEx(Wikidata の EntitySchemas)、SPARQL(問い合わせ)やXMLスキーマとの関係まで。RDF・SPARQL入門の続編。CC ライセンス方針のもと、仕様で事実確認し独自に構成した実験的な動画です。

SHACLShExRDFWikidata
CIDOC CRM入門 ― 出来事でつなぐ文化遺産データ動画 2本AI実験

CIDOC CRM入門 ― 出来事でつなぐ文化遺産データ

文化遺産情報を機関を越えて統合するための共通の参照モデル CIDOC CRM(ISO 21127)を、初学者向けに概念から解説する約15分の動画。『出来事(イベント)中心』の考え方を軸に、クラスと属性で人・モノ・場所・時を結ぶ発想、RDF で表現してリンクトデータに乗ること、共通モデルで横断統合できる利点、Linked Art などのプロファイルまでを図で見る。RDF/リンクトデータ入門の続編。実装の細部には踏み込まない。

CIDOC CRMISO 21127Linked DataCultural Heritage
GeoJSONとLinked Places Format入門 ― 場所をつなぐ動画 2本AI実験

GeoJSONとLinked Places Format入門 ― 場所をつなぐ

地理データの標準 GeoJSON を土台に、歴史的な「場所」を表し・つなぐための Linked Places Format(LPF)を、初学者向けに概念から解説する約20分の動画。GeoJSON のジオメトリ・Feature・FeatureCollection から始め、歴史の場所の難しさ(時代で変わる名前・位置)、LPF が GeoJSON-LD として names・types・when(時間)・links を足すこと、closeMatch/exactMatch で Wikidata・GeoNames・Pleiades などのガゼッティアへつなぐこと、World Historical Gazetteer や Pelagios での活用までを図で見る。

GeoJSONLinked Places FormatLPFGazetteer
TEIカスタマイズ入門 ― ODDでスキーマと出力を仕立てる動画 2本AI実験

TEIカスタマイズ入門 ― ODDでスキーマと出力を仕立てる

巨大なTEIを、自分の資料に合わせて「仕立てる」カスタマイズの考え方を、初学者向けに概念から解説する約15分の動画。設計図 ODD(One Document Does it all)を真ん中に置き、そこから生成される検証用スキーマ(RELAX NG/DTD、補足でSchematron)による妥当性検証と、出力を宣言する Processing Model(→HTML/PDF等)までを図で見る。TEI入門の続編。実装の細部には踏み込まない。

TEIODDRELAX NGDTD
XSLT・XPath入門 ― XMLを選んで作り変える動画 2本AI実験

XSLT・XPath入門 ― XMLを選んで作り変える

XMLから目的のノードを選ぶ XPath と、XMLを別の形(HTML等)へ変換する XSLT を、初学者向けに概念から解説します。XPath(//・述語[ ])、XSLTのテンプレート(match→出力・value-of・apply-templates)、XML+XSLT→プロセッサ→出力の流れ、TEI→Web公開などDHでの活用まで。CC ライセンスのオープン教材を参照した独自構成・実験的な取り組みです。

XSLTXPathXMLTEI
OAI-PMH入門 ― メタデータを集めて、横断する動画 2本AI実験

OAI-PMH入門 ― メタデータを集めて、横断する

リポジトリからメタデータを機械的に集める(ハーベストする)ための古くからの標準プロトコル OAI-PMH を、初学者向けに概念から解説する約20分の動画。データプロバイダとサービスプロバイダの2つの役割、HTTP+XML、6つのverb、レコード構造(ヘッダ+メタデータ=Dublin Core)、セットと差分収集、そして横断検索・ポータルでの集約までを図で見る。メタデータを集めるOAI-PMHと、画像のIIIF・テキストのDTSという対比でも捉えられる。

OAI-PMHMetadata HarvestingDublin CoreRepositories
ResourceSync入門 ― リソースを最新に保ち合う動画 2本AI実験

ResourceSync入門 ― リソースを最新に保ち合う

サーバ間でウェブ上のリソースを同期し続けるための枠組み ResourceSync を、初学者向けに概念から解説する約20分の動画。全体をそろえる baseline 同期(Resource List / Resource Dump)と、変更を追う差分同期(Change List / Change Dump)、能力の知らせ方(Capability List / Source Description)、Sitemaps を土台にした仕組み、そして OAI-PMH(メタデータ収集)との違いまで概観する。

ResourceSyncOAI-PMHSitemapsSynchronization
METSとPREMIS入門 ― 束ねる入れ物と、保存のための情報動画 2本AI実験

METSとPREMIS入門 ― 束ねる入れ物と、保存のための情報

デジタル資料を長く保つための2つのメタデータ標準を、初学者向けに概念から解説する約20分の動画。保存メタデータ PREMIS(対象・イベント・エージェント・権利、fixity と来歴)と、それらを一つに束ねる入れ物 METS(記述・管理・構造を梱包、structMap)を取り上げ、MODS/Dublin Core(記述)との関係や OAIS の AIP とのつながりまで概観する。

METSPREMISDigital PreservationMetadata
IIIF入門 ― 画像を、機関を越えて扱う動画 2本AI実験

IIIF入門 ― 画像を、機関を越えて扱う

画像を機関の垣根を越えて共通のルールで扱う国際標準 IIIF(トリプル・アイ・エフ)を、初学者向けに概念から解説する動画。画像API(領域・サイズ・回転・品質をURLで指定し深く拡大できる)と Presentation API(画像群をまとめるマニフェスト、台紙となるキャンバス)を中心に、どのビューアでも開ける相互運用、機関を越えた見比べ、Web Annotation による注釈、デジタル・ヒューマニティーズでの活用までを図で見る。画像のIIIFとテキストのDTSという対比でも捉えられる。実装の詳細には踏み込まない。

IIIFImage APIPresentation APImanifest
DTS入門 ― テキストに共通の窓口をつくる動画 2本AI実験

DTS入門 ― テキストに共通の窓口をつくる

テキストのコレクションに、標準化されたAPIで触れるための仕様 DTS(Distributed Text Services)を、初学者向けに概念から解説する約20分の動画。3つのエンドポイント(コレクション/ナビゲーション/ドキュメント)、引用構造、JSON-LD・TEI/XML での応答、相互運用までを図で見る。画像のIIIFに対するテキストのDTS、という対比を軸に、TEI・RDFの回と地続きに学べる。実装の詳細には踏み込まない。

DTSDistributed Text ServicesTEIJSON-LD
Omeka入門 ― デジタル展示を公開する動画 2本AI実験

Omeka入門 ― デジタル展示を公開する

デジタル資料を集めて見せるための、無料・オープンソースの公開プラットフォーム Omeka を、初学者向けに概念から解説する約20分の動画。アイテム・コレクション・メタデータ(Dublin Core)・展示(Exhibit)という基本の単位を押さえ、Omeka Classic と Omeka S の違い(複数サイト・Linked Open Data 寄り)まで概観する。

OmekaOmeka SDublin CoreDigital Exhibit
スパークル入門 ― グラフに問いを投げる動画 2本AI実験

スパークル入門 ― グラフに問いを投げる

RDFのグラフ(三つ組の網)に問い合わせる言語 SPARQL を、初学者向けに概念から解説します。トリプルパターン(SELECT … WHERE と ?変数)、パターンを重ねた絞り込み、FILTER・OPTIONAL・並べ替え、結果が表で返ること、公開エンドポイント(Wikidata Query Service)で試す流れまで。CC ライセンスのオープン教材を参照した独自構成・実験的な取り組みです。

SPARQLRDFLinked DataLOD
RDFとリンクトデータ入門 ― データを線でつなぐ動画 2本AI実験

RDFとリンクトデータ入門 ― データを線でつなぐ

データを主語・述語・目的語の三つ組(トリプル)で表す RDF と、データ同士をリンクで結ぶ Linked Data/LOD の考え方を、初学者向けに概念から解説します。CC ライセンスのオープン教材を参照した独自構成・実験的な取り組みです。

RDFLinked DataLODSPARQL
TEIとXML入門 ― 人文学テキストを「データ」にする動画 2本AI実験

TEIとXML入門 ― 人文学テキストを「データ」にする

人文学のテキストを構造化して扱う国際標準 TEI と、その土台となる XML を、初学者向けに概念から解説します。CC ライセンスのオープン教材を参照した独自構成・実験的な取り組みです。

TEIXMLText EncodingDigital Humanities