View in English

RO-Crate入門 ― 研究データを「箱」にまとめる

研究データを、その説明(メタデータ)と一緒に、ひとつの「箱(crate)」にまとめて持ち運べるようにする軽量な方法 RO-Crate を、初学者向けに概念から解説する約14分の動画。crate=ro-crate-metadata.json を含むディレクトリ、メタデータは主に schema.org 語彙の JSON-LD、Root/Data/Contextual の3種のエンティティ、機械可読・FAIR・持ち運び、ツール(Crate-O・ro-crate-py)や採用例(WorkflowHub 等)までを図で見る。実装の細部には踏み込まない。

RO-CrateResearch DataJSON-LDschema.orgFAIRDigital Humanities
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。

掛け合い解説(ずんだもん×四国めたん)

別バージョン

ナレーション解説

章立て

  1. 1

    本編

    なぜ箱にまとめるか・RO-Crate・crate=ディレクトリ+ro-crate-metadata.json・schema.orgのJSON-LD・3種のエンティティ・機械可読/FAIR/持ち運び・ツールと採用・何を説明として残すか・始め方

    読み上げ原稿

    • 0:00研究データを「箱」にまとめる

      皆さん、こんにちは。デジタル・ヒューマニティーズ入門、技術要素シリーズ、なかむらさとるの、解説回です。この回の、ナレーションは、合成音声で、お届けします。テーマは、アールオー・クレート。研究データを、その説明と、いっしょに、ひとつの箱に、まとめて、持ち運べるようにする、軽量な方法です。むずかしい道具立ては、要りません。考え方を、図を交えながら、ゆっくり、見ていきます。どうぞ、気楽について来てください。

      研究データを「箱」にまとめる
    • 0:39この動画について

      はじめに、この動画について、簡単に、ご案内します。この動画は、オープンに、公開されている、仕様や、資料を、参照しつつ、独自に、構成した、解説です。スライドと、図は、新規に作成し、ナレーションは、AIの、音声合成です。この回は、本人の、クローン声では、ありません。あくまで、実験的な、取り組みですので、内容は、ご確認・ご注意のうえ、ご利用ください。誤りに、気づかれたら、概要欄から、ご指摘いただけると、たすかります。出典と、ライセンスは、動画の最後と、概要欄に、まとめてあります。それでは、本編に、入りましょう。

      この動画について
    • 1:32この回のゴール

      まず、この回のゴールを、確認しておきましょう。目標は、大きく、四つです。一つめは、アールオー・クレートが、研究データと、メタデータを、まとめて梱包する、軽量な方法だと、説明できること。二つめは、クレートとは、ディレクトリで、その中心に、アールオー・クレート・メタデータ・JSON、という、ファイルがある、と説明できること。三つめは、メタデータが、主に、スキーマ・ドット・オルグの、語彙の、JSON-LDで、書かれる、とイメージできること。そして四つめは、三種類の、エンティティ、箱・データ本体・関係するもの、の役割の、見当がつくことです。

      この回のゴール
    • 2:22今日の流れ

      今日の流れです。はじめに、なぜ、データを、箱に、まとめるのか。つぎに、クレートの、しくみ。ディレクトリと、アールオー・クレート・メタデータ・JSON。それから、メタデータの中身。スキーマ・ドット・オルグの、JSON-LDと、三種類の、エンティティ。そして、つないで、広がる。機械可読、フェア、持ち運び。最後に、自分で、始めるための、手がかりを、紹介します。

      今日の流れ
    • 2:59なぜ「箱」にまとめるのか

      それでは、はじめましょう。まずは、なぜ、データを、箱に、まとめるのか。データだけ、渡されたときの、困りごとから、見ていきます。

      なぜ「箱」にまとめるのか
    • 3:11データだけでは、分からない

      図を、見てください。研究データの、ファイルだけを、渡されても、受け取った人は、よく、困ります。これは、何のデータなのか。どう、使えばいいのか。誰が、いつ、作ったのか。そうした、文脈が、分からなければ、せっかくのデータも、再利用するのが、難しくなってしまいます。データは、それだけでは、意味が、伝わりにくいのです。

      データだけでは、分からない
    • 3:42データと「説明」を、いっしょに

      そこで、図のように、データと、その説明、つまり、メタデータを、ひとつの、箱に、いっしょに、まとめる、という発想が、出てきます。何の、誰の、いつの、どう使う、データなのか。その説明を、データと、同じ箱に、入れて、持ち運べるようにする。これが、出発点です。

      データと「説明」を、いっしょに
    • 4:08RO-Crate ― 研究データ梱包の軽量な方法

      その箱を、軽量に、実現する方法が、アールオー・クレートです。リサーチ・オブジェクト・クレートの、略で、研究データと、メタデータを、まとめて、持ち運ぶための、軽量な、方法です。コミュニティが、策定していて、箱の中身、つまり、メタデータは、主に、スキーマ・ドット・オルグの、語彙を使った、JSON-LDで、書かれます。

      RO-Crate ― 研究データ梱包の軽量な方法
    • 4:38ここまでのポイント

      ここで、いったん、整理します。データだけでは、文脈が、分からず、再利用しにくい。だから、データと、説明、つまり、メタデータを、ひとつの箱に、まとめて、持ち運ぶ。それを、軽量に、実現する方法が、アールオー・クレートで、中身は、主に、スキーマ・ドット・オルグの、JSON-LD、でした。では、その箱は、具体的に、どんな形を、しているのでしょう。つぎは、クレートの、しくみです。

      ここまでのポイント
    • 5:15crate のしくみ

      ここからは、クレートの、しくみです。箱の、中身を、見ていきます。

      crate のしくみ
    • 5:22crate = ディレクトリ+目録ファイル

      図を、見てください。クレートは、特別なものでは、ありません。じつは、ふつうの、フォルダ、ディレクトリです。その中に、データの、ファイルや、フォルダを置き、そして、中心に、アールオー・クレート・メタデータ・JSON、という、ファイルを、一枚、置きます。この、たった一枚の、ファイルが、箱全体の、目録の、役割を、果たします。データベースも、サーバも、要りません。

      crate = ディレクトリ+目録ファイル
    • 5:56目録は schema.org の JSON-LD

      その、目録ファイルの、中身は、主に、スキーマ・ドット・オルグの、語彙を使った、JSON-LDです。図のように、データセットや、人物、といった、ものを、記述します。これは、リンクトデータの、形なので、人だけでなく、機械も、読むことができ、ものと、ものの、つながりを、たどることが、できます。

      目録は schema.org の JSON-LD
    • 6:223種のエンティティ

      目録には、大きく、三種類の、エンティティが、出てきます。図のように、一つめが、ルート・データ・エンティティ。これは、箱、そのもの、データセット全体を、表します。二つめが、データ・エンティティ。中身の、ファイルや、フォルダ、つまり、データ本体です。三つめが、コンテクスチュアル・エンティティ。人や、組織、場所、といった、関係するもの。これらを、それぞれ、記述していくのです。

      3種のエンティティ
    • 7:00ここまでのポイント

      ここまでを、整理します。クレートは、ふつうの、フォルダで、中心に、アールオー・クレート・メタデータ・JSONを、置く。その目録は、主に、スキーマ・ドット・オルグの、JSON-LDで、機械が、読めます。そして、箱・データ本体・関係するもの、という、三種類の、エンティティを、記述する。特別な、しくみは、要らず、フォルダに、一枚、足すだけで、始められる、のでした。では、この箱が、どう、役立つのでしょう。つぎは、機械可読、フェア、持ち運びの、話です。

      ここまでのポイント
    • 7:45つないで広がる

      ここからは、つないで、広がる、話です。機械可読、フェア、そして、持ち運びについて、見ていきます。

      つないで広がる
    • 7:55機械が「つながり」をたどれる

      図を、見てください。メタデータが、スキーマ・ドット・オルグの、語彙で、書かれているので、たとえば、データの、作者は、誰か、ライセンスは、何か、形式は、何か、といった、つながりを、機械が、たどることが、できます。ただ、ファイルを、並べておくのではなく、意味のある、関係として、たどれる。これが、リンクトデータの、形で、書く、利点です。

      機械が「つながり」をたどれる
    • 8:26箱ごと持ち運べて、FAIRに近づく

      さらに、箱には、もう一つの、よさが、あります。図のように、クレートは、ジップ、つまり、一つの、圧縮ファイルに、固めて、どこへでも、持ち運べます。しかも、説明、つまり、メタデータも、いっしょに、運ばれます。データが、説明ごと、移動できるので、見つけやすく、たどりやすく、かみ合いやすく、再利用しやすい、フェアな、状態に、近づける、助けになります。

      箱ごと持ち運べて、FAIRに近づく
    • 8:59作る道具と、広がる採用

      実際に、使うときは、すべてを、手で書く必要は、ありません。図のように、クレートオー、という、ブラウザの、エディタや、アールオー・クレート・パイ、という、パイソンの、ライブラリ、デスクリボ、といった、道具が、あります。そして、ワークフローハブ、をはじめ、さまざまな、研究基盤や、リポジトリで、採用が、広がっています。一人の研究者から、大きな、研究環境まで、使える、というわけです。

      作る道具と、広がる採用
    • 9:34ここまでのポイント

      ここまでを、整理します。メタデータが、スキーマ・ドット・オルグの、JSON-LDなので、機械が、つながりを、たどれる。クレートは、ジップで、固めて、持ち運べ、説明ごと、運ぶので、フェアに、近づく。そして、クレートオーや、アールオー・クレート・パイ、といった、道具が、あり、ワークフローハブ、などで、採用が、広がっている、のでした。仕組みが、見えてきたところで、少し、立ち止まって、考えてみましょう。

      ここまでのポイント
    • 10:11考えてみよう

      ここで、少し、考えてみましょう。あなたの、データを、箱に、まとめるとしたら、どんな、説明を、添えるでしょうか。何の、誰の、いつの、どう使う、データなのか。よろしければ、ここで一度、動画を止めて、思い浮かべてみてください。

      考えてみよう
    • 10:33何を「説明」として残すか

      いまの、問いには、大事な点が、ひそんでいます。どんな、文脈を、どこまで、記述するかは、機械的に、決まるものでは、ありません。将来、誰が、何のために、使うかを、想像して、残す説明を、選ぶ。記述すべきことを、見極める作業は、その、データを、どう、理解してほしいかを、考えることでも、あります。梱包は、単なる、作業ではなく、データの、意味を、未来へ、引き継ぐ、営みなのです。

      何を「説明」として残すか
    • 11:09始め方・学ぶには

      では、自分でも、始めてみたい、と思ったら、どうすれば、よいでしょう。まず、作ってみるなら、クレートオー、という、ブラウザの、エディタで、手元の、フォルダを、クレートに、してみるのが、よい、入り口です。プログラムで、扱うなら、アールオー・クレート・パイ、などで、メタデータを、生成できます。体系的に、学ぶなら、アールオー・クレートの、公式仕様や、用例集を。そして、できあがった、アールオー・クレート・メタデータ・JSONを、開いて、三種類の、エンティティを、眺めてみると、理解が、深まります。

      始め方・学ぶには
    • 11:54まとめ

      今日の、まとめです。アールオー・クレートは、研究データと、メタデータを、まとめて、梱包する、軽量な方法でした。クレートは、ディレクトリで、中心に、アールオー・クレート・メタデータ・JSON、主に、スキーマ・ドット・オルグの、JSON-LD。目録は、箱・データ本体・関係するもの、を記述する。機械が、読めて、ジップで、持ち運べ、フェアに、近づく。道具や、採用も、広がっている、のでした。データに、説明を、添えて、ひとつの箱に。意味ごと、未来へ、手渡すための、軽い作法です。

      まとめ
    • 12:41出典・ライセンス

      この動画は、オープンに、公開されている、仕様や、資料を、参照して、作成しました。主なものは、アールオー・クレートの、メタデータ仕様です。あわせて、事実確認には、スキーマ・ドット・オルグや、JSON-LD、それに、ワークフローハブ、などの、採用事例も、参照しました。スライドと、図は、これらを、参考にしたうえで、あらためて、新規に、作成したものです。

      出典・ライセンス
    • 13:15ご清聴ありがとうございました

      以上で、アールオー・クレートの、入門を、終わります。研究データに、その説明を、添えて、ひとつの箱に、まとめる。意味ごと、持ち運び、未来へ、手渡す。その、軽い作法の、第一歩を、つかんでいただけたなら、と思います。ご清聴、ありがとうございました。

      ご清聴ありがとうございました