View in English

fixity入門 ― デジタル資料の「変わっていない」を確かめる

長期保存したデジタル資料が壊れたり書き換わったりしていないか――その「変わっていないこと(fixity、固定性)」を確かめる考え方を、初学者向けに概念から解説します。ファイルから短い指紋を作るハッシュ(チェックサム)、保存時と後の指紋の照合、定期点検、OAIS・BagIt・PREMISとのつながりまでを図で見ていきます。

fixityChecksumHashDigital PreservationDigital Archives
⚠ この解説は、AIによる実験的な取り組みです(構成・図・音声合成を含む)。不正確な内容を含む可能性があります。ご利用の際はご注意ください。

掛け合い解説(ずんだもん×四国めたん)

別バージョン

ナレーション解説

章立て

  1. 1

    本編

    なぜ確かめるか・ハッシュ=指紋・照合・指紋は知らせるだけ・定期点検・OAIS/BagIt/PREMIS

    読み上げ原稿

    • 0:00デジタル資料の「変わっていない」を確かめる

      皆さん、こんにちは。ディーエー技術入門、なかむらさとるの解説回です。この回のナレーションは合成音声でお届けします。テーマは、fixity。長期保存したデジタル資料が、いつのまにか壊れたり、書き換わったりしていないか。その、変わっていないこと、を確かめる考え方です。むずかしい数学には踏み込みません。考え方を、図を交えながら、ゆっくり見ていきましょう。

      デジタル資料の「変わっていない」を確かめる
    • 0:34この動画について

      はじめに、この動画について簡単にご案内します。これは、オープンに公開されている仕様や資料を参照しつつ、独自に構成した解説です。スライドと図は新規に作成し、ナレーションはAIの音声合成です。この回は、本人のクローン声ではありません。実験的な取り組みですので、内容はご確認のうえご利用ください。誤りにお気づきのときは、概要欄からご指摘いただけると助かります。出典とライセンスは、動画の最後と概要欄にまとめてあります。

      この動画について
    • 1:14この回のゴール

      まず、この回のゴールを確認しておきましょう。目標は大きく四つです。一つめは、fixity、固定性が、資料が変わっていないことの確認だ、と説明できること。二つめは、ハッシュ、つまりチェックサムが、ファイルから短い指紋を作る仕組みだ、とイメージできること。三つめは、保存した時と後の指紋を照合して、改変や破損を見つける流れを説明できること。そして四つめは、定期点検や、OAIS、BagItとのつながりに、見当がつくことです。

      この回のゴール
    • 1:55今日の流れ

      今日の流れです。はじめに、なぜわざわざ確かめる必要があるのか、その理由を考えます。つぎに、ファイルから短い指紋を作って照合する、ハッシュの仕組みを見ます。最後に、定期点検としての運用や、保存の枠組みの中での役割までを見ていきます。

      今日の流れ
    • 2:171. なぜ確かめるのか

      それでは一つめ。なぜ確かめるのか。デジタル資料は、わたしたちの知らないうちに、変わってしまうことがあります。

      1. なぜ確かめるのか
    • 2:28ファイルは、静かに変わりうる

      デジタルのファイルは、静かに変わりうるものです。図のように、記録した媒体が劣化して、中身がじわじわ崩れる、ビット腐敗。コピーや転送のときに起こる、エラー。それから、うっかりした上書きや改変。こうした原因で、見た目では気づかないうちに、中身が変わってしまうことがあるのです。

      ファイルは、静かに変わりうる
    • 2:54「変わっていない」を確かめたい

      だからこそ、保存した時とくらべて、中身が変わっていないか、を確かめたくなります。図のように、保存した時のファイルと、いまのファイルが、ぴったり同じであること。この、変わっていないこと、を、fixity、日本語では固定性、と呼びます。これが、この回の主役です。

      「変わっていない」を確かめたい
    • 3:17ここまでの整理

      ここまでを整理します。デジタル資料は、ビット腐敗や、転送エラーや、誤った上書きで、静かに変わりうるものでした。見た目では気づきにくいので、変わっていないこと、を確かめたい。そして、その、変わっていないこと、をfixityと呼ぶのでした。では、ファイルが変わっていないかを、どうやって確かめるのでしょうか。

      ここまでの整理
    • 3:442. ハッシュ=指紋

      二つめのお話です。ファイルから短い指紋を作って、それを照合する。ハッシュという仕組みを見ていきましょう。

      2. ハッシュ=指紋
    • 3:54ファイルから、短い「指紋」を作る

      ハッシュという計算で、ファイル全体を通すと、短いあたいが得られます。図のように、大きなファイルでも、出てくるあたいは短く、決まった長さです。このあたいを、ファイルの指紋、ハッシュ値と考えてください。広い意味で、チェックサムとも呼ばれます。ファイルごとに、その中身から作られる、固有の短い印です。

      ファイルから、短い「指紋」を作る
    • 4:22「指紋」の、二つの大事な性質

      この指紋には、二つの大事な性質があります。一つめは、同じ中身のファイルからは、必ず同じ指紋が出ること。二つめは、中身がほんの少し違うだけで、まったく別の指紋になること。だから、指紋を見くらべるだけで、同じか、違うか、が分かります。中身を最初から最後まで見くらべる必要はありません。

      「指紋」の、二つの大事な性質
    • 4:49保存時の指紋と、いまの指紋をくらべる

      使い方は、こうです。図のように、保存した時に、指紋を控えておきます。そして後で、もういちど指紋を計算しなおして、二つを照合します。一致すれば、変わっていない。一致しなければ、何かが起きた、と分かります。改変だけでなく、破損も、この一致しない、という形で見つかります。

      保存時の指紋と、いまの指紋をくらべる
    • 5:16指紋は「知らせる」だけ ― 直しはしない

      ここで、大事な注意点です。指紋は、違いを知らせるだけで、直してはくれません。図のように、指紋から、もとのファイルを復元することはできません。壊れた箇所を修理するわけでもありません。あくまで、違いがある、と教えてくれるだけです。ですから、別に保っておいた、予備のコピーと組み合わせて使います。異常に気づいたら、無事なコピーから戻すのです。

      指紋は「知らせる」だけ ― 直しはしない
    • 5:48ここまでの整理

      ここまでを整理します。ハッシュは、ファイルから短い指紋を作る計算で、チェックサムとも呼ばれました。同じ中身なら同じ指紋、少し違えばまったく別の指紋になります。保存した時と後の指紋を照合すれば、改変や破損が分かります。ただし、指紋は違いを知らせるだけなので、直すには予備のコピーが要るのでした。では実際に、保存の現場では、どう使われているのでしょうか。

      ここまでの整理
    • 6:213. 運用とつながり

      三つめのお話です。指紋を、定期点検としてくりかえし回し、保存の枠組みの中で使う。その運用とつながりを見ていきます。

      3. 運用とつながり
    • 6:33くりかえし確かめる ― fixity check

      指紋の照合は、一度きりではなく、定期的にくりかえします。これを、fixity・チェックと呼びます。図のように、保存した時に指紋を記録し、その後、折にふれて計算しなおして照合します。早く異常に気づくほど、まだ無事なコピーが残っているうちに、手を打てます。気づくのが遅れると、予備まで失われていた、ということが起こりうるのです。

      くりかえし確かめる ― fixity check
    • 7:04指紋の作り方には、種類がある

      指紋の作り方には、いくつか種類があります。図のように、エムディーファイブ、シャー・ワン、シャー・にごろ、といった方式です。偶発的な破損を見つけるだけなら、手軽なもので足ります。一方、わざと中身をすり替える、改ざんへの対策には、より強いものを選びます。古い方式は、わざとぶつける攻撃に弱いと分かっているからです。目的に応じて選ぶ、と捉えておけば十分です。

      指紋の作り方には、種類がある
    • 7:37保存の枠組みの中での役割

      fixityは、単独で使うというより、保存の枠組みの中で働きます。図のように、長期保存の参照モデルであるOAISは、保存のための情報の一部に、fixityを含めます。転送用パッケージのBagItは、目録に各ファイルの指紋を並べます。そして、保存メタデータのPREMISは、点検の記録を残します。fixityは、こうした保存の土台を、静かに支えているのです。

      保存の枠組みの中での役割
    • 8:11ここまでの整理

      ここまでを整理します。指紋の照合を定期的にくりかえすのが、fixity・チェックでした。指紋の作り方には種類があり、目的に応じて選びます。そして、OAIS、BagIt、PREMIS、といった枠組みの中で、保存の土台を支えるのでした。最後に、人文学の資料を守るうえでの意味を、ひとことで振り返ります。

      ここまでの整理
    • 8:40ここで少し、考えてみよう

      ここで少し、動画を止めて、考えてみてください。あなたが大切にしている、デジタルのファイル。写真や、論文や、データは、十年後も同じものだ、と確かめられるでしょうか。そして、もし予備のコピーが無かったら、壊れてしまったとき、何が起きるでしょうか。指紋と、予備のコピーは、セットで効いてくる、ということが見えてきます。

      ここで少し、考えてみよう
    • 9:09まとめ

      まとめです。fixity、固定性とは、デジタル資料が変わっていないこと、の確認でした。ハッシュでファイルから短い指紋を作り、保存した時と後の指紋を照合します。指紋は違いを知らせるだけなので、予備のコピーと、定期点検で守ります。そして、OAISや、BagItや、PREMISの中で、保存の土台を支えます。変わっていない、と確かめられることが、デジタル資料を長く信頼して使うための、土台になります。

      まとめ
    • 9:47出典・ライセンス

      この動画の出典とライセンスです。スライド、図、ナレーション原稿は、シーシー・バイ、四点ゼロで公開します。出典を示していただければ、自由に再利用いただけます。事実確認には、デジタル保存ハンドブックや、エヌディーエスエーの手引き、BagItの仕様を参照しましたが、翻案はせず、図はすべて新規に描いています。掛け合い版の音声と立ち絵は、それぞれの規約に従います。

      出典・ライセンス
    • 10:20ご清聴ありがとうございました

      ご清聴ありがとうございました。

      ご清聴ありがとうございました