Wayback Machine ― Internet Archive 25周年記念連載(第2回)


Internet Archiveという組織をご存知でしょうか? 知らないという方でもWayback Machineという「消えてしまったWebページを保存しているサイト」を知っている人は多いのではないでしょうか。このInternet Archiveが、今年10月29日に25周年を迎えます。そしてボイジャーも今年の10月26日から創立30年目に入ります。それを記念して、ボイジャーとInternet Archiveをテーマとした短期集中連載(全5回)をお送りします。

全世界のWebページを、時間軸にそって記録する

 Wayback Machine。自分で使ったことはなくても、消えてしまったWebページの「魚拓」として見たことがある人は多いでしょう。このWayback Machineは、Internet Archiveによって提供されています。むしろ多くの人にとって「Internet Archive=Wayback Machine」という認識かもしれません。

Wayback Machine

ここにURLを入力すれば、すでに姿を消してしまったWebページも見ることができる(できないこともある)。

その集められた膨大なページ

 前回、書いたように、Internet Archiveの創始者ブルースター・ケールの掲げた目標は「全知識体系への全世界的アクセス(Universal Access to all Knowledge)」でした。そのとおり、集められたWebページの数は膨大です。

その数は、2021年10月時点で、

  • Webページ:5,880億
  • 本とテキスト:2,800万
  • 音声:1,400万
  • 動画:600万
  • 画像:350万
  • ソフトウェア・プログラム:58万

という数に及びます。

消え去るもの、残るもの

 デジタルデータはいくらでも無劣化の複製ができるので、紙よりもずっと「残す」ことが容易です。にもかかわらず紙に比べると消え去ってしまうもののなんと多いことか!

 Webページは公開後にも改訂が容易にできることもあり、また必ずしも後世に残すことを目的にしていない場合もあります。むしろ論文などを除けば、後世に残そうという目的をもったWebページのほうが少ないかもしれません。

 Weyback MachineによるWebページのアーカイブは必ずしも完全ではありません。会員制のサイトや、CGIなどで動的に生成されるページはそもそもアーカイブすることはできません。ですが、それによって知を後世に残すというInternet Archiveの活動が色褪せることもありません。この「後世に残す」という目的はボイジャーとも共通した思いです。

»「第3回 Open Library」に続く

10月22日(金)日本時間朝10時より、From Wayback to Way Forward: The Internet Archive turns 25というバーチャルイベントが開催されます。