memorandums

日々のメモです。

消滅したWebページを復元する方法

以前からこの日記を見ていただいている人にはわかると思いますが、今年のG.W.に自分でヘマをやってしまい、サーバーのハードディスクをクラッシュさせてしまいました。

2年間かけて作ってきた講義資料(Web版)はすべて消滅してしまいました。

バックアップの大切さを改めて実感しました。
講義資料の多くはオリジナルの電子文書があったので、それほどショックではありませんでしたが、HTMLしかない講義ページは復旧のしようがありませんでした。


あれから3ヶ月。


今日、ふと思い立って、小学生向けのプログラミングコンテンツを準備してみようと思いました。

題材はCodeRallyです。

昨年、大学生向けに作った演習ページがあったので、使えるな。。。と思ったら、上記の理由で消滅していました。ぐぅああぁぁ。。。

そこで、Internetで過去のページをアーカイブしているサイトがあったこと思い出し、http://www.archive.org/ にアクセスして探してみました。

結果は、該当ページなし。

基本に戻って、(既にURLすら忘れていたので)自分の消滅してしまったページをGoogleで検索してみました。

「CodeRally 演習」で検索しました。

なんと!?2番目に出てきました。もう無いページだというのに。

リンクを押してももちろん「Not Found」です。

そこで、Googleのキャッシュをクリックしてみました。右図ですね。

そうしたら。。。なんと消滅したはずのページがよみがえってきました!!!

ついでに、消滅してしまった各回の演習ページのURLをGoogleで再度検索して、キャッシュをクリックすると、次から次へとページがよみがえります。

当然かもしれませんが、Googleクロールのキャッシュが結果的には巨大なインターネット・アーカイブになっていることに気づかされました。

直接リンクすることはできませんが、Googleで検索した結果のキャッシュ同士をつなぐことで、http://www.archive.org/と同等のサービスを提供することができることになります。


◆補足

ただ、私の場合、URLが新旧で変わったので、古いページのキャッシュが残されていたと考えられます。もし、同一のURLで消滅後に作成した新しいページがGoogleにクロールされてしまうと、キャッシュも上書きされてしまうので、消滅したWebページを復元することはできないでしょう。