Jeśli zastanawiasz się, jak kiedyś wyglądały witryny czołowych firm — jakie były trendy w web designie lub w jaki sposób Twój klient rozwijał swoją markę — odpowiedź znajdziesz dzięki wysiłkom archiwizatorów z Internet Archive. W dzisiejszym wpisie wyjaśnimy, jak działa „archiwum internetu” i jak z niego skorzystać — zapraszamy do lektury!
Czym zajmuje się Internet Archive?
Internet Archive to amerykańska organizacja non-profit, której celem jest — jak to opisali jej twórcy w 1996 roku — archiwizacja jak największej ilości zasobów ludzkiej wiedzy i kultury w formie cyfrowej. I, co ważne, dostępnej dla każdego.
Archiwiści z Internet Archive zajmują się więc nie tylko zasobami internetu (choć to właśnie z tym są kojarzeni), ale także:
- książkami;
- artykułami naukowymi oraz prasowymi;
- nagraniami muzycznymi (włącznie z koncertami na żywo);
- nagraniami filmów, seriali i programów telewizyjnych;
- programami komputerowymi (z reguły już niedostępnymi w ogólnym obiegu).
Zdj 1. Z poziomu strony archive.org mamy dostęp zarówno do bazy setek miliardów stron internetowych, jak i pozostałych zasobów Internet Archive.
Źródło: archive.org
Bazę archive.org może współtworzyć każdy — przesyłając swoje materiały do archiwizacji.
Najbardziej jednak znaną częścią projektu Internet Archive jest Wayback Machine, czyli właściwe „archiwum internetu”.
Wayback Machine — co to?
Wayback Machine to działające od 2001 roku narzędzie umożliwiające dostęp do największej na świecie bazy archiwalnych wersji stron internetowych. Także i tych, które przeszły wielokrotne edycje lub, najzwyczajniej w świecie, zostały już dawno zamknięte. Obecnie w bazie Wayback Machine znajdziemy prawie… 900 miliardów witryn — dostępnych w stu procentach za darmo i bez konieczności logowania.
„Archiwum internetu” od początku swojego istnienia korzysta z pomocy crawlerów — robotów internetowych, które stale przeszukują sieć w poszukiwaniu niezarchiwizowanych witryn i… po prostu je zapisują. I to w wielu wersjach — dlatego też, jeżeli wpiszemy w wyszukiwarce Wayback Machine adres jakiejkolwiek popularnej (albo i nie) witryny, będziemy mogli sprawdzić, jak ona wyglądała przed rokiem… i przed dekadą.
Zdj 2. Właśnie tak wyglądała strona główna Allegro — niemal 20 lat temu.
Źródło: archive.org
Częstotliwość wykonywania snapshotów (zapisów aktualnej wersji strony) zależy oczywiście od witryny — jednak w większości przypadków Wayback Machine z powodzeniem pozwala prześledzić, jak zmieniał się wygląd i treść danej strony na przestrzeni lat.
Jeżeli chodzi o ograniczenia Wayback Machine — niektóre informacje nie znalazły się w bazie archiwum ze względu na brak zgody ze strony ich wydawcy; nie są to jednak zbyt liczne przypadki. Bardzo często za to zdarza się, że wyszukiwana strona jest niekompletna — brakuje na niej np. części grafik (jak widać na zdjęciu powyżej) lub elementów stylów CSS. Spowodowane jest to tym, że crawlery Wayback Machine archiwizują bezpośrednio jedynie kod HTML strony, zaś pozostałe elementy — pobierają ze stron źródłowych. W przypadku starszych wersji witryn bywa to po prostu niemożliwe.
Ale to wszystko nie zmienia faktu, że do „archiwum internetu” zdecydowanie warto zajrzeć: czy to z ciekawości, czy podczas pracy nad SXO strony. Jest to projekt absolutnie unikalny w skali całego internetu — polecamy przekonać się o tym samemu.
Jak skorzystać z „archiwum internetu”?
Jeśli chcesz sprawdzić, jak przed kilkunastoma laty wyglądała interesująca Cię strona — nie ma nic prostszego. Wystarczy:
- wejść na stronę web.archive.org;
- wpisać adres URL strony w polu wyszukiwania — lub słowo kluczowe, powiązane z nazwą witryny;
- nacisnąć Enter — i poczekać; przetworzenie zapytania może zająć kilka dłuższych chwil.
Jeżeli dana strona została zarchiwizowana, Wayback Machine wyświetli oś czasu (od 1996 roku aż do dziś) oraz kalendarz z zaznaczonymi datami, w których wykonano snapshot aktualnej w danym momencie wersji witryny. Należy wybrać odpowiednią datę — a potem dokładną godzinę wykonania snapshota — by już po chwili na ekranie wyświetliła się oryginalna wersja strony.
Zdj 3. Nawet w zamierzchłych czasach polskiego internetu Wayback Machine z dość sporą regularnością archiwizował często odwiedzane witryny.
W zależności od tego, jak dobrze zachowana jest dana wersja witryny, będziemy mogli nie tylko sprawdzić, jak wyglądała jej strona główna — ale także zajrzeć na jej podstrony.
Czy „archiwum internetu” może przydać się w działaniach marketingowych?
Dla niektórych projekty Internet Archive mogą wydawać się tylko ciekawostką — ale okazuje się, że znajdują one swoje zastosowanie także i w świecie marketingu. Wayback Machine można wykorzystać np. prowadząc audyt SEO — do analizy poprzednich wersji witryny pod kątem rozwiązań user experience czy weryfikacji starych przekierowań i struktury linkowania.