Archiwum internetu — jak sprawdzić?
3 min
3 min
Na skróty
Jeśli zastanawiasz się, jak kiedyś wyglądały witryny czołowych firm — jakie były trendy w web designie lub w jaki sposób Twój klient rozwijał swoją markę — odpowiedź znajdziesz dzięki wysiłkom archiwizatorów z Internet Archive. W dzisiejszym wpisie wyjaśnimy, jak działa „archiwum internetu” i jak z niego skorzystać — zapraszamy do lektury!
Internet Archive to amerykańska organizacja non-profit, której celem jest — jak to opisali jej twórcy w 1996 roku — archiwizacja jak największej ilości zasobów ludzkiej wiedzy i kultury w formie cyfrowej. I, co ważne, dostępnej dla każdego.
Archiwiści z Internet Archive zajmują się więc nie tylko zasobami internetu (choć to właśnie z tym są kojarzeni), ale także:
Zdj 1. Z poziomu strony archive.org mamy dostęp zarówno do bazy setek miliardów stron internetowych, jak i pozostałych zasobów Internet Archive.
Źródło: archive.org
Bazę archive.org może współtworzyć każdy — przesyłając swoje materiały do archiwizacji.
Najbardziej jednak znaną częścią projektu Internet Archive jest Wayback Machine, czyli właściwe „archiwum internetu”.
Wayback Machine to działające od 2001 roku narzędzie umożliwiające dostęp do największej na świecie bazy archiwalnych wersji stron internetowych. Także i tych, które przeszły wielokrotne edycje lub, najzwyczajniej w świecie, zostały już dawno zamknięte. Obecnie w bazie Wayback Machine znajdziemy prawie… 900 miliardów witryn — dostępnych w stu procentach za darmo i bez konieczności logowania.
„Archiwum internetu” od początku swojego istnienia korzysta z pomocy crawlerów — robotów internetowych, które stale przeszukują sieć w poszukiwaniu niezarchiwizowanych witryn i… po prostu je zapisują. I to w wielu wersjach — dlatego też, jeżeli wpiszemy w wyszukiwarce Wayback Machine adres jakiejkolwiek popularnej (albo i nie) witryny, będziemy mogli sprawdzić, jak ona wyglądała przed rokiem… i przed dekadą.
Zdj 2. Właśnie tak wyglądała strona główna Allegro — niemal 20 lat temu.
Źródło: archive.org
Częstotliwość wykonywania snapshotów (zapisów aktualnej wersji strony) zależy oczywiście od witryny — jednak w większości przypadków Wayback Machine z powodzeniem pozwala prześledzić, jak zmieniał się wygląd i treść danej strony na przestrzeni lat.
Jeżeli chodzi o ograniczenia Wayback Machine — niektóre informacje nie znalazły się w bazie archiwum ze względu na brak zgody ze strony ich wydawcy; nie są to jednak zbyt liczne przypadki. Bardzo często za to zdarza się, że wyszukiwana strona jest niekompletna — brakuje na niej np. części grafik (jak widać na zdjęciu powyżej) lub elementów stylów CSS. Spowodowane jest to tym, że crawlery Wayback Machine archiwizują bezpośrednio jedynie kod HTML strony, zaś pozostałe elementy — pobierają ze stron źródłowych. W przypadku starszych wersji witryn bywa to po prostu niemożliwe.
Ale to wszystko nie zmienia faktu, że do „archiwum internetu” zdecydowanie warto zajrzeć: czy to z ciekawości, czy podczas pracy nad SXO strony. Jest to projekt absolutnie unikalny w skali całego internetu — polecamy przekonać się o tym samemu.
Jeśli chcesz sprawdzić, jak przed kilkunastoma laty wyglądała interesująca Cię strona — nie ma nic prostszego. Wystarczy:
Jeżeli dana strona została zarchiwizowana, Wayback Machine wyświetli oś czasu (od 1996 roku aż do dziś) oraz kalendarz z zaznaczonymi datami, w których wykonano snapshot aktualnej w danym momencie wersji witryny. Należy wybrać odpowiednią datę — a potem dokładną godzinę wykonania snapshota — by już po chwili na ekranie wyświetliła się oryginalna wersja strony.
Zdj 3. Nawet w zamierzchłych czasach polskiego internetu Wayback Machine z dość sporą regularnością archiwizował często odwiedzane witryny.
W zależności od tego, jak dobrze zachowana jest dana wersja witryny, będziemy mogli nie tylko sprawdzić, jak wyglądała jej strona główna — ale także zajrzeć na jej podstrony.
Dla niektórych projekty Internet Archive mogą wydawać się tylko ciekawostką — ale okazuje się, że znajdują one swoje zastosowanie także i w świecie marketingu. Wayback Machine można wykorzystać np. prowadząc audyt SEO — do analizy poprzednich wersji witryny pod kątem rozwiązań user experience czy weryfikacji starych przekierowań i struktury linkowania.
Zawodowy copywriter oraz student psychologii na Uniwersytecie Warszawskim. W świecie marketingu internetowego równie mocno, co chwytliwe (i wartościowe) treści interesuje go dobry design. Gdy nie zajmuje się tworzeniem contentu, odkrywa perełki kina niezależnego i pracuje nad własnymi opowiadaniami.