Czy wiesz, że można otworzyć stare strony internetowe i zobaczyć, jak wyglądały dzisiejsze serwisy kilka lat temu? Nie trzeba do tego zaawansowanych umiejętności technicznych, specjalnego oprogramowania czy płatnych subskrypcji. Wystarczy kilka kroków i pokaźne archiwum stron www dostępnych w sieci otwiera przed Tobą swoje możliwości. Z tekstu dowiesz się, jak korzystać z takiej bazy.
Zdj 1. Czy wiesz, że możesz sprawdzić wiele archiwalnych zdjęć w sieci? I to za darmo!
Czym jest archiwum stron internetowych?
Archiwum stron www to zbiór kopii stron internetowych, przechowywanych w różnych wersjach czasowych w celu zachowania ich zawartości, wyglądu i funkcjonalności. Dzięki temu możesz odtworzyć historyczną wersję strony internetowej, nawet jeśli ta została zmodyfikowana lub usunięta.
Archiwum działa dzięki automatycznym programom (crawlerom), które regularnie zapisują dane stron, takie jak kod HTML, obrazy i inne elementy. Przykładem takiego narzędzia jest Wayback Machine, część projektu non-profit Internet Archive, założonego w 1996 roku
Zarchiwizowane wersje strony to prawdziwy „powrót do przeszłości”. Analiza kopii strony internetowej pełni jednak nie tylko rolę sentymentalnej podróży do lat młodości. Umożliwia dostęp do wielu informacji. Jakich?
Przeglądanie historii stron internetowych – po co się to robi?
Przede wszystkim zarchiwizowane strony internetowe to kopalnia wiedzy na temat SEO. Pozycjonowanie nowej witryny jest łatwiejsze, gdy ma się dostęp do archiwum, bo to może odpowiedzieć na wiele pytań dotyczących wcześniejszego funkcjonowania serwisu, jego dobrych i złych stron, a także charakterystyki działania.
Analiza archiwum ułatwia dokonywanie zmian w strategii optymalizacji, na dłuższą i krótszą metę. Znacznie wpływa także na SXO. Można dokładnie skontrolować jakie elementy strony były przydatne dla potencjalnych klientów, a jakie kompletnie się nie sprawdziły.
Oczywiście, poza SEO stare strony internetowe można wykorzystać jako backup, możliwość skorzystania ze starych tekstów i informacji w nich zawartych. Wiele archiwalnych wersji strony ułatwia także analizę tego, w jakim kierunku zmienia się serwis i np. czy grupa odbiorców ewoluowała wraz z rozwojem witryny.
W jaki sposób sprawdzić strony archiwalne?
Do sprawdzenia danej strony www służą specjalne serwisy archiwizujące dane sieciowe. Najpopularniejszym jest powstały w 1996 roku Archiwum Internetu (Internet Archive), który dostępny jest pod adresem web.archive.org. Stroną zarządza amerykańska organizacja pozarządowa non-profit o tej samej nazwie. Jako ciekawostkę dodajmy, że ta strona www zgromadziła ponad 80 petabajtów danych.
Internet Archive zajmuje się zbieraniem różnego rodzaju danych dostępnych w sieci. To m.in.:
-
strony internetowe różnego typu (aktualnie to prawie 590 miliardów witryn)
-
książki i czasopisma w formie elektronicznej
-
nagrania wideo i audio
-
filmy oraz programy telewizyjne.
Organizacja dba o wysoką jakość gromadzonego przez siebie contentu. Korzystanie z bazy stron internetowych (dostępna od 2001 roku) jest bezpłatne i nie wymaga logowania.
-
Wejdź na stronę https://web.archive.org/
-
Wpisz adres strony internetowej, którą chcesz przeanalizować
-
Pojawi Ci się zakres dat, w których robiony był backup informacji. Wybierz jedną z nich
-
Wyświetli Ci się stan serwisu na dany moment. Może to być screen lub część funkcjonalna witryny.
Dzięki Internet Archive możliwe jest odtworzenie wielu informacji na temat danego serwisu. Czy wszystkie stare strony internetowe dostępne są więc w tym archiwum?
Zdj 2. Tak wygląda baza Internet Archive – największa tego typu biblioteka archiwalnych witryn w sieci
Źródło: Internet Archive.
Czy można sprawdzić wszystkie, stare strony internetowe?
Bazy z archiwalnymi wersjami stron internetowych są naprawdę rozbudowane, ale nie oznacza to, że znajduje się na nich każda witryna. Wynika to m.in. z polityki prywatności, charakterystyki budowy danej witryny czy możliwości archiwizacji bazy web archive.
Pamiętaj również, że nie jest tak, że publiczna baza robi np. kopię każdej strony co godzinę. To organizacja decyduje jakie treści witryny zachowa i w jakich odstępach czasu to będzie. Istnieją strony, które archiwizowane są raz na miesiąc, a inne raz na rok. Niektórych witryn w bazie natomiast nie znajdziesz.
Nie warto więc traktować bazy web.archive.org jako element podstawowy wykonywania kopii zapasowych. Te powinny być robione codziennie, bezpośrednio z Twojego hostingu. Tylko to zapewni Ci pełen dostęp do plików, np. w przypadku ich przypadkowego usunięcia lub zainfekowania.
W każdym innym przypadku, gdy potrzebujesz sprawdzić na szybko archiwalną wersję strony lub sprawdzić, jak rozwijała się konkurencja, baza Internet Archive będzie idealnym rozwiązaniem. Warto z niej korzystać.