Metody sprawdzania statusu indeksowania dużych stron internetowych
4 min
4 min
Na skróty
Zanim Twoja witryna zacznie pojawiać się w wynikach wyszukiwania Google — musi zostać najpierw zaindeksowana przez roboty wyszukiwarki. Przedstawiamy, jak w prosty sposób sprawdzić, czy proces ten przebiegł pomyślnie — i czy Googleboty wystarczająco często wracają na Twoją stronę w poszukiwaniu nowych treści. Zapraszamy do lektury.
Na początek, krótkie przypomnienie, jak Google indeksuje strony internetowe.
Każda wyszukiwarka — nie tylko ta od amerykańskiego giganta — działa na podobnej zasadzie. Po pierwsze, nieustannie przeszukuje zasoby internetu w poszukiwaniu nowych informacji — tym zajmują się tzw. crawlery (w przypadku Google są to Googleboty). Następnie — roboty wyszukiwarki analizują zawartość napotkanych stron internetowych; starają się zrozumieć jej treść, ocenić pod kątem bezpieczeństwa oraz przydatności dla użytkownika i — wreszcie — wpisują ją do indeksu. I to właśnie na podstawie zebranych w indeksie informacji Google dopasowuje strony do zapytań oraz intencji użytkowników.
W skrócie — korzystając z Google nie przeszukujemy bezpośrednio zasobów internetu, a zawartość rozsianych po całym świecie baz danych — indeksów.
Jak wspomnieliśmy — roboty Google pracują nad indeksowaniem przez cały czas. Nie tylko odwiedzają nowe strony, ale i regularnie wracają do tych starszych — aktualizując ich „wpisy” w indeksie, monitorując zmiany w zawartości i na bieżąco oceniając je pod kątem czynników rankingowych.
Gdyby indeksowanie było tylko jednorazową czynnością, profesjonalne pozycjonowanie stron nie miałoby racji bytu — nie moglibyśmy wpływać na ocenę strony i bylibyśmy „skazani” na to, jakie pierwsze wrażenie na robotach indeksujących wywarła nasza witryna. Na szczęście tak nie jest — i na wpisy stron w indeksie Google wpływać jak najbardziej możemy.
Większość stron trafia do indeksu automatycznie — crawlery dość szybko identyfikują nowe witryny. Problem pojawia się, gdy… zablokujemy im dostęp do naszej strony — albo na drodze staną im komplikacje po stronie serwera DNS czy źle przygotowane URL-e.
Aby upewnić się, że nasza nowa strona została prawidłowo zaindeksowana — lub że roboty Google’a regularnie na nią wracają — możemy skorzystać z dwóch metod.
Pierwsza to po prostu… wpisanie nazwy strony w wyszukiwarce. Jeżeli w wynikach wyszukiwania zobaczymy naszą witrynę — razem z najnowszymi podstronami i poprawnymi meta danymi — wszystko powinno być w porządku.
Polecamy posłużyć się tutaj komendą site:nazwastrony.pl — wtedy Google wyświetli tylko i wyłącznie adresy powiązane z Twoją domeną.
Jednak w przypadku dużych, bardziej rozbudowanych witryn, sprawdzanie indeksacji przez SERP-y będzie trochę… uciążliwe. Na szczęście z pomocą przychodzi panel Google Search Console wraz z raportem Stan indeksowania.
Znajdziemy w nim szczegółowe informacje na temat wszystkich adresów powiązanych z domeną indeksowanych przez roboty Google w ciągu ostatniego roku — ale też i tych, które zostały zablokowane lub usunięte z indeksu.
Zdj 1. Tak mógłby wyglądać raport dla strony, która dopiero jest w trakcie indeksowania.
Źródło: Google Search Central
Oprócz samego raportu warto tu zwrócić uwagę na dwie zakładki:
Zdj 2. Warto starać się, aby roboty Google trafiały na Twoją stronę jak najczęściej — dzięki temu działania SEO przyniosą swoje efekty nieco szybciej.
Źródło: What is Googlebot? — blog Yoast
Oprócz informacji na temat indeksowania samej strony, Google Search Console odpowie także na pytanie, czy:
Zdj 3. W tym przypadku Google miało problem z indeksowaniem znajdującego się na stronie… przepisu kulinarnego (tak, one też mogą być znacznikami schema).
Źródło: Google Search Central
Również w panelu Google Search Console znajdziemy opcję ręcznego zgłoszenia adresów do indeksowania. I znów, mamy tutaj dwie możliwości.
W przypadku pojedynczego adresu URL wystarczy wybrać opcję Poproś o zaindeksowanie (”Request indexing”). Natomiast jeżeli chcemy dodać do indeksu kilkadziesiąt-kilkaset adresów na raz — możemy po prostu dodać do Google Search Console sitemapę naszej witryny, która przeprowadzi Googlebota „krok po kroku” przez wszystkie podstrony.
Oczywiście — mówimy o sytuacji, gdy powodem powolnego indeksowania zasobów naszej strony nie jest blokada nałożona na crawlery w pliku robots.txt czy nadmierna ilość przekierowań, obciążających nasz crawl budget. W takich sytuacjach najpierw należy rozwiązać problem u źródła (Google Search Console powinno wskazać, gdzie ono jest), a dopiero potem — zgłosić stronę do ponownej indeksacji.
Bez prawidłowego indeksowania, nawet najlepsza agencja marketingowa nie będzie w stanie wypozycjonować Twojej witryny na szczyt SERP-ów. Dlatego też warto mieć status indeksowania strony pod kontrolą — i na bieżąco sprawdzać, czy roboty Google regularnie ją odwiedzają.
Zawodowy copywriter oraz student psychologii na Uniwersytecie Warszawskim. W świecie marketingu internetowego równie mocno, co chwytliwe (i wartościowe) treści interesuje go dobry design. Gdy nie zajmuje się tworzeniem contentu, odkrywa perełki kina niezależnego i pracuje nad własnymi opowiadaniami.