Jak sprawdzić i wyeliminować duplicate content?
8 min
8 min
Na skróty
Duplicate content, czyli zduplikowane treści to nic innego, jak powielony content w obrębie jednej domeny (tzw. internal DC, czyli wewnętrzna duplikacja) lub kilku domen (external DC – duplikacja zewnętrzna). Co istotne, nie dotyczy to wyłącznie przypadków stuprocentowego podobieństwa w treści, ale i tych, w których spore fragmenty tekstu są do siebie po prostu bardzo podobne. Jak tego typu problem może wpłynąć na pozycjonowanie witryny? Jak sprawdzić, czy na naszej stronie znajdują się powielane treści i co możemy z tym zrobić?
Kiedy w 2011 roku pojawił się algorytm Google Panda, zaczęto przywiązywać większą wagę do jakości treści znajdujących się na stronach www. Content stał się jednym z istotniejszych czynników rankingowych i konieczne było znalezienie rozwiązania, jak pozbyć się skopiowanych tekstów. Warto jednak pamiętać, że duplicate content nie ma jednego źródła, dlatego usunięcie go nie zawsze jest równie łatwe.
Zdj 1. Definicja duplicate content.
Źródło: Wikipedia.
Zdarza się, że duplicate content pojawia się w wyniku publikowania tych samych tekstów na różnych stronach należących do jednej firmy. Jak to możliwe? Dochodzi do tego w sytuacji, gdy poza główną witryną wykorzystywane są też np. witryny zapleczowe. Nawet jeśli treści nie są skopiowane od początku do końca, a jedynie bardzo do siebie podobne, Google może to uznać za duplicate content. Wówczas kara zostaje nałożona na jedną lub kilka stron.
Żeby przygotować wysokiej jakości teksty, trzeba mieć odpowiednią wiedzę i umiejętności. Często wymaga to też rzetelnego researchu i poświęcenia sporej ilości czasu na pisanie. Jednak niektóre osoby o tym zapominają i wolą wybrać drogę na skróty. Kradzież treści to powszechny problem, którego dopuszczają się nie tylko właściciele stron internetowych, ale też sami copywriterzy czy content writerzy. Warto więc dobrze weryfikować to, komu powierza się stworzenie tekstów i pamiętać, że szukanie oszczędności w tej kwestii nie jest najlepszym rozwiązaniem.
Osoby zajmujące się sprzedażą online często oferują swoje produkty na kilku platformach, a więc nie tylko we własnym sklepie, ale i np. Allegro. Nie wszyscy pamiętają o tym, że najlepszym rozwiązaniem jest przygotowanie kilku wersji opisu tego samego produktu. Opublikowanie tej samej treści na kilku platformach e-commerce to duplicate content, który zostanie prawdopodobnie wykryty bardzo szybko. Problemem w tym przypadku jest też kopiowanie opisów bezpośrednio ze strony producenta.
Zobacz: Komenda “site” w Google – kiedy się przydaje?
Wykorzystywanie tekstów synonimizowanych to przykład techniki z zakresu Black Hat SEO. Tworząc tego typu treści, stosuje się możliwie jak najwięcej synonimów wyrazów, a następnie całość wkleja do specjalnego narzędzia. W ten sposób można uzyskać minimum kilka wersji tekstu z wybranymi słowami kluczowymi. Bardzo często zdarza się, że uzyskana treść jest niskiej jakości, dlatego umieszcza się ją głównie na zapleczach.
Publikowanie informacji prasowych czy artykułów sponsorskich przekazanych przez partnerów nie jest złą praktyką, ale trzeba robić to umiejętnie. Umieszczenie w kilku miejscach tej samej treści to duplicate content. Aby do tego nie dopuścić, należy unikać rozpowszechniania tekstów dokładnie w takiej formie, w jakiej znalazły się na stronie danego partnera. Z tego powodu coraz bardziej popularnym rozwiązaniem staje się przygotowywanie komunikatów w dwóch wersjach: na główną witrynę oraz na strony zewnętrzne.
Konsekwencje, jakie grożą za duplicate content, to złożony temat. Skopiowana treść sama w sobie zwykle nie jest źródłem bardzo poważnych konsekwencji dla witryny. Niemniej jednak wpływa ona na pozycję, jaką strona zajmuje w wyszukiwarce. Jak podkreśla John Mueller z Google, nagradzane są głównie te witryny, na których pojawiają się merytoryczne, unikalne i wysokiej jakości teksty z wartościowymi frazami kluczowymi. Powielanie treści nie jest traktowane jako podstawa do podjęcia działań przeciwko stronie, chyba że ma to na celu manipulowanie wynikami wyszukiwania. Czym więc grozi duplicate content?
Jednym z głównych problemów, jakie duplicate content tworzy dla wyszukiwarek, jest trudność w określeniu, które z witryn uwzględnić w swoich indeksach, a jakie wykluczyć. Sprawa nie jest bardzo skomplikowana, jeżeli zduplikowana jest cała witryna. Jednak nieco inaczej jest w sytuacji, gdy na stronie pojawiają się oryginalne elementy jak np. stopka. W 2017 roku J. Mueller wyjaśniał, że wówczas wszystkie witryny są indeksowane. W momencie generowania wyników wyszukiwania wybierana jest zwykle tylko jedna strona, gdyż nie ma sensu pokazywania użytkownikowi wszystkich, na których znajduje się ta sama treść. Duplicate content powoduje również, że wyszukiwarki nie do końca wiedzą, w jaki sposób analizować anchor teksty oraz inne tego typu czynniki.
Zobacz: Jak stworzyć i pozycjonować e-book, który pomoże Ci w e-commerce?
Właściciel strony, na której znajduje się zduplikowana treść, zauważa przede wszystkim spadek pozycji w wyszukiwarce. To powoduje, że witryna jest rzadziej odwiedzana przez użytkowników i zwiększenie sprzedaży oferowanych produktów czy zainteresowania usługami staje się utrudnione. Bardzo rzadko zdarza się, że strona zostaje całkowicie usunięta z indeksu Google i w ogóle przestaje pojawiać się w wyszukiwarce, choć nie jest to niemożliwe. Jak już zostało wspomniane, dochodzi do tego, jeśli Google stwierdzi zamiar manipulowania wynikami wyszukiwania. Uwzględnia się przy tym różne kwestie,w tym publikowanie wielu skopiowanych treści z bardziej znanych witryn oraz celowe tworzenie domen z dużą ilością powielonych tekstów.
Odpowiadając możliwie najkrócej – zazwyczaj wpływa negatywnie dlaczego? Google w indeksowaniu i widoczności premiuje te witryny, które do swojego contentu podchodzą z należytą uważnością – udostępniają wartościowe, unikalne, wysokiej jakości treści, które są atrakcyjne dla użytkownika i przyciągają jego uwagę. W związku z tym, gdy ktoś dopuści się np. kopiowania tekstów na stronę, Google zauważy to oraz uzna za nieuczciwą praktykę, zablokuje dostęp do powielonego contentu, a to z kolei przełoży się na niższą pozycję witryny w wynikach wyszukiwania, a w efekcie mniejszy ruch i niższą konwersję. Strategia SEO może zostać zniweczona nie tylko w przypadku celowych działań, czasem wynikają one wyłącznie z niewiedzy czy nieostrożności – jak choćby w przypadku powielonych opisów produktów lub kategorii w sklepie internetowym czy też udostępnianie tej samej oferty pod różnymi adresami URL. Na szczęście nawet wtedy, gdy nie do końca jesteśmy przekonani, czy nasza witryna zawiera wyłącznie oryginalne teksty, mamy możliwość skorzystania z prostej weryfikacji.
Możliwości sprawdzenia potencjalnego duplicate content jest kilka, możemy np.:
Warto również wspomnieć. iż użytkownicy często sięgają po: Screaming Frog (w wersji rozszerzonej pozwala nie tylko wykryć ewentualne kopiowane fragmenty, ale i powielane meta tagi, nagłówki itp.), Siteliner (szybkie i wygodne rozwiązanie online z precyzyjnymi raportami) Copyscape i Copywritely (narzędzia antyplagiatowe, które świetnie wspierają przygotowywanie unikalnych, wysokiej jakości tekstów na stronę).
Zobacz: Strategia pozycjonowania sklepu, która trafi do Twoich klientów
Nierzadko jest tak, że właściciele stron www nie tworzą celowo duplikatów treści. Czasami nawet nie zdają sobie sprawy z tego, że duplicate content znajduje się na ich witrynach. Warto to przeanalizować przy użyciu specjalnych narzędzi, zwłaszcza gdy pomimo podjętych działań strona nie zajmuje wysokiej pozycji w wyszukiwarce. Do sprawdzenia duplikatów można wykorzystać np.: Copyscape, Siteliner, Duplichecker, Plagspotter czy Screaming Frog.
Zdj 2. Weryfikacja duplicate content w Copyscape.
Źródło: Copyscape.
Inną metodą jest skopiowanie fragmentu tekstu ze swojej strony i wklejenie go w wyszukiwarkę. To pozwala na sprawdzenie, czy Google znajduje treść w innych witrynach w swoim indeksie. Może się zdarzyć, że dzięki temu niespodziewanie odkryjesz kradzież treści z własnej strony. Sposobów na pozbycie się powielonych treści jest sporo, a wybór odpowiednich zależy w dużej mierze od źródła powstania problemu.
Jedną z lepszych metod na pozbycie się duplikatów treści jest często skonfigurowanie przekierowań 301. Mają one prowadzić ze strony zduplikowanej (tzw. pobocznej) do tej z oryginalnymi tekstami. Najłatwiej jest stworzyć odpowiedni kod w pliku .htaccess, choćby w przypadku serwera Apache. Jeżeli jest to serwer IIS, przekierowania można zrobić za pomocą administracyjnej konsoli. Dzięki temu na właściwą stronę zostaną przekierowani zarówno użytkownicy, jak i roboty Google czy inne.
Jak radzi Google, umieszczanie tej samej treści na wszystkich podstronach, dotyczącej np. praw autorskich, nie jest najlepszym rozwiązaniem. W przewodniku po wyszukiwarce dla deweloperów można przeczytać, że lepszą metodą jest stworzenie krótkiego podsumowania i dodanie linka prowadzącego do bardziej szczegółowych informacji. To pozwala uniknąć schematów i zbędnych powtórzeń.
Google zaleca także, aby unikać stosowania wersji tymczasowych witryny (w miarę możliwości). Nie warto publikować stron, do których nie opracowano jeszcze żadnej treści, bo wtedy użytkownicy niczego nie zobaczą. Jeśli stworzenie tymczasowej wersji jest nieuniknione, dobrym pomysłem jest wykorzystanie tagu ‘noindex’, aby zapobiec jej wyświetlaniu w wyszukiwarce.
Zobacz: Największe aktualizacje algorytmów, które zmieniły oblicze współczesnego SEO
Linki kanoniczne (rel=canonical) stosuje się w podobnym celu co przekierowania 301. Jednak w tym przypadku dla użytkowników dostępne są wszystkie podstrony, ale tylko te wskazane są indeksowane przez Google. Za pomocą atrybutu rel=canonical możliwe jest ustalenie głównej wersji adresu URL i zasugerowanie wyszukiwarkom, że te podobne są tylko kopią. Używanie linków kanonicznych to popularne rozwiązanie problemu wewnętrznego duplikatu treści.
Zdj 3. Plusy i minusy zastosowania linków kanonicznych.
Źródło: Blog Google.
W walce z duplicate content istotną rolę odgrywają również umiejętności pisarskie. Google stawia przede wszystkim na jakość publikowanych na stronach treści i nie można o tym zapomnieć. Jeżeli samodzielne przygotowanie tekstów jest dla Ciebie zbyt dużym wyzwaniem, zaufaj profesjonalnej agencji zatrudniającej copywriterów.
Jeśli jesteś właścicielem kilku podobnych stron, warto przemyśleć połączenie ich w jedną lub rozbudowanie każdej, aby treść była unikatowa. Należy zwrócić też uwagę na problem kanibalizmu słów kluczowych. Tak naprawdę prędzej czy później pojawi się on na wszystkich witrynach, na których na bieżąco publikowane są posty o podobnej tematyce. Gdy zaczną powtarzać się nagłówki, śródtytuły i frazy kluczowe, dojdzie do spadku pozycji strony. Aby nie doszło do kanibalizacji słów kluczowych, trzeba ograniczyć lub nawet zrezygnować ze stosowania jednakowych fraz na podstronach. Należy też rozważyć zoptymalizowanie każdej z uwzględnieniem innego zestawu słów kluczowych. Czasami pomocne jest ponadto wykorzystanie przekierowań 301 lub linków kanonicznych.
Żeby uniknąć duplikacji treści i związanych z tym zagrożeń, dobrze przemyśl strukturę swojej strony www. Pamiętaj również o tym, aby publikować unikalne i dopracowane teksty. Gdy wykryjesz kradzież treści, nie wahaj się i podejmij odpowiednie kroki. Możesz skontaktować się z właścicielem witryny, a następnie poprosić o usunięcie duplikatu lub o dodanie linku kanonicznego do Twojej strony, która w kwestii contentu jest oryginałem. Innym rozwiązaniem jest wysłanie do Google żądania usunięcia z wyników wyszukiwania witryny ze skopiowaną treścią ze względu na naruszanie praw autorskich.
Łatwo dostrzec, że powielony content może znacząco obniżyć wartość witryny i jej skuteczność, dlatego, zamiast radzić sobie z problemem, który już zaistniał, warto działać prewencyjnie. W tym celu:
przed publikacją dokładnie sprawdzaj ich oryginalność i zgodność z wytycznymi Google. Zwracaj szczególną uwagę na te podstrony, w których pojawia się tendencja do powtórzeń – jak opisy podobnych produktów czy usług.
jeśli pisząc, zauważasz jakąkolwiek manierę, skłonność do powtórzeń, zwalczaj ją (korzystaj ze słownika synonimów, szukaj alternatyw), zrezygnuj z nawyku umieszczania powtarzalnych formułek etc.
za każdym razem, gdy zmienisz strukturę swojej strony internetowej, użyj przekierowań, aby Googleboty i użytkownicy trafili na nową, właściwą wersję.
konkretnie spójność ich struktury według wytycznych (np. od kanonicznej wersji https://www.domena.p/ linki winny być adekwatnie budowane poprzez odnośniki typu: https://www.domena.pl/… a nie np. https://domena.pl/…).
należy mieć na uwadze, że jeśli np. Twoja oferta (sformułowana w taki sam sposób) pojawi się w kilku serwisach, Google pokaże użytkownikowi tę wersję, która będzie najlepiej dopasowana do formy zapytania, dlatego kontroluj rozpowszechnianie contentu np. poprzez zamieszanie linków do oryginalnej treści lub wykluczanie danej strony poprzez użycie metatagu noindex.
niektóre systemy zarządzania treścią mają tendencję do prezentowania tych samych treści na kilku podstronach, w takim przypadku potrzebna będzie Twoja reakcja.