Co to jest duplicate content?

duplikacja treści

Zapewne nie raz spotkaliście się z określeniem „duplikacja” lub „dubel” w kontekście treści zawartych na stronach internetowych, ale czy wiecie, co ono właściwie oznacza? Poniżej postaramy się przybliżyć wam to zagadnienie i uczulić na zagrożenia z nim związane.

Dlaczego duplikacja jest szkodliwa?

Duplicate content to po prostu występowanie tych samych treści na wielu podstronach jednej witryny (wewnętrzny - na naszej stronie) lub na wielu domenach (zewnętrzny - na stronach kopiujących od nas). Bardzo często wynika to z nieuwagi, lub nieświadomości administratorów i nie służy promocji ich marki. Algorytmy nie znoszą kopii, ponieważ każda kopia to poważny uszczerbek na jakości treści i potencjalne utrudnienie w indeksowaniu podstron. Znacznie trudniejsza okazuje się wówczas ich interpretacja, dlatego zostają poddane selekcji na zasadzie wykluczania klonów, traktowanych jako identyczne strony z powodu wykrycia tych samych fraz kluczowych. Od roku 2011, tzn. odkąd Google wprowadziło algorytm o nazwie Panda, powielanie treści spotyka się z surowymi sankcjami. Właściciele stron mogą napotkać problemy z utratą ruchu i redukcją widoczności, a co za tym idzie znacznym obniżeniem pozycji witryny w wynikach wyszukiwania. Ponadto, jeżeli naszej treści brakuje oryginalności, możemy mieć problem z dotarciem do nowych odbiorców.

Kopie wewnętrzne (w ramach jednej domeny)

W przypadku powielenia zawartości np. strony głównej na innych adresach nie musimy koniecznie przepisywać wszystkiego od nowa i edytować każdego akapitu z osobna. Czasami wystarczy jedynie dokonać odpowiednie przekierowania 301 w pliku .htaccess, by nie wytracić po drodze mocy pozycjonerskiej. Są to przekierowania stałe, dzięki którym serwer naszej strony informuje przeglądarkę o konieczności przejścia pod inny adres URL. Można również posłużyć się popularnym metatagiem „rel=canonical”, umieszczanym w nagłówku dokumentu HTML. Jest on odpowiedzialny za informowanie wyszukiwarki o tym, który adres URL jest oryginalny (kanoniczny), a który jest jego duplikatem. Kolejnym sposobem jest wykorzystanie komendy Disallow: w pliku robots.txt, który decyduje o tym, które treści na stronie mają być odczytywane przez roboty wyszukiwarek i uwzględniane w indeksie Google. Komenda ta odpowiedzialna jest za blokowanie dostępu robotów do wybranych katalogów.

Wewnętrzny duplicate content występuje również w przypadku dwóch wersji strony (np. z www i bez www, a także wersji przeznaczonych do druku albo do wyświetlania na urządzeniach mobilnych), kiedy nie ma pomiędzy nimi odpowiednich przekierowań 301, które należy jak najszybciej uzupełnić. Tak samo dzieje się po dokonaniu transferu domeny, kiedy fakt ten nie zostanie zgłoszony do Google. Podobnie sprawy się mają, gdy mamy do czynienia z różnymi wersjami językowymi, gdzie pomoże nam dopasowanie geograficzne za pomocą atrybutu hreflang w nagłówku HTML danej strony.

Kopie zewnętrzne (w ramach wielu domen)

W przypadku wykrycia kopii naszych treści na zewnętrznym serwisie mamy do czynienia z plagiatem, który narusza prawo autorskie. Należy wówczas skontaktować się z administratorem strony i poprosić o ich zmianę lub usunięcie w wyznaczonym terminie. Powielanie treści może jednak występować w postaci legalnej i świadomej, jako tzw. syndykowanie, czyli gromadzenie i udostępnianie ich przez większe serwisy do przedruku. Warunki takiej współpracy muszą być ściśle określone w umowie i zazwyczaj zastrzegają konieczność podania źródła wykorzystanych informacji w postaci np. linku. W przeciwnym wypadku byłoby to działanie nieetyczne z kategorii Black Hat SEO, czego idealnym przykładem są tzw. splogi (spamerskie rodzaje blogów), na które Google najczęściej nakłada karne filtry.

Szczególnym problemem okazują się w tym przypadku sklepy internetowe, których właściciele kopiują opisy produktów bezpośrednio ze stron producentów lub innych dystrybutorów, przez co zupełnie się one nie wyróżniają na tle konkurencji. Podobnie jest wówczas, gdy dany produkt występuje w kilku wariantach rozmiaru lub barwy przy reszcie parametrów niezmienionych. Jeżeli dane producentów powielają się na wielu stronach, należy rozszerzyć ofertę o nowe treści. W tym przypadku niezbędnym będzie stworzenie unikalnych i wartościowych z punktu widzenia odbiorcy kart produktów zawierających szczegółowe opisy, które zainteresują i zaangażują potencjalnych Klientów do dokonania konwersji, a przy tym wzbogacą naszą stronę i uratują przed następstwami kradzieży własności intelektualnej.

W jaki sposób wykryć duplikację?

Najlepszym sposobem ku temu będzie przeprowadzenie całościowego audytu SEO, który przeanalizuje stronę i zdiagnozuje potencjalne zagrożenia oraz wykryje nieprawidłowości w jej funkcjonowaniu. W ten sposób zyskamy wytyczne do naprawy poszczególnych elementów i ułatwimy przyszłą pracę algorytmom wyszukiwarek.

Jeżeli jednak nie zamierzamy decydować się na tak zaawansowane kroki, pozostaje nam skorzystać z jednego z darmowych narzędzi, dostępnych w internecie. Możemy w tym segmencie wyróżnić między innymi:

  • Google - Wyszukiwarka Google oferuje nam najszersze możliwości weryfikacji duplikatów, które możemy zauważyć już w tagach meta description, ujawniających opis zawartości strony oraz w wynikach rozszerzonych, czyli tzw. rich snippets. Aby ułatwić sobie wyszukiwanie wystarczy, że zastosujemy komendę site: i po dwukropku wpiszemy pełny adres URL strony, a tuż obok interesujący nas fragment treści (np. site:https://artixen.net/ to zespół młodych, kreatywnych i głodnych wiedzy ludzi, którzy mają wspólną pasję - zamiłowanie do Internetu i nowych technologii),
  • SEO-Leniwiec - Profesjonalne narzędzie, służące do tworzenia, przechowywania i edycji artykułów, posiadająca opcję sprawdzania treści w wyszukiwarkach Google, Bing oraz Yahoo!,
  • The Plagiarism Checker - Oferujący opcję wklejania wybranych fragmentów tekstu w okno tekstowe lub sprawdzenie całego dokumentu z Worda,
  • Copyscape - Wyszukujący w sieci duplikatów strony, której adres URL wkleimy do modułu wyszukiwania,
  • Plagiarisma - Narzędzie obsługujące ponad 190 różnych języków, wyposażone w opcję dokładnego wyszukiwania fraz,
  • Siteliner - Daje możliwość przeprowadzenia dokładnego skanowania strony w celu poszukiwania duplikatów,
  • Google Search Console - Można ją zastosować, jeżeli przedmiotem duplikacji są metatagi np. tytuły lub opisy,
  • Xenu - Pozwala eksportować dane do Excela, pomagając filtrować kopie metadanych.

Double content podsumowanie:

  • Duplicate content to powielanie treści w formie tekstowej w ramach jednej lub wielu domen,
  • Najczęściej bywa on zjawiskiem niepożądanym, lub nawet szkodliwym, obniżając pozycję strony w wynikach wyszukiwania,
  • W celu jego wykrycia najlepiej wykorzystać dedykowane narzędzia, dostępne nieodpłatnie w internecie lub przeprowadzić dokładny audyt SEO,
  • Inwestycja w oryginalne i wartościowe treści to klucz do sprawnego marketingu i zyskania zainteresowania nowych odbiorców,
  • Plagiatowanie treści niesie za sobą konsekwencje prawne, dlatego należy go za wszelką cenę unikać,
  • Jeżeli na naszej stronie występuje duplikacja treści, należy zastosować odpowiednie metody naprawcze w postaci zmiany treści na unikalne, przekierowań, komend lub właściwych atrybutów w języku HTML.