Inhaltsangabe

Duplicate Content aufspüren und vermeiden

Was ist Duplicate Content und wie lässt er sich vermeiden?

stopwatch icon

6 min

calendar icon

22.04.2022

share-icon

Artikel teilen

Nach Googles Idealvorstellung des Internets besteht jede Webseite aus einzigartigem und interessantem Inhalt. Doppelter Inhalt – Duplicate Content genannt – kann daher als schlecht eingestuft und entsprechend tiefer in den Suchergebnissen platziert werden. Google kommt zu dieser Einschätzung, weil es den Vorlieben seiner Nutzer entspricht, die ungerne sich wiederholende Inhalte auf mehreren Seiten vorfinden möchten. Jedoch ist das Netz voll von identischen Inhalten. Es gibt viele Ursachen dafür, in den seltensten Fällen tritt Duplicate Content aus böswilliger Absicht auf. In diesem Beitrag wird erklärt, wie Duplicate Content entsteht und wie man ihn auf der eigenen Seite vermeidet.

Arten von Duplicate Content

Grundsätzlich ist zwischen zwei Arten von Duplicate Content zu unterscheiden. Externer Duplicate Content auf verschiedenen Websites und Interner Duplicate Content innerhalb einer Domain. Beide Formen gilt es so gut wie möglich zu vermeiden, da sie das eigene Ranking verschlechtern können.

Externer Duplicate Content

Wenn sich auf zwei unterschiedlichen Domains große Inhaltsblöcke gleichen, stuft Google diesen Inhalt als Duplicate Content ein. Ursache hierfür sind z.B. kopierte Inhalte, um Seiten schnell mit Leben zu füllen. Wenn beispielsweise Produktbeschreibungen eines Herstellers auf mehreren Onlineshops auftauchen, sind diese für Google als solche erkennbar. Bei kopierten Inhalten weiß Google in der Regel den Urheber und stuft diesen (in den meisten Fällen) höher als die Kopie ein. Auch sehr ähnlicher Inhalt wird als Near Duplicate Content erkannt.

Mehr als nur schwarz/weiß – das Panda Update

Googles Algorithmus wird regelmäßig verfeinert, immer mit dem obersten Ziel, den Suchenden jederzeit das passendste Suchergebnis zu liefern. 2011 bezog das sogenannte Panda Update erstmals die Qualität von OnPage-Inhalten in die Bewertung mit ein. Jede Seite wird seitdem darauf untersucht, wie einzigartig – also unique – die Inhalte sind. Minderwertige Inhalte fallen im Ranking deutlich ab. Welche Kriterien dabei genau welche Rolle spielen ist Googles Geheimnis, die Erfahrung zeigt jedoch, dass für ein gutes Ranking dem Nutzer auch etwas geboten werden muss.

Unique Content

Da Googles Bots beständig das Internet und seine Inhalte überblicken, fällt Duplicate Content schnell auf. Was in Googles Augen wirklich heraussticht ist Unique Content – Inhalte, die es sonst auf keiner zweiten Seite so zu finden gibt und die sich durch ihren Informationsgehalt, ihre Aktualität und die Schreibweise von anderen Seiten abheben. In der Regel bedeutet Einzigartigkeit auch ein hohes Interesse und gutes Benutzerverhalten – beides sind wichtige Kriterien für Googles Einschätzung des Inhaltswerts. Google erkennt einzigartigen Content besser als jeder Lehrer, der auf Auffälligkeiten in Schüleraufsätzen achtet. Es gilt heute mehr denn je: Eigene Arbeit wird belohnt, Abschreiben wird bestraft.

Interner Duplicate Content

Duplicate Content kann aber auch innerhalb einer Seite auftreten und zählt in Googles Augen als Indikator für die Seitenqualität. Wer seinen Besuchern auf mehreren URLs identische Inhalte präsentiert, vermindert das Benutzererlebnis. Und was den Nutzer stören könnte, stört Google bereits vor dem Eintreten dieses Falls. Oft tritt auch die gleiche Seite unter unterschiedlichen URLs auf, die für das Ranking in den Suchergebnissen untereinander konkurrieren und die Platzierung verschlechtern. Wenn eine Website beispielsweise sowohl mit dem Präfix “www.” als auch ohne dieses aufrufbar ist, können bereits diese beiden URLs konkurrieren. Ein weiterer Fall kann auftreten, wenn die mobile Version einer Seite als gleichwertige URL auftritt oder regionale Unterseiten eine eigene Domain besitzen, aber die gleichen Inhalte anzeigen. Wenn mehrere Seiten innerhalb einer Website für dasselbe Keyword ranken, kann Google im schlimmsten Fall eine oder mehrere dieser Seiten ignorieren. Diese sogenannte Keyword-Kannibalisierung dezimiert das mögliche Ranking.

Duplicate Content durch Produkt-Varianten in Onlineshops

Häufig tritt Duplicate Content in Onlineshops auf. In Shops ähneln sich einzelne Artikelseiten häufig, v.a. wenn es mehrere Varianten eines Produktes gibt, die unter unterschiedlichen URLs aufrufbar sind. Da sich der Inhalt dieser Produktseiten oftmals nur in einem Kriterium unterscheiden, entsteht schnell Duplicate Content. Nach klassischen Mechanismen der Suchmaschinenoptimierung verfasst man nun zu jedem einzelnen Artikel einen einzigartigen Text. Abhängig von der Zahl an Produktseiten bzw. -varianten ist diese Methode allerdings schnell zu aufwendig. Hier kommen Canonical Tags ins Spiel.

Canonical Tags

Canonical Tags sind Einstellungen im Quellcode von Webseiten, die dem Google Bot zeigen, dass zu einer anderen Seite verwiesen wird. Google wird dadurch vermittelt, dass eine bestimmte URL gegenüber den Duplikaten bevorzugt werden soll. URLs mit (fast) identischem Inhalt können so kanonisiert werden, wodurch ein negativer Effekt durch Duplicate Content neutralisiert wird. Dem Duplikat wird direkt eine bevorzugte URL zugewiesen, die auch für Bots und Google eindeutig zu bevorzugen ist. In einem Shop können so beispielsweise die verschiedenen URLs zu den jeweiligen Farben eines Produkts auf eine URL gelenkt werden. Meistens ist das die URL mit den meisten Aufrufen, also die beliebteste Produktfarbe. Wenn Google das Canonical Tag als korrekt gesetzt einschätzt, lässt sich das Ranking für relevante Keywords auf einer Produktseite bündeln.

Interner Duplicate Content

Duplicate Content kann aber auch innerhalb einer Seite auftreten und zählt in Googles Augen als Indikator für die Seitenqualität. Wer seinen Besuchern auf mehreren URLs identische Inhalte präsentiert, vermindert das Benutzererlebnis. Und was den Nutzer stören könnte, stört Google bereits vor dem Eintreten dieses Falls. Oft tritt auch die gleiche Seite unter unterschiedlichen URLs auf, die für das Ranking in den Suchergebnissen untereinander konkurrieren und die Platzierung verschlechtern. Wenn eine Website beispielsweise sowohl mit dem Präfix “www.” als auch ohne dieses aufrufbar ist, können bereits diese beiden URLs konkurrieren. Ein weiterer Fall kann auftreten, wenn die mobile Version einer Seite als gleichwertige URL auftritt oder regionale Unterseiten eine eigene Domain besitzen, aber die gleichen Inhalte anzeigen. Wenn mehrere Seiten innerhalb einer Website für dasselbe Keyword ranken, kann Google im schlimmsten Fall eine oder mehrere dieser Seiten ignorieren. Diese sogenannte Keyword-Kannibalisierung dezimiert das mögliche Ranking.

Duplicate Content durch Produkt-Varianten in Onlineshops

Häufig tritt Duplicate Content in Onlineshops auf. In Shops ähneln sich einzelne Artikelseiten häufig, v.a. wenn es mehrere Varianten eines Produktes gibt, die unter unterschiedlichen URLs aufrufbar sind. Da sich der Inhalt dieser Produktseiten oftmals nur in einem Kriterium unterscheiden, entsteht schnell Duplicate Content. Nach klassischen Mechanismen der Suchmaschinenoptimierung verfasst man nun zu jedem einzelnen Artikel einen einzigartigen Text. Abhängig von der Zahl an Produktseiten bzw. -varianten ist diese Methode allerdings schnell zu aufwendig. Hier kommen Canonical Tags ins Spiel.

Canonical Tags

Canonical Tags sind Einstellungen im Quellcode von Webseiten, die dem Google Bot zeigen, dass zu einer anderen Seite verwiesen wird. Google wird dadurch vermittelt, dass eine bestimmte URL gegenüber den Duplikaten bevorzugt werden soll. URLs mit (fast) identischem Inhalt können so kanonisiert werden, wodurch ein negativer Effekt durch Duplicate Content neutralisiert wird. Dem Duplikat wird direkt eine bevorzugte URL zugewiesen, die auch für Bots und Google eindeutig zu bevorzugen ist. In einem Shop können so beispielsweise die verschiedenen URLs zu den jeweiligen Farben eines Produkts auf eine URL gelenkt werden. Meistens ist das die URL mit den meisten Aufrufen, also die beliebteste Produktfarbe. Wenn Google das Canonical Tag als korrekt gesetzt einschätzt, lässt sich das Ranking für relevante Keywords auf einer Produktseite bündeln.

Duplicate Content finden

Um Duplicate Content zu verhindern, sollten grundsätzlich alle Inhalte auf der eigenen Seite auch aus eigener Hand stammen. Wer Inhalte von anderen Seiten übernimmt, muss immer den Aspekt des Duplicate Content mit bedenken. Sollten eigene Inhalte von fremden Seiten kopiert werden, erkennt Google die ursprüngliche Quelle in der Regel als Urheber an. Bereits bestehender Duplicate Content lässt sich auf mehrere Arten aufspüren. Externen Duplicate Content finden Plagiats-Tools wie Copyscape, über die Google Suche lassen sich aber auch direkt Textbausteine suchen. Für internen Duplicate Content dienen die gängigen SEO-Tools. Um innerhalb einer Seite den Anteil des Duplicate Content zu ermitteln, hilft das kostenlose Online-Tool Siteliner. Es bietet auch einen Überblick, wie gewöhnlich oder einzigartig die Inhalte auf der Domain sind. Für das Aufspüren duplizierter URLs dienen Crawler wie beispielweise Screaming Frog. Zu Duplicate Content äußert sich auch Google offiziell in seinen Richtlinien.

In a Nutshell

Identische Inhalte auf verschiedenen URLs können von Google ignoriert oder sogar abgestraft werden. Entscheidend für die eigene Website sind daher die Einzigartigkeit und Qualität des Contents. Um Duplicate Content durch Produktvarianten in einem Onlineshop zu vermeiden, helfen Canonical Tags. Grundsätzlich gilt: Keine Inhalte kopieren, sondern alles selbst schreiben.

Quellen

Websiteboosting: Vermeidung von Duplicate Content - Irina Hey (2014)

t3n: Was ist eigentlich Duplicate Content? - Melanie Petersen (2019)

One Solutions Group: Duplicate und Near Duplicate Content, wie kann er vermieden werden? (2017)

Adfreak: Duplicate Content Checker - Tool Liste zum Prüfen und Finden (2018)

Wir helfen Ihnen gerne!

Wir beraten Sie kostenlos und unverbindlich, gerne auch direkt bei Ihnen vor Ort.

Sprechen Sie uns an
cta image

Frieder
Frieder
Storytelling/Content & SEO

In der Mainwebsolutions ist Frieder die Person für das Erdenken und Verfassen jeglicher Inhalte, sowie die Suchmaschinenoptimierung mit speziellem Fokus auf Webseitentexte. In seiner Freizeit bleibt er immer auf dem neuesten Stand des Weltgeschehens und hält Ausschau nach guten Texten, Büchern, Podcasts und Hemden.