Als Seitenbetreiber stößt man über kurz oder lang auf das Problem des doppelten Inhaltes (duplicate content). Suchmaschinen reagieren zunehmend empfindlicher auf doppelte Inhalte. Die Bots gehen, kurz gesagt, davon aus, daß eine Seite, die die selben Inhalte anbietet, wie eine andere Seite, nicht viel wert sein kann. Die eingeleiteten Maßnahmen können sehr unterschiedlich sein und reichen vom Vermerk der doppelten Seiten in einer internen Datenbank bis hin zur Streichung aus dem Suchmaschinenindex im Extremfall. Jedenfalls schadet doppelter Content dem Pagerank ebenso wie der Platzierung in den Suchergebnissen.
Über diesen Umstand sollte sich jeder Seitenbetreiber im Klaren sein, der zu umfangreich ganze Wikipedia-Artikel kopiert oder der zu häufig größere Passagen aus anderen Weblogs / Seiten zitiert. Hierbei geht es nicht um die urheberrechtliche Seite des Zitierens und Kopierens. Oftmals hat man die Genehmigung zur Textübernahme oder will einen Text übernehmen, der unter einer freien Lizenz steht. Doppelt sind sie dann aber trotzdem.
Die allermeisten Blog-Systeme generieren überdies ständig doppelten Content. So sieht der Bot der Suchmaschine ein und denselben Artikel einmal in der Ansicht der Hauptseite, in der Einzelansicht, über den Kommentaren, im Archiv, auf der Suchseite und im Feed.
Ich habe dieses Problem bei mir folgendermaßen gelöst:
1. Alle zitierten Großtexte aus WordPress entfernt.
2. weitere längere Texte umformuliert.
3. andere Zitate durch /blockquote/ zergliedert und mit eigenen Ziwschensätzen versehen.
Den automatisch generierten doppelten Content vermeide ich durch folgenden Code-Schnipsel in der header.php:
‚;
} else {
echo “;}?]
Eckige Klammern sind durch spitze Klammern zu ersetzen
Anleitung:
1. in den head-Bereich der Datei header.php kopieren.
2. die vorhandene Zeile „meta name=“robots“…“ entfernen oder auskommentieren
3. header.php wieder hochladen.
4. Eigene Seite neu aufrufen.
In der Ansicht „Seitenquelltext anzeigen“ überprüfen, dass auf der Startseite, bei der Einzelartikelansicht, auf den ersten Seiten der Archive und der Suchergebnisse auch wirklich „index-follow“ im Quelltext steht.
Blättert man in den Suchergebnissen oder Archiven sollte sich das in noindex,follow“ ändern.
Quelle des Codes hier
Ich habe noch einmal die wichtigsten Schlagwörter (Hashtags) dieses Artikels für Sie zusammengestellt, damit Sie sich besser orientieren können:
Keine Schlagwörter vorhanden