Duplicate Content

Suchmaschinenoptimierung (SEO) ist ein weites Feld das sich ständig neu erfindet. Ich bin weder ausgewiesener SEO Spezialist, auch würde es den Umfang dieser Seite sprengen auf alle Einzelheiten einzugehen. Hier also nur ein paar Basisc mit TYPO3 typischen Workaround.

Ist ein mehr oder weniger gleicher Seiteninhalt über verschiedene URLs zu erreichen spricht man von Duplicate Content. Suchmaschinen haben damit so ihre Probleme, da sie nicht wissen welche Version aufgenommen werden soll. Wenn's blöd läuft, habt Ihr so die Printseiten im Google Index oder die Seiten werden gar nicht indexiert.

Meist sind es technische Stolperfallen die zu Duplicate Content führen:

Mit oder ohne "www"?

Die meisten Suchmaschinen haben damit keine Probleme mehr, das eine Seite über www.MyPage.de oder myPage.de aufgerufen werden kann.

Wer sicher gehen will entscheidet sich für eine Variante und setzt einen entsprechenden Redirect in die .htaccess Datei, hier ein Beispiel für ein Redirect auf die www-Variante:

RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} ^(.+)$ [NC]
RewriteRule ^(.*)$ www.%1/$1 [R=301,L]

Pagination in Kommentarbereichen

Die Paginierung wird in der Regel als URL Parameter übergeben. So entstehen unterschiedliche URL deren Seiteninhalte (mit Ausnahme der Kommentare) identisch sind. Abhilfe schafft hier ein eindeutiger canonical link im Header.

Print Seiten

Ist auf der Seite ein Link zu einer Druckansicht, wird auch der Suchmaschinenbot die Druckseite unweigerlich finden und Duplicate Content feststellen. Abhilfe: auf Printseiten im Header den robot Tag ändern:

<meta name="robots" content="noindex,follow" />

Hier muss nur der entsprechende TypoScript Eintrag im page-Object der Printseite ergänzt werden.

Extensions, z.B. News Systeme, Produktdatenbanken

Das Problem bei diesen Extensions ist meist, das der single Beitrag über verschiedene Pfade erreicht werden kann: Beispiele [1]:

news/aktuelle-Artikel/mein-Beitrag
news/KategorieXYZ/mein-Beitrag
news/Archiv-Dezember/mein-Beitrag

Damit kann der canonical Tag nicht aus dem Seitentitel gerendert werden da in dem Beispiel alle 3 Seiten einen anderen Link bei gleichem Inhalt haben. Entweder schreibt man hier per realURL den Pfad auf eine Version um oder setzt per condition ein “noindex” analog den Printseiten für die mehrfachen Einträge. 

[1] Um z.B. bei tt_news den canonical zu erzeugen gibt es verschiedene TypoScript Ansätze im Netz. Dabei werden die benötigten Get-Parameter in Link Pfade übersetzt. Somit erhält man zwar den richtigen Link, die Problematik das eindeutiger Content über mehrere Seitenlinks erreicht werden kann bleibt aber bestehen.

Falsche Einstellungen der Mehrsprachigkeit

Ein Problem kann bei mehrsprachigen Webseiten mit der Standardsprache auftreten. So ist die Standardsprache oft mit- und ohne Language Parameter erreichbar.

Beispiel:
www.meineDomain.de
www.meineDomain.de/de

Damit gibt es wieder zwei unterschiedliche Links zu einer Contentseite. Ich mache es meistens so, das die Standardsprache überhaupt nicht im URL Pfad vorkommt. Dies kann man in der realURL Konfiguration dadurch erreichen, das nur die fremdsprachigen Language Parameter angegeben werden und die Standardsprache mit noMatch => bypass aus dem Pfad herausgefiltert wird.

realURL Konfiguration:

 'preVars' => array( 
    array(
        'GETvar' => 'L',
        'valueMap' => array(
            'en' => '1',
            'fr' => '2',
        ),
        'noMatch' => 'bypass',
    ),

Zum Beispiel wird auf dieser Seite die deutsche Version ohne Sprachzusatz in der URL angezeigt, in der englischen Übersetzung mit /en/ im Pfad. Wenn allerdings keine Übersetzung vorliegt und dann doch die deutsche Version angezeigt wird, besteht das double Content Problem weiterhin ;) - ist aber dann der fehlenden Übersetzung geschuldet.

Weitere Artikel zu diesem Thema:

Empfehlenswerte Lektüre:

Think Content!

Für jeden, der auf seiner Webseite besseren Content anbieten will, sollte dieses Buch zum Standardrepertoire gehören. Auf über 600 Seiten beschreibt die Autorin ganz ohne Hype aber mit vielen Praxistipps, Listen und Infos den Weg von der Idee zum erfolgreichem Webcontent.

Kommentare

keine Kommentare vorhanden


Kommentar verfassen

Die Email Adresse wird nicht veröffentlicht.