• Gelöst heinrich80

    (@heinrich80)


    Hallo zusammen,

    mir ist soeben aufgefallen, dass es zu all meinen Seiten (Homepage und Unterseiten) zahlreiche (unendlich viele?) paginierte Seiten gleichen Inhalts gibt: „URL/page/2“, „URL/page/3“ … „URL/page/100“ usw.
    Wie kommt so etwas zustande? Weiß jemand, wie ich das deaktivieren kann?

    Über das All In One SEO Pack Plugin wird zwar allen paginierten Seiten ein Canonical-Tag zur jeweiligen Seite 1 hinzugefügt (also kein Duplicate-Content-Problem), aber trotzdem kann die ganze Sache ja nicht im Sinne des Erfinders sein.

    Ich nutze Managed WordPress Hosting (heißt: ohne Quellcode-Editor), mein Theme ist „Equable Lite“.

    Danke schon mal vorab.
    Beste Grüße, Heinrich

    Die Seite, für die ich Hilfe brauche: [Anmelden, um den Link zu sehen]

Ansicht von 3 Antworten – 1 bis 3 (von insgesamt 3)
  • Die Datei wp-inlcudes/canonical.php sorgt dafür, dass (z.B. in Datums- oder Autor-Archiven) doppelt vorkommende Inhalte mit einem Canonical Link versehen werden, damit Suchmaschinen die Seiten nicht als „Double Content“ ausweisen. Die Datei enthält laut Entwickler zusätzlich eine Funktion für Inhalte, die es in der Form des eingegebenen Links gar nicht gibt:

    Will also attempt to find the correct link when a user enters a URL that does
    not exist based on exact WordPress query. Will instead try to parse the URL
    or query in an attempt to figure the correct page to go to.

    Übersetzung mit Deepl.com:

    Versucht auch, den korrekten Link zu finden, wenn ein Benutzer eine URL eingibt, die nicht auf der Grundlage einer genauen WordPress-Abfrage existieren. Versucht stattdessen, die URL zu parsen oder abzurufen in einem Versuch, die richtige Seite zu finden.

    In Zeile 160 dieser Datei steht der Code dazu: wird bei Eingabe einer Seitennummer ein Fehler 404 – Seite nicht gefunden produziert (Zeile 126) wird zunächst geprüft wird, ob der Seiteninhalt überhaupt das Tag <!--nextpage--> enthält. Falls nicht, wird die eingegebene Seitennummer ignoriert und statt dessen der Inhalt der Seite abgerufen und angezeigt, also genau das, was du als „… Seiten gleichen Inhalts …“ beschreibst.

    Für Suchmaschinen ist das unerheblich, weil Suchmaschinen beim Crawlen von Webseiten vorhandenen Links und Sitemaps folgen und es wahrscheinlich keinen Link auf deiner Website zu einer /page/4711 geben wird.

    Die (recht lange) Funktion bietet am Ende auch einen Filter an, um das Verhalten nach eigenen Wünschen anzupassen. Der Entwickler hat dazu folgende Funktion vorgeschlagen, mit der das „Link-Raten“ abgeschaltet wird:

    function remove_redirect_guess_404_permalink( $redirect_url ) {
        if ( is_404() )
            return false;
        return $redirect_url;
    }
    add_filter( 'redirect_canonical', 'remove_redirect_guess_404_permalink' );

    Ich habe jetzt nicht weiter erforscht, wieso das jetzt ausgerechnet bei der Eingabe einer Seitenzahl nicht greift – wahrscheinlich müsste das if-Statement noch erweitert werden.

    Nicht jeder ist offensichtlich mit der Art, wie WordPress Links errät, glücklich, wie das zitierte Bug-Ticket zeigt. Das Thema wurde bereits vor 9 Jahren angesprochen und vor 10 Tagen gab es zuletzt eine Änderung am Core, die in Version 5.5 einfließen soll.

    Thread-Starter heinrich80

    (@heinrich80)

    Vielen Dank für die ausführliche Info!
    Dann werde ich dieses Phänomen wohl ignorieren. (Es ist mir übrigens aufgefallen, weil eine dieser paginierten Seite von Google indexiert wurde – trotz fehlender interner Verlinkung und trotz Canonical Tag.)

    Gern geschehen. Ich markiere den Thread dann mal als „gelöst“.

Ansicht von 3 Antworten – 1 bis 3 (von insgesamt 3)
  • Das Thema „Paginierte Seiten gleichen Inhalts“ ist für neue Antworten geschlossen.