1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

WP generiert eigenartige URLs

Dieses Thema im Forum "Konfiguration" wurde erstellt von bydlo, 7. Februar 2015.

  1. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    Moin Moin,
    habe gerade in den Google WMT einige Fehlermeldungen zu URLs gesehen die es garnicht geben dürfte.
    Meine Website (die ich jetzt hier mal nicht poste weil ich nicht will das durch fleissige Helfer noch mehr von diesen URLs generiert werden) produziert anscheinend URLs wie diese:

    http://www.example.com/category/post/1995/
    Oder halbwegs Klartext:
    http://www.meine-domain.de/team/mitarbeiter-XY/1995/
    Diese URL wirft aber exakt denselben Inhalt aus wie..
    http://www.meine-domain.de/team/mitarbeiter-XY/

    Die Zahl lässt sich ersetzen gegen jede andere beliebige Zahl, die URL (mit Zahl) zeigt dann immer denselben Inhalt an und WP wirft keine 404 aus, wie es ja eigentlich sein sollte.
    Mach ich den Spass mit Buchstaben anstatt mit Zahlen passiert das was passieren muss - ein 404.

    Fragen:
    1: Generiert WP diese URLs selbst?
    Wenn ja, wo ...und wie unterbinde ich das?
    2:Möglicherweise sind das ja auch URLs die auf anderen Wegen in den Index gelangt sind (zBsp. durch User-Interaktion).
    Wie kann ich dafür sorgen das solche URLs garnicht erst entstehen können bzws einen 404 auswerfen?

    2tes Problem
    Eine weitere URL die ich gefunden habe ist diese:
    http://www.meine-domain.de/category/subcategory/http:/www.meine-domain.de/category/subcategory/subsubcategory/page/3/
    (Die Paginierung lässt sich nach diesem Schema endlos fortsetzen)

    Eine solche Kategorisierung gibt es in der Website nicht - hier muss sich irgendwo was "verschluckt" haben.
    Wo??

    Das stellt momentan ein ernstzunehmendes Problem dar und ich würde mich freuen wenn hier jemand was problemlösendes beisteuern könnte.
    Gruss axel
     
  2. maxe

    maxe Well-Known Member
    Ehrenmitglied

    Registriert seit:
    1. Mai 2008
    Beiträge:
    19.581
    Zustimmungen:
    277
    Naja, wir müssten uns das vermutlich trotzdem mal live angucken, zumindest die Post Pagination.

    Die Kategorie Pagination ist z.B. normal.
     
  3. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    Hallo Maxe
    mein WP verhält sich genauso wie jede andere WP-Installation.
    Du kannst es mit jeder x-beliebigen WP-Installation oberhalb von 3.X testen.
    ...postname/x-beliebige-Zahl/ funktioniert immer.

    Und das ist ein Riesen-Problem (nicht nur bei mir) namens Duplicate Content.
    Deswegen hab ich auch nochmal einen allgemeineren Post erstellt denn ich werde definitiv nicht der Einzige sein der das Problem hat:
    http://forum.wpde.org/konfiguration/138982-post-pagination-unterbinden-wie.html

    gruss axel
     
  4. maxe

    maxe Well-Known Member
    Ehrenmitglied

    Registriert seit:
    1. Mai 2008
    Beiträge:
    19.581
    Zustimmungen:
    277
  5. r23

    r23 Well-Known Member

    Registriert seit:
    9. Dezember 2006
    Beiträge:
    7.360
    Zustimmungen:
    588
  6. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    @r23
    das ist ja auch eine Page und kein Post.

    @Maxe
    Oh, oh, das übersteigt mein Know How.
    Würde ich damit denn nicht Pagination im Allgemeinen unterbinden? (Auf den Kategorieseiten will ich sie ja haben)

    Auf jeden Fall kann man Folgendes sagen.
    Wenn es hierfür keine Lösung gibt dann kann man jeder auf WP basierenden Website in kürzester Zeit sehr schlechte Google-Ergebnisse bescheren - bis hin zum Rauswurf.
    Damit hat "Google-Bowling" eine neue Dimension.

    Gruss axel
     
  7. r23

    r23 Well-Known Member

    Registriert seit:
    9. Dezember 2006
    Beiträge:
    7.360
    Zustimmungen:
    588
  8. maxe

    maxe Well-Known Member
    Ehrenmitglied

    Registriert seit:
    1. Mai 2008
    Beiträge:
    19.581
    Zustimmungen:
    277
  9. r23

    r23 Well-Known Member

    Registriert seit:
    9. Dezember 2006
    Beiträge:
    7.360
    Zustimmungen:
    588
    wenn man irgendetwas dran hängt kommt mal 404 oder eine Seite. ok. aber auch kein drama. unter <link href="http://example.org/" rel="canonical"> steht bei einer falschen urls die richtige Info.
     
  10. maxe

    maxe Well-Known Member
    Ehrenmitglied

    Registriert seit:
    1. Mai 2008
    Beiträge:
    19.581
    Zustimmungen:
    277
    Richtig, in meinem WP ist dem auch so.
     
  11. mensmaximus

    mensmaximus Well-Known Member

    Registriert seit:
    24. Juli 2014
    Beiträge:
    8.857
    Zustimmungen:
    437
    Aber nur wenn Dein Theme nicht richtig arbeitet. Das Paging ist eine gewünschte Funktion und die Rewrire Regeln sorgen dafür, dass der Hauptartikel erscheint, selbst wenn die angegebene 'Seite' nicht existiert. Damit es hier zu keinem Duplicate Content kommt wird im Header die Canonical URL angegeben, welche dann auf das Original zeigt.
     
  12. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    Das ist mir alles bewusst und die WP-Installation um die es hier geht nutzt auch - korrekt - den canonical-tag.

    Nur was nutzt das wenn Google sich wiedermal einen feuchten Kehricht um Standards schert.
    Ich habe trotz korrekter Verwendung des Canonical-Tags 40 Warnungen bez. doppelter Metabeschreibungen (wegen o.g Problems) in den WMT und die "paginierten" Versionen eines Posts im Index.
    Tendenz steigend - im Gegensatz zu meinem Ranking.

    Wir alle kennen das leidige Thema - Google pfeift und dir als Webmaster bleibt nichts übrig als zu springen wenn dir deine wirtschaftliche Existenz wichtig ist.

    Da also der Canical Tag als Lösung nicht funktioniert suche ich nun nach einem anderen Ansatz.


    @maxe
    hier mal ein konkretes beispiel:
    http://www.focus-pokus.de/blog/shootings/zaehmung-der-widerspenstigen/
    Und jetzt häng da mal eine beliebige Zahl dran

    Fazit: kein redirect / kein 404 /
    Und ich kann dir hunderte Blogs zeigen bei denen das so ist.
    Unter anderem der hier:
    bueltge.de/blue-beanie-day-2014/

    Gruss A.
     
    #12 bydlo, 8. Februar 2015
    Zuletzt bearbeitet: 8. Februar 2015
  13. mensmaximus

    mensmaximus Well-Known Member

    Registriert seit:
    24. Juli 2014
    Beiträge:
    8.857
    Zustimmungen:
    437
    #offtopic#
    Ist das nicht ein wenig sehr dramatisch? Wenn meine wirtschaftliche Existenz von Google abhängen würde, würde ich mir ernsthafte Gedanken über mein Geschäftsmodell machen.
    #ontopic#

    Wenn Du die WordPress Standard Rewriteregeln nicht haben möchtest und Dir der Auswirkungen bewusst bist, kannst Du eigene Regeln in die .htaccess schreiben.
     
  14. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    und hier ein noch viel schlimmeres Beispiel einer Seite die eigentlich aufgrund des Kenntnistands der Betreiber von solchen Sachen verschont bleiben sollte:

    http://www.elmastudio.de/freelancing/webworker-tipps-wie-man-auch-in-stressigen-arbeitszeiten-kreativ-bleibt/
    - Jetzt häng ne Zahl ran (sagen wir mal 995)
    - Jetzt schau Dir den Quelltext an - besonders den Canonical-Tag. Dort steht nun als URL ..../995/ und das ist ja genau das Gegenteil dessen was der Canonical-Tag tun sollte.
    Dieser sollte auf die "Ursprungsadresse" verweisen und nicht auf jene die es garnicht gibt
     
  15. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    @mensmaximus
    Du verstehst das Problem nicht.
    Hier greift keine Rewrite Rule!!

    Merksatz: Ein bestimmter Inhalt darf nur über eine URL (Uniform Ressource Identifier) erreichbar sein..sonst DC.
    Ergo muss entweder..
    ein redirect stattfinden (das tut es nicht !!)
    ein 404 ausgeworfen werden (das tut es nicht !!)
    oder - und das ist eine Milchmädchenlösung - die fragliche DC-URL per Robots oder Metatag gesperrt werden
     
  16. maxe

    maxe Well-Known Member
    Ehrenmitglied

    Registriert seit:
    1. Mai 2008
    Beiträge:
    19.581
    Zustimmungen:
    277
    das ist aber ein Problem des Blogbetreibers, wenn solche Dinge falsch konfiguriert sind (vermutlich durch AiOSeo Plugin). WP kann canonical von Haus aus seit V2.9.
     
  17. mensmaximus

    mensmaximus Well-Known Member

    Registriert seit:
    24. Juli 2014
    Beiträge:
    8.857
    Zustimmungen:
    437
    Ich versteh Dich schon. Und deshalb habe ich Dir auch gesagt, dass Du eigene Regeln in die .htaccess schreiben kannst, damit der von Dir gewünscht redirect stattfindet.
     
  18. bydlo

    bydlo Well-Known Member

    Registriert seit:
    1. Juni 2006
    Beiträge:
    447
    Zustimmungen:
    0
    @mensmaximus
    Du widersprichst Dir selbst.
    Du schreibst:
    Und genau dieses von Dir postulierte WP-eigene Standardverhalten findet nicht statt.

    Wenn dein Postulat korrekt ist sollte eher der Versuch unternommen werden herauszufinden warum hier kein rewrite / redirect / 404 stattfindet anstatt mit Flicklösungen herumzuhantieren.
    Oder aber dein Postulat ist nicht korrekt - dann steht nach wie vor die Frage im Raum wie man WP dazu bewegen kann redirects oder 404 zu erzeugen wenn jemand eine nicht existierende URL aufruft.

    Immerhin kann WP das ja auch bei Buchstaben:
    http://www.elmastudio.de/eine-nicht-existente-URL/
     
  19. mensmaximus

    mensmaximus Well-Known Member

    Registriert seit:
    24. Juli 2014
    Beiträge:
    8.857
    Zustimmungen:
    437
    Was ist an meiner Aussage falsch? Ich spreche nicht von einem Redirect sondern von einem Rewrite. Das anhängen der Zahlen führt intern dazu, dass der Artikel trotzdem angezeigt wird, selbst wenn es die "Seite 99999" bei einem "mehrseitigen" Artikel nicht gibt. Ich habe nicht behauptet, das die URL umgeschrieben wird.

    Und anstatt lange zu diskutieren, könntest Du, wie vorgeschlagen, eine Regel in Deine .htaccess schreiben, die dieses Verhalten ändert, wie z.B. ein:

    RewriteCond %{REQUEST_URI} ^\/(\d+)$
    RewriteRule (.*) /index.php [R=404,L]

    Du darfst diesen Ansatz gerne verfeinern.
     
  20. mensmaximus

    mensmaximus Well-Known Member

    Registriert seit:
    24. Juli 2014
    Beiträge:
    8.857
    Zustimmungen:
    437
    Mit folgender Funktion kannst Du einen echten Redirect für Posts im WordPress veranlassen, deren URL mit einer Zahl nach dem Slash endet:

    add_filter( 'redirect_canonical', 'mmx_mod_paged_redirect', 10, 2);
    function mmx_mod_paged_redirect( $redirect_url, $requested_url ) {
    if ( is_single() ) {
    return preg_replace( '|(/\d+)$|', '', $requested_url );
    }
    }

    Selbstverständlich gehen dann keine 'paged' Artikel mehr
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden