1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Google Crawl

Dieses Thema im Forum "Allgemeines" wurde erstellt von dummy, 2. Juli 2008.

  1. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Hi, ich habe festgestellt, dass Google nur meine Index Seite crawlt. Ich weis nicht woran das liegt. Ich war vor einigen Monaten auf einem anderen Server, da hatte ich aber keine sitemap und auch keine robots.txt, trotdem wurde die Seite stündlich gecrawlt, und zwar wirklich jeder Beitrag und Seite.

    Seid dem Umzug sind einige Plugins dazugekommen, aber die Theme ist die Selbe geblieben. Ich weiß nicht ob Google die anderen Beiträge und Pages einfach nicht findet, oder garnicht danach suchen will. Auf jeden Fall waren einige Tage nach dem Umzug etwa 200 Einträge in Google gelistet. Jetzt (knapp 2 Monate später) sind es nur noch 80, obwohl ständig Inhalt dazugekommen ist. Jetzt habe ich mal die sitemap gelöscht, um zu sehen was passiert.

    Es wird übrigens das Plugin Googlebot benutzt um das crawling Verhalten zu beobachten.

    Ich muss noch dazu sagen, dass ich nach dem Umzug meine Sitemap und robots.txt 3-4 mal abgeändert habe. Könnte es vielleicht sein, dass Google sowas nicht mag?
     
  2. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Also ohne deine Seite zu sehen, fielen mir folgende Dinge ein:

    - noindex,nofollow gesetzt (vllt ein SEO-Plugin installiert?)
    - rel="nofollow" bei den Links angegeben?
    - die robots.txt könnte fehlerhafte Angaben enthalten, vllt mal zeigen
     
  3. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Meine robots.txt sieht so aus, die habe ich auch irgendwo herauskopiert, denke, dass sie auf den ersten Blick auch auf meine Seite anwendbar ist. Was mir grade auffällt, ich habe kein /cgi-bin..

    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    Ich habe ein SEO Plugin installiert, aber nichts daran konfiguriert.

    Das verstehe ich nicht:
    - noindex,nofollow gesetzt
    - rel="nofollow" bei den Links angegeben?

    EDIT: Hab mir die Konfiguration nochmal angesehen.. Hatte da doch was verändert.
    Titel, Description und keywords angegeben.

    Und der Rest sieht so aus
     
    #3 dummy, 2. Juli 2008
    Zuletzt bearbeitet: 2. Juli 2008
  4. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    das brauchst du eigentlich nicht,

    um dir zu sagen woran es liegt brauch ich einen link ;)

    lg
     
  5. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Das sieht komisch aus:
    Wenn du keine Permalinks nutzt, also die Seiten über ?p=123 aufrufst, werden die demnach alle nicht indiziert.

    Ein Link zur URL wäre aber schön, dann könnte man sich das direkt im Quelltext anschauen.
     
  6. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Ohh, Je.. Ist mir so peinlich meine Seite anzugeben :oops:.
    Anime - Subs & Cuts

    EDIT: Ich rufe meine Seiten tatsächlich mit /?p=123 auf.. Habe die robots.txt mal geändert.

    User-Agent: *
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/themes
    Disallow: /wp-admin
    Allow: /

    Ich möchte also alles zualssen, außer: /wp-includes, /wp-content/plugins, /wp-content/themes und /wp-admin.
    Ich hoffe das ist so richtig, damit der Seiteninhalt endlich gecrawlt wird.
     
    #6 dummy, 2. Juli 2008
    Zuletzt bearbeitet: 2. Juli 2008
  7. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Muss dir doch nicht peinlich sein. :)

    Da du wie gesagt keine Permalinks nutzt (also ?p=123), muss das hier raus:
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    aus der robots.txt. Dann sollte alles wieder indexiert werden. :)
     
  8. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Vielen dank.
    Werde nun beobachten, wie sich die Änderungen auf das crawling Verhalten auswirken, sobald Google die neue robots.txt annimmt.
     
  9. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Hast du einen Google Webmaster/Sitemaps Account? Darin kann man die Auswirkungen deiner robots.txt schon im Vorfeld testen. :)
     
  10. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Ich habe einen [SIZE=-1]Webmaster-Tools account bei Google. Meinst du das?
    Aber ich finde dort nirgends eine Option Sitemaps im [/SIZE]Vorfeld zu testen. Das Einzige was ich dort sehe ist robots.txt analysieren. Bei Sitemaps habe ich aber noch keine neue Sitemap hoch geladen. Ich lass Google mal selber nach dem Inhalt suchen. Immer wenn ich eine hochlade, gibt es plötzlich Fehler für URLs in XML-Sitemaps. Eigentlich hat Google auch ohne Sitemap immer alle Seiten gefunden. Ich habe erst Probleme mit dem Crawlen, seid dem ich mich mit robots und sitemaps befasse :) ..
     
  11. jottlieb

    jottlieb Well-Known Member
    Ehrenmitglied

    Registriert seit:
    20. August 2005
    Beiträge:
    17.381
    Zustimmungen:
    1
    Ja und haste das mal getestet?
     
  12. dummy

    dummy Well-Known Member

    Registriert seit:
    25. Dezember 2007
    Beiträge:
    286
    Zustimmungen:
    0
    Ja, ich hab es getestet, sieht alles ganz gut aus. Hab gerade mein Googlebot angeschaut, es wurden sogar schon 10 Seiten gecrawlt :).
    Meine geänderte robots.txt wurde vor kurzem auch von google neu runtergeladen.
     
    #12 dummy, 2. Juli 2008
    Zuletzt bearbeitet: 2. Juli 2008
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden