1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Googlebot erstellt selbst Suchanfragen

Dieses Thema im Forum "Netzwelten" wurde erstellt von Putzlowitsch, 23. Januar 2008.

  1. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Für mich klingt die Google-Toolbar-Theorie überhaupt nicht schlüssig :)
    Meine Auswertung der Logfiles hat ergeben, das wie oben bereits erwähnt, Google bisher 2155 mal meine Blogsuche mit 770 unterschiedlichen Wörtern befragt hat. Normale Nutzer haben bisher 136 mal nach 103 verschiedene Wörtern (und Wortkombinationen, das macht Google nicht) gesucht. Es gibt aber nur ganze 9 (in Worten: neun) Überschneidungen.

    Gruß
    Ingo
     
  2. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Ich probiere das jetzt auch mal mit dem SearchMeter Plugin zum Abgleichen. :)

    Hier gibt's übrigens ähnliche Meinungen wie hier: Googlebot going through internal search forms

    Auch interessant: Google indexing large volumes of (unlinked?) dynamic pages
    (Ich weiß, viel zu lesen :))..

    Was mich wundert ist, dass überall gesagt wird, dass Google nie ein Formular abschicken wird (es sei denn, du willst es für geschützte Seiten). Offenbar hat sich dies aber geändert, wenn ich mir dieses Patent anschaue: United States Patent Application: 0060230033
    Ich kann mir aber dennoch nicht vorstellen, dass der Bot zufällige Abfragen ausführt, sondern dass die irgendwo herkommen und Google sie nur ausführt, und so vielleicht "menschlicher" agieren soll (indem er "human queries" crawlt). Das würde IMO wieder für die Toolbar/Analytics Theorie sprechen.. leider bisher nur eine Theorie.
     
    #22 Alphawolf, 31. Januar 2008
    Zuletzt bearbeitet: 31. Januar 2008
  3. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Naja, zumindest zeigen mir die Links, das ich nicht der einzige bin, der das beobachtet hat und sich darüber Gedanken macht.

    Wobei ich die Toolbar/Analytics-Theorie wohl irgendwie noch nicht ganz verstanden habe. Ich verwende weder das eine, noch das andere.

    Gruß
    Ingo
     
  4. spickzettel

    spickzettel Well-Known Member

    Registriert seit:
    19. Januar 2006
    Beiträge:
    1.848
    Zustimmungen:
    0
    Das (aus dem zweiten Link) scheint mir auch plausibel:

     
  5. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Das ist ja im Prinzip genau das, was ich behaupte "Googlebot erstellt selbst Suchanfragen" :)

    Er nimmt halt nicht nur Links, die er irgendwann mal irgendwo "gesehen" hat, sondern baut mit den GET-Variablen und der Wortliste selbständig Anfragen zusammen. Das Google niemals nicht selbständig Formulare ausfüllt, kann man also so nicht mehr sagen.

    Gruß
    Ingo
     
  6. ben

    ben Well-Known Member

    Registriert seit:
    15. Juni 2005
    Beiträge:
    426
    Zustimmungen:
    0
    dies kommt bei mir auch vermehrt vor.

    ich würde mir das so erklären:

    google möchte ihre suchergebnisse verbessern, und vielleicht irgendwie eine art semantische suche aufbauen.

    wenn der G-bot auf ein wort stößt, welches auf dem weblog ungewöhnlich oft vorkommt, oder gar gänzlich neu ist, dann versucht der bot herauszufinden, was mit diesem wort zu tun haben könnte. also versucht er ein möglichst eng verwandtes vokabular zu identifizieren. und wo sucht man besser, als an der quelle selbst?

    google könnte zwar auch den eigenen index durchsuchen, allerdings schätzt man bei google die treffgenauigkeit wohl als besser ein, wenn man die seiteneigene suche nutzt. Diese ist nämlich aktueller, und liefert wohl auch mehr ergebnisse, als im google index zu finden sind.
     
  7. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
  8. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Vielleicht macht Google das, aber zumindest bei mir scheint das nicht der Fall zu sein, zumindest sagen das meine Logs. Ich werd Google mal anschreiben, vielleicht sagen die es mir ja. ;)

    "Ja, auf Ihrer Seite testen wir das seit geraumer Zeit, da wir so Ihren AdSense CTP-Wert in die Höhe treiben sollen.." :oops: :mrgreen:
     
    #28 Alphawolf, 11. Februar 2008
    Zuletzt bearbeitet: 11. Februar 2008
  9. Gast 13043

    Gast 13043 Gast

    Gute Idee. Gleich bei mir eingestellt
     
  10. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Eine weitere Möglichkeit ist dies hier: Google mit Suchfeldern in den Serps

    Obwohl die Seite, um die es bei mir geht, nicht sonderlich groß ist (~ 500 Seiten), weshalb die für mich sicherlich kein solches Suchfeld vorsehen werden.. :( :p
     
  11. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Ja, das klingt plausibel. Das Suchfeld wird zwar nun nicht bei jeder kleinen Seite auftauchen, aber technisch gesehen macht Google-Bot da wohl erstmal keinen Unterschied. Ist letztendlich auch egal, zumindest kann nicht mehr behauptet werden, Goolge würde niemals nicht selbständig Formulare ausfüllen. Was anderes ist ja so ein Suchlink auch nicht.

    Gruß
    Ingo
     
  12. oio

    oio Well-Known Member

    Registriert seit:
    16. Februar 2008
    Beiträge:
    96
    Zustimmungen:
    0
    der grund dafür kann sein, dass ihr eine sitemap.xml / siteinfo.xml bereitstellt, in der die such-url an google übermittelt wird ;)
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    diese nutzt google dann auch.
     
  13. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Ach Du warst das, der bei mir versucht hat, eine sitemap.xml aufzurufen :)
    Gibts bei mir aber nicht, auch keine siteinfo.xml.

    Gruß
    Ingo
     
  14. oio

    oio Well-Known Member

    Registriert seit:
    16. Februar 2008
    Beiträge:
    96
    Zustimmungen:
    0
    jup :D
    ich dachte, ich guck mal nach ...
     
  15. chrisostomos

    chrisostomos Well-Known Member

    Registriert seit:
    13. Januar 2008
    Beiträge:
    73
    Zustimmungen:
    0
    Google scheint wohl doch Suchen selbst auszuführen:
    Quelle
     
  16. codestyling

    codestyling WPD-Team

    Registriert seit:
    30. März 2008
    Beiträge:
    1.904
    Zustimmungen:
    0
    Google Toolbar und FireFox Plugins wie LivePR oder AlexaRank

    Für alle zur Information: Diese Browsererweiterungen fragen bei jedem Seitenabruf des Browser bei eingeschalteter PR/AlexaRank Anzeige den PR/AlexaRank der aktuell angesuften Seite an.
    Wenn also Google oder Alexa eine Rank Anfrage per Toolbar oder Plugin bekommen (was auch nichts anderes als eine HTML get/post Anfrage ist) und sie die Seite nicht kennen aber deine anderen Seiten bereits halbwegs gerankt sind, dann schicken sie umgehend den Bot vorbei.
    Wenn also ein Besucher deiner Seite mit einer Toolbar/Plugin surft und bei dir die Suche im Blog verwendet, dann führt das u.U. zum Spidern der Suchanfragen, da die besagten Urls "/?s=xxxx" so durch die Toolbar/Plugins für die Rankanfrage durchgereicht werden noch ehe deine Domain die Anfrage bekommt.
    Auf diese Weise spidern die auch den Admin Login, wenn man diese Toolbars/Plugins an hat, während man sich einloggt.
    Abhilfe schafft da nur das Aussperren per .htaccess Datei.
     
  17. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Sehr lustig finde ich die Aussage beim offiziellen Statement:
    "high-quality site" und "small number of queries", ist natürlich immer eine Frage, was das bedeutet. Zumindest hat der Googlebot bei mir bisher 770 verschiedene Stichwörter insgesamt 4800 mal abgefragt.
    Viele Wörter hat er nur ein- oder zwei zweimal gecrawlt, es gibt aber auch ein paar Lieblingswörter, die er immer wieder abfragt z.B.:
    putzlowitsch, gerech, zune, jappy, zutreten und fäll.

    Und nein, die 770 Wörter haben bestimmt keine User dadurch an Google übermittelt, das sie diese bei mir gesucht haben und dabei die Google-Toolbar oder ein Pagerank-Tool am Start hatten.

    Ist auch egal, von mir aus soll Google das meinetwegen machen. Wenn es Besucher auf meine Seiten bringt, bitte schön :)

    Gruß
    Ingo
     
  18. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    nee:(

    Google schickt dann Deine Seite wegen zuviel internen doppelten COntent ins Nirvana

    :evil: ..verursachen es selber und *bestrafen* dann

    sperr ihn per robots.txt für sowas aus

    ist besser ....

    lg
     
  19. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Och doch, mir ist das echt recht :)
    Ich habe schon so genug doppelten Content drin, da kommt es dann darauf auch nicht mehr an.
    • Der Kalender enthält Links auf jeweils einen Tag meines Blogs. Da ich meist nur einen Artikel pro Tag schreibe, sind diese Tagesarchive weitestgehend identisch mit dem jeweiligen Einzelartikel => DC
    • Das Monatsarchiv enthält auch alle Artikel nochmal => DC
    • Die Kategorie-Links enthalten ebenso alle Artikel, zwar in anderer Zusammenstellung, aber dennoch mit selben Inhalten => DC
    • Auch die Tags ergeben wieder, wie bei Kategorien, anders zusammengestellte, aber dennoch gleiche Inhalte => DC
    Wenn man so will, sind diese von Google generierte /?s=xyz Abfragen dynamisch erstellte Tags. Genau den selben Effekt hätte ich, wenn ich eben dieses xyz als Tage bei den Beiträgen vergebe, in denen es auch vorkommt.

    Vielleicht noch als kleiner Nachtrag. Ich gebe bei mir auf allen Archiv-, Kategorie- oder Tagseiten immer die kompletten Inhalte so wie auf der Startseite aus, gegebenfalls nur beim <!--more--> abgetrennt.

    Gruß
    Ingo
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden