1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Googlebot erstellt selbst Suchanfragen

Dieses Thema im Forum "Netzwelten" wurde erstellt von Putzlowitsch, 23. Januar 2008.

  1. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Die meisten Blogs bieten ja eine Suchfunktion, aufgerufen wird dann eine URL, die ungefähr so aussieht:
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    Heute ist mir aufgefallen, das der Googlebot genau solche Suchanfragen einfach selber erzeugt. Hier mal ein Auszug aus der Logdatei:
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    Ich frage mich nun, was Google damit bezweckt. Hat jemand sowas auch schon mal beobachtet?

    Gruß
    Ingo
     
  2. Arno Simon

    Arno Simon Well-Known Member

    Registriert seit:
    30. November 2005
    Beiträge:
    2.170
    Zustimmungen:
    0
    google scheint dein suchformular als solches zu erkennen und dann für benutzeranfragen zu benutzen.

    es kommt häufig vor, das in google-suchergebnisses die ergebnisse von sites auftauchen, welche zuvor von google gespidert wurden.

    wenn derjenige der bei google die suchanfrage gestellt hat, auf den link klickt gehen bei ihm direkt die suchergebnisse deiner seite auf.....

    vG

    Arno
     
  3. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Sind das Keywords aus deiner Website oder willkürliche, die der Googlebot da durchsucht? Ich könnte mir auch vorstellen, dass die Anfragen irgendwie für die Google Webmaster-Tools Statistiken genutzt werden. Oder sie nutzen die Daten irgendwie für Blogger, das Google ja unlängst gekauft hat.
     
  4. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Ja, das sind alles Wörter, die auch auf meiner Webseite vorkommen. Das Google da keine willkürlichen Sachen nimmt, habe ich an einem falsch geschrieben Wort gemerkt, was in der Form sonst in freier Wildbahn nicht auftritt.

    Wenn Google mein Suchformular erkennt, dürfte das ja dann auf Millionen andere Blogs auch zutreffen. Vielleicht kann ja mal jemand im Serverlog nachsehen, ob er auch sowas drin hat. Bei mir traten diese Einträge erstmalig am 23. Oktober 2007 auf

    Gruß
    Ingo
     
  5. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Ja, ich habe sowas auch drin... bei mir aber bei jedem Durchlauf nur ein Suchwort, dafür aber regelmäßig alle paar Stunden.
     
  6. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Aha, danke.

    Der Witz ist, das Google für mein Kunstwort "Posaunenpause" dann in der Trefferliste für "die Suche unter Einbeziehung der übersprungenen Ergebnisse wiederholen" einen Link mit [SIZE=-1]/?s=unaufmerksamkeit ausgibt.
    Gut, das Wort "Unaufmerksamkeit" kommt im selben Beitrag auch vor, nur warum wird nicht [/SIZE][SIZE=-1]/?s=[/SIZE]Posaunenpause[SIZE=-1] verwendet, was doch viel näherliegend wäre. Irgendwie will sich mir der Sinn nicht so ganz erschließen.

    Kann auch sein, daß das Ganze irgendwas noch nicht bekanntes aus dem Google-Labor in Testbetrieb ist.

    Gruß
    Ingo
    [/SIZE]
     
    #6 Putzlowitsch, 23. Januar 2008
    Zuletzt bearbeitet: 31. Januar 2008
  7. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    sperre dies per robots.txt aus, zumindest die Indexierung

    das sind de facto keine Suchanfragen des google bots, sondern er sucht nach diesen Seiten weil die mal im Index gelandet sind und er sie wieder abgrasen mag...


    Disallow: /?s*

    lg
     
  8. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Die Frage ist halt, wie sind sie in den Index gekommen? Ich hatte bestimmt noch nie irgendwo einen Link mit so einer Suche auf meine eigenes Blog. Der Bot verfolgt ja normalerweise Links, die er irgendwo findet. Hier scheint er sie sich aber selbst ausgedacht zu haben. Das finde ich etwas merkwürdig.

    Gruß
    Ingo
     
  9. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    link nicht aber im Index können sie ja auch so sein,

    ist mir mit der Ajax Suche so passiert-- sonst tät ichs net wissen :oops:

    lg
     
  10. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47

    Das verstehe ich jetzt nicht. Wenn der Googlebot bei mir eine Adresse wie z.B. [SIZE=-1]/?s=posaunenpause abruft, woher weiß er denn, das es diese gibt? Sie muß ja irgendwo mal aufgetaucht sein, oder er "denkt" sie sich halt alleine aus.
    Er weiß ja, welche Wörter es überhaupt auf meiner Seite gibt und probiert diese als Suchparameter bei meiner Blogsuche durch. Es ist ja nicht nur ein Wort, es sind hunderte. Und eben auch Sachen, die es auf Grund von Schreibfehlern oder "Wortschöpfungen" sonst in den Weiten des Internet nicht gibt (außer eben bei mir).

    Und was ist denn eine Ajax-Suche? Zumindest verwende ich sowas bei mir nicht.

    Gruß
    Ingo
    [/SIZE]
     
  11. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    das da ist eine URL

    /?s=branchenriesen

    der Googlebot füllt keine Formulare aus und holt sich dann die URL, also hat die wer anderer erzeugt und er findet sie jetzt -oder auch nicht

    lg
     
  12. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Nur wer erzeugt die dann und warum? Ich war es jedenfalls nicht. Immerhin hat Alphawolf ja auch gesagt, daß er solche Logeinträge hat. Wahrscheinlich andere auch. Da ist also irgendwo jemand, der für irgendwelche Blogs Such-URLs erzeugt und Google damit füttert.

    Naja, ich werde das mal weiter beobachten.

    Gruß
    Ingo
     
  13. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
  14. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
  15. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Neee, das kann ich mir nicht vorstellen:
    "Also das sind nur normale Suchanfragen von Usern" (sven s. im dortigen Forum).

    Google-Toolbar gut und schön, aber wer soll den bitte nach mehreren 100 Stichwörtern in meinem Blog suchen, einschließlich nach meinen "Wortschöpfungen" und Schreibfehlern. Und selbst wenn, damit die Googletoolbar diese Blogsuchen vom Nutzer indiziert, muß der Nutzer diese Anfrage ja auch wenigstens einmal zu mir abgeschickt haben. Und dann würde ich sie auch im Serverlogfile finden müssen, da sind aber keine.

    Gruß
    Ingo
     
  16. spickzettel

    spickzettel Well-Known Member

    Registriert seit:
    19. Januar 2006
    Beiträge:
    1.848
    Zustimmungen:
    0
    Vermutlich handelt es sich um eine Qualitätssicherungsmaßnahme. Vielleicht wird so geprüft, ob "echte" Suchergebnisse erscheinen und nicht irgendwelche computergenerierten, gecloakten oder sonstwie die Googleergebnisse manipulierenden Sachen. Das passt dann zu dem anderen Thread mit den unsinnigen URLs, die ich selbst auch schon kenne.
     
  17. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Das mit den unsinnigen URLs verstehe ich ja noch. Um die Reaktion auf Fehler zu testen, scheint das auch sinnvoll zu sein. Allerdings habe ich das noch nicht beim Googlebot beobachtet.

    Aber wozu sollte Google die Ergebnisse meiner Blogsuchfunktion überprüfen wollen. Was soll man denn da manipulieren?

    Ich habe mal ein wenig Statistik betrieben. Seit Ende Oktober 2007, das trifft fast auf den Tag genau mit dem einjährigen bestehen meines Blogs zusammen, hat der Googlebot 2131 mal meine Suchfunktion mit 771 unterschiedlichen Wörtern aufgerufen. Das geht von A wie abblitzen, abhängenden, abmahnen über handygespräch, markenrechtsklage, pharmakonzerne bis zu Z wie zurechtgefriemelt, zuschauermagnet, zutreten. Letzteres wurde übrigens mit 13 mal bisher am häufigsten vom Googlebot "gesucht".

    Gruß
    Ingo
     
  18. spickzettel

    spickzettel Well-Known Member

    Registriert seit:
    19. Januar 2006
    Beiträge:
    1.848
    Zustimmungen:
    0
    Das spricht für dich, dass deine Fantasie nicht so weit geht :)

    Ich habe das schon mal irgendwo diskutiert gesehen, finde das aber nicht mehr wieder. Aber das hier geht in diese Richtung: [1] [2] [3]
     
  19. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    Hmm, wenn Google selbst in seine Guideline schreibt, dass man Suchergebnisse vom Crawler aussperren soll
    (Search results in search results)

    .. dann frage ich mich, warum der Bot diese Formulare dann ausfüllt und sie in den Index aufnimmt. Das ließe sich doch von Google-Seite schon verhindern..?

    Für mich klingt dabei dann die Google Toolbar Idee am schlüssigsten irgendwie (obwohl es schon komisch ist, dass deine Wortschöpfungen gesucht werden). Man müsste dazu mal mit diesem Plugin gegenchecken, welche Wörter die User in das Suchform eintragen und suchen und welche Wörter der Googlebot einträgt. Vielleicht gibt's da ja ne Kongruenz. :)
     
    #19 Alphawolf, 31. Januar 2008
    Zuletzt bearbeitet: 31. Januar 2008
  20. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Sind ganz interessante Links, obwohl ich nicht alles vollständig gelesen habe. Besonders [3] ist ja mächtig schön lang.

    Falls es tatsächlich nur um das Überprüfen der Suchergebnisse auf Manipulationen geht, verstehe ich nicht, warum Google dann ausschließlich Wörter für den Test nimmt, die ohnehin auf meiner Seite zu finden sind. Wenn ich Google wäre, würde ich ja eher nachschauen, was bei Wörtern passiert, die es nicht auf der Seite im normalen Inhalt gibt.

    Und warum nimmt Google dann solche Blogsuch-Ergebnisse in die eigenen Suchergebnisse auf? Zumal mit anderen Sichwörtern, als die Googlesuche selbst, hier mal das Beispiel mit der "Posaunenpause":
    http://putzlowitsch.de/images/google-posaunenpause.png

    Gruß
    Ingo
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden