1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Was gehört in die robots.txt?

Dieses Thema im Forum "Konfiguration" wurde erstellt von ne-r-o, 23. Juli 2005.

  1. ne-r-o

    ne-r-o New Member

    Registriert seit:
    23. Juli 2005
    Beiträge:
    1
    Zustimmungen:
    0
    Hi,

    ich habe WP seit ca. 4-5 Wochen installiert und seit ein paar Tagen wird mein Blog auch bei Google gefunden,
    aber es werden auch ein paar Seiten gefunden die bei Google und Co. nix verloren haben z.B. wp-login.php und wp-register.php.

    Welche Dateien und Verzeichnisse, muss ich in die robots.txt "sperren" damit nur noch die Startseite, Beiträge, Statische Seiten, Kategorien und Archive gefunden werden?
    Ist es sinnvoll an die Hyperlinks, die nicht gefunden werden sollen, ein rel="nofollow"-Attribut einzufügen?
     
  2. Johannes Ries

    Johannes Ries Well-Known Member

    Registriert seit:
    28. Februar 2005
    Beiträge:
    301
    Zustimmungen:
    0
    Keine Antwort auf deine Frage aber nur kurz: Eigentlich kein Problem, weil ohne Passwort kommt eh niemand in deinen Adminbereich und wenn du die Möglichkeit nicht per Admin erlaubst, kann sich auch niemand einfach so registrieren.
     
  3. FinanzenTomate

    FinanzenTomate Well-Known Member

    Registriert seit:
    10. Dezember 2004
    Beiträge:
    97
    Zustimmungen:
    0
    Impressum von Indexierung ausschließen

    Mich würde interessieren, wie ich mein Impressum von der Indexierung durch Google ausschließen kann. Ich habe es als »statische Seite« eingebaut. Es geht nur um den Ausschluss dieser einzigen Seite. Wie muss die betreffende Zeile in der Datei »robots.txt« lauten?
     
  4. MCardy

    MCardy Well-Known Member

    Registriert seit:
    24. August 2005
    Beiträge:
    50
    Zustimmungen:
    0
  5. suedkind

    suedkind Well-Known Member

    Registriert seit:
    5. Oktober 2004
    Beiträge:
    1.665
    Zustimmungen:
    0
    ich verstehe nicht so ganz wo du da ein problem hast

    1) das indexieren kannst du am besten damit verhindern, dass du sie nicht verlinkst, dein login wirst du ach so finden, liegt ja eh immer unter /wp-admin/

    2) wenn es dir um sicherheit geht, würde ich dir empfehlen dein /wp-admin/ verzeichnis mit einem passwort zu schützen
    habe es noch nie bei wordpress gemacht, keine ahnung, ob das seiteneffekte hat
     
  6. Johannes Ries

    Johannes Ries Well-Known Member

    Registriert seit:
    28. Februar 2005
    Beiträge:
    301
    Zustimmungen:
    0
  7. alternative4

    alternative4 Active Member

    Registriert seit:
    26. August 2005
    Beiträge:
    41
    Zustimmungen:
    0
    google kümmert sich ohnehin herzlich wenig um die robot.txt
     
  8. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    das kann ich nicht bestätigen,
    jede meiner robots.txt Dateien wurde immer noch von Google respektiert.

    lg
    Monika
     
  9. alternative4

    alternative4 Active Member

    Registriert seit:
    26. August 2005
    Beiträge:
    41
    Zustimmungen:
    0
    dann hast du glück. verlassen kann man sich darauf aber in keinem fall. google nimmt auch permanent änderungen an den eingesetzten verfahren vor, die niemand zu 100% durchschaut.
    außerdem gibt es ja nicht nur google.
     
  10. FinanzenTomate

    FinanzenTomate Well-Known Member

    Registriert seit:
    10. Dezember 2004
    Beiträge:
    97
    Zustimmungen:
    0
    robots.txt

    Hallo MCardy,

    Danke, dass du mir die Suche über Google abgenommen hast. Meine »robots.txt«-Datei hat jetzt den folgenden
    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    Hallo alternative4,
    Es gibt schon Pläne für eine europäische Google-Konkurrenz.
     
  11. alternative4

    alternative4 Active Member

    Registriert seit:
    26. August 2005
    Beiträge:
    41
    Zustimmungen:
    0
    Hallo Finanzen Tomate,

    ja das wird auch zeit. ich selber fahre z.b. zur zeit mit msn wesentlich besser als mit google.

    google übertreiben es in letzter zeit doch sehr mit ihrem monopol denken.
     
  12. Johannes Ries

    Johannes Ries Well-Known Member

    Registriert seit:
    28. Februar 2005
    Beiträge:
    301
    Zustimmungen:
    0
    Google erkennt übrigens die robots.txt an.

    http://www.google.com/intl/de/webmasters/bot.html

    Nofollow natürlich auch:
     
  13. eyetag

    eyetag Well-Known Member

    Registriert seit:
    1. April 2005
    Beiträge:
    98
    Zustimmungen:
    0
    hallo!

    gibt es sowas wie eine 'optimale' robots.txt?

    ich möchte alle gängigen suchmaschinen aussperren. natürlich auch gerne 'böse' crawler/spider. die sind für mich aber nicht in erster linie wichtig, scheint wohl auch nicht allzu einfach zu sein. mir geht es vor allem darum, die großen, populären suchmaschinen auszusperren (google, yahoo, msn und konsorten).

    bloglistings können eigentlich gerne drinbleiben. soweit ich das ganz ganze thema verstanden habe, müsste ich dafür ja alle trackbacks/pingbakcs und den update service deaktivieren, die ich aber eigentlich beibehalten möchte für verlinkungen mit anderen blogs.
    kann man das ganze nicht auch über ein plugin lösen, bspw. eins, das die robots.txt verwaltet und aktuell hält???
     
  14. blackstar511

    blackstar511 Active Member

    Registriert seit:
    3. Februar 2006
    Beiträge:
    44
    Zustimmungen:
    0
    Also meiner Meinung nach wirst du die grossen Suchmaschinen nicht aussperren können.
    Jeder Link zu deiner Seite, egal wo er auftaucht, ob hier im Forum oder in den Bloglisten, führt Suchmaschinen zu deiner Seite, sofern diese Seiten von Suchmaschinen gecrawlt werden.

    Du kannst es natürlich über die robots.txt versuchen:

    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    Und dann natürlich noch in deiner index.php im header bereich

    Code:
    Entschuldige, aber du musst dich registrieren oder anmelden um den Inhalt sehen zu können!
    So das ist alles was mir dazu einfällt :) Viel Glück !

    Grüße Blackstar
     
  15. eyetag

    eyetag Well-Known Member

    Registriert seit:
    1. April 2005
    Beiträge:
    98
    Zustimmungen:
    0
    das war alles, nur die paar zeilen?
     
  16. blackstar511

    blackstar511 Active Member

    Registriert seit:
    3. Februar 2006
    Beiträge:
    44
    Zustimmungen:
    0
    JA, das ist alles.

    # No robot will spider the domain
    User-agent: * bedeutet alle spiders
    Disallow: / bedeutet alles verboten

    Ziemlich einfach oder ;)
     
  17. eyetag

    eyetag Well-Known Member

    Registriert seit:
    1. April 2005
    Beiträge:
    98
    Zustimmungen:
    0
    hält mir das auch google, yahoo, msn etc. vom hals?
    nach allem, was ich bisher gelesen habe, dachte ich das wär alles viel schwieriger...
    :confused:
     
  18. blackstar511

    blackstar511 Active Member

    Registriert seit:
    3. Februar 2006
    Beiträge:
    44
    Zustimmungen:
    0
    Ja, manchmal sind Dinge wirklich einfach. Ist nur die Frage ob sich die spiders auch da dran halten .....
     
  19. eyetag

    eyetag Well-Known Member

    Registriert seit:
    1. April 2005
    Beiträge:
    98
    Zustimmungen:
    0
    aber die suchmaschinen tun es, oder?
     
  20. blackstar511

    blackstar511 Active Member

    Registriert seit:
    3. Februar 2006
    Beiträge:
    44
    Zustimmungen:
    0
    Das kann ich dir nicht beantworten!
    Generiere einfach mal eine robots.txt wie oben beschrieben und schau deine Statistiken an ob Google und Konsorten noch vorbeischauen ....

    Warum willst du die eigentlich fernhalten? Das habe ich noch nicht ganz kapiert.
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden