1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Starke Unterschiede in den Statistiken - Warum?

Dieses Thema im Forum "Allgemeines" wurde erstellt von LastOne, 8. September 2008.

  1. LastOne

    LastOne Well-Known Member

    Registriert seit:
    17. Oktober 2005
    Beiträge:
    157
    Zustimmungen:
    0
    Ich hab mal eine Frage an euch. Ich setze neben Semmelstatz inzwischen auch chounter ein. Da ich am überlegen bin mit einem cache plugin zu arbeiten habe ich einen zweiten chcounter mit java eingebunden. Die Werte unterscheiden sich stark. woran liegt das?

    Chcounter-php / Chounter-java / Semmelstatz

    Besucher heute: 87 / 30 / 62

    Seitenaufrufe: 401 / 46 / 226

    Woran liegen diese großen Unterschiede?

    Einstellungen von chcounter sind identisch, das kann es net sein.
     
  2. SuMu

    SuMu Well-Known Member

    Registriert seit:
    5. Januar 2006
    Beiträge:
    6.301
    Zustimmungen:
    84
    hi
    nimm dir noch 3 counter und du hast noch mehr unterschiede :), jeder zählt anders.
     
  3. Alphawolf

    Alphawolf Well-Known Member
    Ehrenmitglied

    Registriert seit:
    31. Mai 2005
    Beiträge:
    3.315
    Zustimmungen:
    0
    - Unterschiedliche Reload-Sperre (z.b. nach welcher Zeit wird ein wiederkehrender Nutzer als neuer erkannt)?
    - Unterschiedliche Einstellungen (werden Bots gezählt?)
    - Tracking-Timeout
    ...
     
  4. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Naja, weil viele sicherheitsbewußte Anwender Java beim Surfen anschalten :)
    Nein, keine Ahnung.

    Gruß
    Ingo
     
  5. cywhale

    cywhale Well-Known Member

    Registriert seit:
    23. Januar 2007
    Beiträge:
    205
    Zustimmungen:
    0
    Als Entwickler eines Statistik-Plugins muss ich Alphawolf und SuMu Recht geben - jeder Zählalgorithmus funktioniert etwas anders, es gibt keinen Standard nach dem Besucher gezählt werden können.

    Falls mit Java Javascript gemeint ist lässt sich die niedrigere Besucherzahl durch deaktiviertes Javascript bei vielen Besuchern erklären.

    Bzgl. Caching hat mir einmal im engl. Forum jemand vorgeschlagen dass das Plugin als externes Script laufen sollte und dass der Aufruf nicht per Javascript sondern mit einem Stylesheet-Link im Header erfolgen solle - gleiches Prinzip, ist aber nicht so oft deaktiviert wie JS. Hinter dem 'Stylesheet' verbirgt sich dann das Statistikscript. Keine Ahnung ob jemand das schon realisiert hat, bin selbst leider noch nicht dazu gekommen. Hätte auch den Nachteil das der wichtige Referer nicht ausgewertet werden könnte da dieser ja dynamisch beim Seitenzugriff vom Browser geschickt wird.

    SuMu hat die relevanten Punkte schon aufgezählt, um einen 'Besuch' zu erfassen wird ein Bestimmter Zeitraum oder Zeitabstand betrachtet, dieser kann je nach Programmierung variieren.
    Ein Counter kann Adminzugriffe mitzählen oder auch nicht, die Erkennung von Robotern (gut/böse) und (Pseudo-)Hackerangriffen/-scripten ist ein eigenes Thema und ist je nach System von unterschiedlicher Qualität - ein System zählt einen Harvesting-Angriff mit 1000 Zugriffen in einer Stunde als 1 Besucher, das nächste als 10 Besucher, ein drittes garnicht. Für Suchmaschinencrawler gilt ähnliches.

    Ein weiterer Unterschied ergibt sich aus der Art der beobachteten Seiten - werden WordPress-generierte 404er mitgezählt, Zugriffe auf trackback.php,...

    Der grosse Unterschied zw. den Seitenaufrufen ist allerdings (abgesehen vom Javascript-Counter) auffällig.

    Grüsse
     
  6. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Ich finde ja, die zuverlässigste Statistik ergibt sich immer noch aus den Server-Logdateien, man muß die Daten halt nur sinnvoll vorverarbeiten und richtig interpretieren.

    Gruß
    Ingo
     
  7. cywhale

    cywhale Well-Known Member

    Registriert seit:
    23. Januar 2007
    Beiträge:
    205
    Zustimmungen:
    0
    Die Server-Logfiles haben den Vorteil dass sie automatisch geschrieben werden (keine zusätzliche Serverbelastung) und Zugriffe auf SÄMTLICHE Dateien aufgezeichnet werden. Durch diese Informationen lassen sich unter Umständen Bots von Besuchern besser unterscheiden - warum z.B. sollte ein angeblicher MSIE 6.0 ausschliesslich 20 Beitrags-URLs aufrufen nicht aber die zugehörigen CSS/JS/Bilddateien - muss ein Bot sein.

    Nachteil ist dass die Informationen limitiert sind - über Scripte lassen sich beliebige Informationen und Auswertungen speichern.
    Und das ist der Knackpunkt - mit 'nur' ist es nicht getan, das ist ein komplexes Themengebiet und ein Statistiksystem kann nicht eben 'nur' mal schnell und simpel geschrieben werden.
    Zwecks der Besucherzahlauswertung - auch bei den Serverlogfiles ist die errechnete Anzahl abhängig vom verwendeten System/Algorithmus mit o.g. Variablen - macht also keinen grossen Unterschied in der Zuverlässigkeit der Angaben.
    Schönes Beispiel was dahinter stecken KANN: Web-Robots Erkennung: Inhalt
     
    #7 cywhale, 9. September 2008
    Zuletzt bearbeitet: 9. September 2008
  8. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Interessanter Link, mit der Robots-Erkennung.

    Die Besucherzahlenauswertung betreibe ich erst gar nicht, eben weil es dafür keine wirklich zuverlässige Möglichkeit gibt.

    Und was für beliebige Informationen sollen denn sonst noch nützlich sein?

    Gruß
    Ingo
     
  9. cywhale

    cywhale Well-Known Member

    Registriert seit:
    23. Januar 2007
    Beiträge:
    205
    Zustimmungen:
    0
    :oops: Von 'nützlich' hab ich nichts gesagt.

    Aber ein Beispiel (eig. Interesse im Moment) wären z.B. die Http-Header und PHP $_SERVER/$_POST-Daten zwecks Spamerkennung/-blockung.
    Auch interessant ist eine Kombination aus Statistik/Besuchermonitor in verbindung mit einem Warnsystem (Harvesting/Scraping/Flooding -> Information des Admin und automatisches Blocken). Über die Serverlogfiles lässt sich das in mehr-oder-weniger Echtzeit nicht realisieren.

    Für eine Auswertung der Besucherinteressen/Ausgabe in den Beiträgen wäre (auf WP bezogen) die Kategorien/Tag/Beitrags-ID oder auch die internen/externen Suchworte interessant. Das lässt sich zwar zum Teil (Suchworte) auch mit den Server-Logfiles machen - die beinhalten aber auch 'nur' (gibt eben nicht mehr) die gleichen Daten (z.B. Request-URI) - die Auswertung muss wieder extern gemacht werden.

    Läuft also auf gleiches Procedere hinaus - Serverlogfiles/Statistiksystem speichern Daten - diese werden dann mehr oder weniger gut ausgewertet.
    Was ich damit eigentlich nur sagen wollte ist dass man bei den Serverlogfiles mit den Daten zurechtkommen muss die geliefert werden, über ein Script hat man etwas mehr Freiheiten. Dafür sind die Logfiles serverschonender und bieten z.B. auch die Dokumentengrösse (Trafficanalysemöglichkeit) mit an.

    In jedem Fall muss jeder selbst entscheiden was er gerne wissen möchte - das kann vom Statistik-Fetischisten über den Puristen (so wenig Info wie nötig) bis hin zu jemandem den das überhaupt nicht interessiert gehen. Genaue und korrekte Besucherzahlen sind eine Frage des Zählsystems und nicht realisierbar, die Einzelzugriffe schon.

    Grüsse
     
  10. Putzlowitsch

    Putzlowitsch Well-Known Member

    Registriert seit:
    21. Oktober 2006
    Beiträge:
    5.955
    Zustimmungen:
    47
    Genau, letztendlich muß jeder selber wissen, wieviel Statistik ihm wichtig ist.

    Generell skeptisch bin ich bei externen Statistik-Diensten, allen voran Google. Wobei ich da nicht so sehr ob der Qualität der Daten bedenken hätte, sondern eher deshalb, weil jeder Seitenzugriff irgendwoanders gespeichert wird.
    Auf der Webseite Google-Analytics einbinden und sich dann über die Datensammelwut von Google-Chrome aufregen, tststs

    Dann schon lieber ein Plugin, welches die Daten auf dem Server beläßt. Gut, sowas ähnliches mache ich ja selbst auch, weil nicht alle Hoster die Logfiles komfortabel und in Quasi-Echtzeit bereitstellen. Schreibe ich halt meine eigenen Logfiles....

    Aber das Thema hatten wir ja schon mal :)
    http://forum.wordpress-deutschland.org/plugin-entwicklung/23145-wp_query-wird-nicht-bei-hauptdomain-aufgerufen.html

    Gruß
    Ingo
     
  11. cywhale

    cywhale Well-Known Member

    Registriert seit:
    23. Januar 2007
    Beiträge:
    205
    Zustimmungen:
    0
    Hmnja, lang ist's her :)
    Mittlerweile bin ich der Meinung das die Robotererkennung (gut/böse) ein ganz grosses Problem der Plugin-Statistiksysteme ist. Wenn das einigermassen funktioniert könnte man IMHO zumindest einen grob zuverlässigen Überblick über Besucherzahlen generieren, immer abhängig natürlich vom spezifischen Zeitintervall/Webseitentyp/Besucherverhalten. Ich glaube, jetzt wird's endgültig offtopic. Entschuldigung.
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden