Bye bye Google Analytics: statistische Webseiten-Analyse ohne Cookies dank Machine Learning

Bye bye Google Analytics: statistische Webseiten-Analyse ohne Cookies dank Machine Learning
Fachartikel

Bye bye Google Analytics: statistische Webseiten-Analyse ohne Cookies dank Machine Learning

24. September 2021, gepostet von

Ist Ihnen schon einmal aufgefallen, dass Sie beim ersten Aufruf einer Webseite dazu aufgefordert werden, die voreingestellten Cookies zu akzeptieren bzw. eigene Einstellungen vorzunehmen? Haben Sie sich bei der Auswahl der Konfiguration auch tatsächlich damit befasst, welche der gesammelten Daten beispielsweise an Drittunternehmen weitergeleitet werden?

Als bewusste/r Internetnutzer/in haben Sie den Hinweis zum Datenschutz mit Sicherheit befolgt und bemerkt, dass auf fast allen Webseiten das Tracking-Tool Google Analytics zur Auswertung des Benutzerverhaltens eingesetzt wird. Da das Tracking jedoch keinen essenziellen Bestandteil zum Betrieb des Internetsauftrittes darstellt, müssen User dieser Funktionalität seit der Einführung der E-Privacy-Richtlinie der EU im Vorfeld aktiv zustimmen.  

Aus Sicht des Webseitenbesuchers ist die Umsetzung der sogenannten „Cookie-Richtlinie“ zweifellos ein Vorteil, schließlich kann er nun selbst steuern, welche der gesammelten Daten zu welchem Zweck genutzt werden dürfen. Unternehmen hingegen werden vor die Herausforderung gestellt, dass Webseiten-Analysen über Google Analytics gegebenenfalls nicht mehr die Realität abbilden, wenn immer mehr User das Tracking durch das amerikanische Unternehmen Google unterbinden. 

Auch Google ist nicht allwissend 

Wer sich in der Vergangenheit bei der Analyse von Webseiten auf Google Analytics verlassen hat, war mit großer Wahrscheinlichkeit davon überzeugt, dass die präsentierten Zahlen auch die Realität widerspiegeln. Google und dessen „allwissende“ Suchmaschine – da müssen die Auswertungen doch stimmen. Dabei weiß auch Google nur das, was vom Browser an Daten übertragen wird. Blockiert der Besucher das Tracking der Webseitenzugriffe durch Google Analytics in den Cookie-Einstellungen, tauchen diese Zahlen logischerweise auch nicht in den Reports auf.

Solange der Einbruch der Zugriffszahlen nicht dramatisch ist, fallen fehlende Werte kaum auf. In den Auswertungen der Makro Factory zeigte sich jedoch ein deutlicher Abwärtstrend:

Einbruch der Aufrufzahlen in Google Analytics
Einbruch der Website-Zugriffe in Google Analytics

Cookie-Einstellungen verhindern korrekte Trafficmessung

Die Möglichkeit der manuellen Cookie-Einstellung hat dazu geführt, dass die herkömmliche Webseiten-Analyse über Google Analytics nicht mehr den gesamten Traffic auf der Website erfassen kann – und das stellt für Online-Marketing Spezialisten, die ihre Marketingaktivitäten auf Basis dieser Zahlen planen, ein ernstzunehmendes Problem dar. Die Differenz zwischen erhobenen und tatsächlichen Zugriffen kann im schlimmsten Fall zu falschen Rückschlüssen führen, sodass Maßnahmen getroffen werden, die weder nötig noch zielführend sind.


Intelligente Lösung für das Marketing- & Vertriebscontrolling gesucht?

Ziehen Sie in Zukunft objektive Kriterien als Grundlage für Ihre Entscheidungen heran und hören Sie auf damit, sich ausschließlich auf Ihr Bauchgefühl zu verlassen. Mehr zu MakroMarket


Dazu ein kleines Beispiel:
Besucher, die sich auf einer Website zum Thema IT-Sicherheit informieren möchten, sind oftmals für das Thema Datenschutz sensibilisiert. Wir vermuten, dass diese Nutzer das Tracking durch Google Analytics konsquent blockieren. In der Auswertung der Website zeichnet sich schnell ein negativer Trend bei allen Seiten mit sicherheitsrelevanten Produkten ab. Um diesem Trend entgegenzuwirken, werden die Inhalte einzelner Seiten überarbeitet, obwohl ggf. gar keine Anpassungen nötig wären. Möglicherweise verschlechtert sich dadurch sogar das Ranking bei Google und es kommen effektiv weniger Besucher auf die Seite.

Webseiten-Analyse mit Hilfe der Log Files 

Doch was tun, wenn man sich auf das standardmäßig eingesetzte Analysewerkzeug nicht mehr verlassen kann? Die Antwort liegt in Ihrer Schublade. Besser gesagt, in den Log Files, die serverseitig gespeichert werden und alle relevanten Informationen enthalten.  

Über eine Log File-Analyse lassen sich die alle Zugriffe nachvollziehen und es gibt in puncto Datenschutz auch keine rechtlichen Bedenken, sofern die Datenschutzerklärung über das Speichern der Daten aufklärt. Das Problem bei einer Webseiten-Analyse über Log Files liegt jedoch darin, dass die Daten in Rohformat gespeichert werden und einige, teils komplizierte Vorbereitungen getroffen werden müssen, um die relevanten Werte zu extrahieren.

Beispiel: Log Files im Rohformat

Der erste Schritt, die Informationen in Spalten aufzuteilen, ist noch einfach, da in der Regel standardisierte Log-Formate genutzt werden, sodass abgelesen werden kann welche Informationen an welcher Stelle stehen. Schwieriger jedoch wird es, Crawler und Bots in den Log Files zu identifizieren, da diese für die Auswertungen nicht von Bedeutung sind. An diesem Punkt kommt Machine Learning ins Spiel. 

Machine Learning Verfahren zur Crawler-Identifikation 

Jeden Tag besuchen sogenannte Crawler (automatisierte Programme zum Auslesen der Daten) die Webseite, um relevante Informationen aufzuspüren. Das können einerseits „gutartige“ Crawler sein, beispielsweise von Suchmaschinen wie Google oder Bing, die wesentliche Daten für das Ranking etc. sammeln, oder aber „bösartige“ Crawler, die unerlaubter Weise versuchen Informationen auszuspionieren. Im schlimmsten Fall senden diese automatisierten Programme so viele Anfragen an den Server, dass dieser überlastet ist und die Ladegeschwindigkeit der Webseiten negativ beeinflusst.

Während sich gutartige Crawler über das Feld „User Agent“ in den Log Files zu erkennen geben, versuchen bösartige Crawler sich zu tarnen, um nicht blockiert zu werden. Werden diese Zugriffe nicht aufgespürt, fließen sie ungefiltert in die Webseiten-Analyse mit ein und verfälschen die Daten. 

Machine Learning Algorithmen helfen dabei Muster in den Zugriffen zu erkennen, wodurch Crawler jeglicher Art anhand ihres Verhaltens identifiziert werden können. Dafür werden die einzelnen Zugriffe nach User Agents und IP-Adressen gruppiert, in Sessions eingeteilt und über einen Zeitraum von ca. 30 Minuten betrachtet. Auf diese Weise werden Charakteristika sichtbar, die Hinweise liefern, ob es sich bei den Zugriffen um echte Menschen oder Crawler handelt. Solche Merkmale sind unter anderem: 

  • Wie viele Seiten wurden in einer Session aufgerufen?
    Crawler besuchen in der Regel mehr Seiten als reale Besucher, da möglichst alle Informationen abgegriffen werden sollen.
  • Wie viele Bilddateien wurden geladen?
    Crawler laden in vielen Fällen nur die Quelltexte, während reale Besucher über den Browser automatisch auch Bilddateien herunterladen.
  • Wurde die „robots.txt“ aufgerufen?
    Die „robots.txt“ ist eine Datei, die Crawlern Informationen liefert, welche Daten automatisiert gespeichert werden dürfen. Menschen besuchen diese Seite normalerweise nicht. 

Es gibt noch viele weitere Besonderheiten, die Aufschluss darüber geben, ob es sich um Crawler oder reale User handelt, die im individuellen Fall genutzt werden können. Ist der Machine Learning Algorithmus einmal antrainiert, lassen sich die Sessions mit einer Genauigkeit von über 90 % als Mensch oder Maschine klassifizieren.

Fazit: Die Auswertung der Log Files mithilfe von Machine Learning als Alternative zu Google Analytics hat den Vorteil, dass Webseiten-Analysen trotz verschärfter Cookie-Einstellungen nicht gestört werden. Darüber hinaus lassen sich zudem ganz spezifische Einstellungen einrichten, welche Informationen gesammelt und welche nicht gesammelt werden sollen. 

Marketing-Reportings mit MakroMarket

MakroMarket, die Business Intelligence-Lösung der Makro Factory für Marketing- und Vertriebscontrolling, setzt bei der Auswertung des Nutzerverhaltens bereits die Log File Analyse anstatt Google Analytics ein. Steuern Sie Ihre Marketingaktivitäten auf Basis von verlässlichen Zahlen und nutzen Sie intelligent miteinander kombinierte Daten aus unterschiedlichen Quellen, um bessere Entscheidungen für Ihr Unternehmen zu treffen.  Mehr zu MakroMarket

Sie interessieren sich für die Einsatzmöglichkeiten von Business Intelligence-Tools in Ihrem Unternehmen?
Für ein ausführliches Beratungsgespräch nehmen Sie gerne Kontakt zu uns auf!