Spam in Google Analytics

Spam in Google Analytics

Lesezeit ca. 5 Min.
Artikel
Webanalyse

In letzter Zeit stößt man immer öfter auf sogenannte Spam-Verweise bei der Auswertung von Daten in Google Analytics. Diese Spam-Verweise verfälschen die Ergebnisse, treiben Besucherzahlen nach oben und führen im schlimmsten Fall zu Webseiten, die zur Verbreitung von Viren genutzt werden sollen. Jedoch bietet Google Analytics verschiedene Einstellungen und Filterungsmöglichkeiten, um seine Daten gegen solche Verfälschungen zu schützen.

In diesem Blogbeitrag wollen wir Ihnen deshalb genauer erläutern, mit welchen Arten von Spam Sie rechnen müssen und wie Sie sich dagegen schützen können.

Verschiedene Arten von Spam

Bei Spam in Google Analytics lassen sich grundsätzlich zwei verschiedene Arten unterscheiden:

  • Zum einen tauchen immer öfter sogenannte Ghost Referrals auf, wie ilovevitaly.com, 4webmasters.org oder darodar.com.
  • Auf der anderen Seite besuchen Crawler wie Semalt die Seite und verfälschen damit Daten zu Reichweite und Nutzung der Webseite. 

Ghost Referrals - Was ist das?

Ghost Referrals verdienen ihren Namen dadurch, dass zu keinem Zeitpunkt ein realer Besuch auf der Webseite stattgefunden hat. Dies geschieht ganz einfach: Ein Google Analytics Trackingcode mit einer beliebigen Tracking ID Nummer wird auf einer anderen Domain eingebunden, wodurch „gefälschte“ Seitenbesuche an Googles Trackingservice geschickt werden können. Ist diese Tracking ID zufällig Ihre, notiert Google diesen Besuch in Ihren Analytics Statistiken. 

Erkennen können Sie solche Ghost Referrals, in dem Sie sich die aufgerufenen Seiten im Bereich „Zielgruppe“ ansehen. Klicken Sie auf den Menüpunkt "Technologie" und wählen Sie den Unterpunkt "Anbieter" aus. Stellen Sie anschließend die Dimension auf "Hostname" um. Tauchen hier fremde Domains auf, welche Sie nicht mit Ihrem Unternehmen in Verbindung bringen können und auf denen Sie nicht Ihren Trackingcode hinterlegt haben, dann handelt es sich vermutlich um Ghost Referrals. 

Lösung: Filter setzen

Da Ghost Referrals die Eigenschaft haben, dass nie wirklich ein Besuch stattgefunden hat, kann dieser auch nicht serverseitig blockiert werden. Die Lösung ist innerhalb von Google Analytics zu finden: Hier kann mit Filtern gearbeitet werden, mit welchen man bestimmte Aufrufe aus- oder einschließen kann. Da sich die Ghost Referrals ständig verändern bzw. mit immer anderen Domainnamen gearbeitet wird, kann der Ausschluss von Domainnamen auf die Dauer sehr aufwändig werden. Aus diesem Grund empfiehlt es sich, Google Analytics mitzuteilen, welche Seiten eingeschlossen werden sollen. Somit muss man nicht ständig neue Zugriffe ausschließen und kann sich viel Arbeit sparen. Der gesetzte Filter selektiert dann nur die Daten, die von Ihren gültigen Domains gesammelt wurden. Gehen Sie hier jedoch vorsichtig vor, um nicht aus Versehen nützlichen Traffic auszuschließen. Alle gültigen Hostnamen müssen also identifiziert und im Filter beachtet werden.

Um den Filter zu setzen, öffnen Sie den Bereich „Verwalten“ und wählen dann bei der entsprechenden Datenansicht den Punkt „Filter“ aus.

Richten Sie einen benutzerdefinierten Filter ein: Wählen Sie „Einschließen“ aus und geben anschließend Ihre einzuschließenden Domains (Hostnamen) ein. Hier sollten Sie sehr genau vorgehen und keine Ihrer Seiten vergessen, da diese sonst nicht in die Datenansicht mit einfließen. 

Tragen Sie Ihre gültigen Domains in das Feld ein und trennen diese mit einem senkrechten Strich. 

www.domain.com | www.domain.de | www.domain.fr

Haben Sie dies gemacht, setzen Sie vor alle Punkte einen Backslash, um diese zu „escapen“, also mitzuteilen, dass es sich hierbei um keine Funktionszeichen handelt.

 www\.domain\.com | www\.domain\.de | www\.domain\.fr


Crawler & Bots

Wie bereits oben beschrieben, besuchen Crawler wie semalt.com die Seite und verfälschen dadurch die Daten. Oft liegt die Absprungrate dieser „Besuche“ bei 100 Prozent und die Besuchszeit bei 0 Sekunden. Semalt ist eine SEO-Seite, die als Dienstleistung das Analysieren von Webseiten anbietet. Es ist wohl das erklärte Ziel, hier Aufmerksamkeit und Interesse zu generieren.

Was Sie auf jeden Fall nicht tun sollten, ist diese Seiten zu besuchen, denn dort könnten sich Viren oder Trojaner befinden. Um diese Crawler-Besuche nicht mehr in Ihre Google Analytics Daten aufzunehmen, sollte auch hier mit Filtern gearbeitet werden. Der Crawler besucht zwar weiterhin Ihre Seite, jedoch nimmt Google Analytics diesen nicht mehr in die Statistik mit auf, wodurch Ihre Ergebnisse nicht verfälscht werden. 

Hierzu sollten Sie wieder, wie in zuvor beschriebenem Beispiel, auf den Reiter „Filter“ gehen und dieses Mal jedoch anstatt „Einschließen“ „Ausschließen“ auswählen. Als Verweis muss in diesem Fall „www\.semalt\.com“ angegeben werden. 

Bekannte Bots sperren

Bots, die bei Google Analytics bekannt sind, können über die Konfiguration ausgeschlossen werden. Gehen Sie auch hierfür in den Bereich „Verwalten >> Einstellungen der Datenansicht“. Wie folgende Abbildung zeigt, können Sie ganz einfach den Haken bei „alle Treffer von bekannten Bots und Spidern ausschließen“ setzen. 

Fazit

Das Design einer responsiven Webseite will gut überlegt sein. Im Zusammenspiel der erstellten Wireframes ist von Detailverliebtheit abzuraten, da diese das Grundgerüst der Webseite beschreiben und für die Ordnung der Inhaltselemente ausschlaggebend sind. 
Neben dem Gridsystem, welches bei der Layout-Erstellung von responsiven Webseiten zum Einsatz kommt, sind die Design-Module nicht zu ignorieren. Je nach Endgerät sollte ein Wiedererkennungswert der Seite vorhanden sein und auch auf die Wahl der Schriftgröße geachtet werden. Diese werden heutzutage immer größer, da es wesentlich vom Gerät und der Nutzungssituation abhängt, wie die Größe der Schrift wahrgenommen wird.

Wireframe*= Ein Wireframe ist ein sehr früher konzeptioneller Entwurf einer Webseite, bei der Gestaltung und Funktionen noch keine Bedeutung haben. Fokus liegt hierbei auf der Anordnung der Elemente und der User Experience.

MediaQueries* = Mit Hilfe der Gestaltungssprache  CSS kann die Darstellung eines Dokuments für verschiedene Ausgabemedien festgelegt werden. Die Zuordnung eines Stylesheets zu einem Medium erfolgt anhand von Medienabfragen, die auch Media Queries genannt werden.