Den ultimata guiden för att bli av med spam i Google Analytics

Vi har alla brottats med felaktig statistik i Analytics. Det är viktigt med korrekt data för att kunna analysera och i förlängningen basera beslut på datan. Det är inte alltid så att en spik i trafiken är ett resultat av en lyckad kampanj. Analyserar vi på djupet händer det ofta att vi hittar spamtrafik. Spamtrafik är […]

Publicerat
Inlägg SEO

Vi har alla brottats med felaktig statistik i Analytics. Det är viktigt med korrekt data för att kunna analysera och i förlängningen basera beslut på datan. Det är inte alltid så att en spik i trafiken är ett resultat av en lyckad kampanj. Analyserar vi på djupet händer det ofta att vi hittar spamtrafik.

Spamtrafik är förvisso ingen nyhet utan har funnits som problemområde i Analytics en längre tid. Vi har skrivit om detta tidigare ”Referrer spam spöktrafik i ditt Google Analytics – Så får du bort det” och ”Städa upp referrer spam i Google Analytics” men nu på sista tiden ökar denna typ av trafik igen. Ni har säkert sett Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump! i ert Analytics och vi vill därför med denna guide belysa hur man blir av med spam i Google Analytics med de senaste metoderna.

 

Vanliga frågor om spam i Analytics

Det finns många funderingar och frågor om hur man ska hantera spam. Vi har listat några vanliga frågor som vi ofta får.

Kan spam vara skadligt för min hemsida?
Nej. Många tror att deras hemsidor blivit hackade när en massa konstiga domäner dyker upp i hänvisningsrapporten, men dessa besök har faktiskt aldrig besökt din hemsida och kan därför inte vara skadliga för hemsidan.

Ska jag blockera spam via ”Undantagslista för hänvisningar” i Analytics?
Använd inte ”Undantagslista för hänvisningar” i Analytics för att stoppa spam.

Kan jag inte blockera spam i .htaccess?
Använd inte serverlösningar för att stoppa spam så som WordPress plugins, .htacess, med mera. Dessa kommer inte att ha någon effekt, eftersom spöktrafiken inte besöker din hemsida.

Påverkar spam min ranking på Google?
Spam kommer inte påverka din SEO eller dess ranking eftersom inga länkar skapas till din webbplats, samt att Google inte använder data från Analytics för räkna ut positioner i SERPEN.

Varför finns spam?
De som håller på med spam har oftast till syfte att driva trafik till sina egna webbplatser. Nyfikenheten hos människan gör att vi gärna klickar in oss till webbplatserna som dyker upp i våra rapporter. På webbplatsen går det att köpa eller prenumerera på en tjänst/produkt där spammaren får en provision för genomförda transaktioner.

 

Vad är spam?

Det finns flera typer av spamtrafik i Google Analytics där Ghost Spam är den absolut vanligaste spam-metoden. På den senaste tiden har vi fått bevittna en stor våg av Language Spam – i synnerhet i samband med det amerikanska presidentvalet som nyligen ägde rum.
Om ni tittar under målgrupp –> geografisk –> språk

language-spam-språk–analytics

är jag övertygad att ni kommer att finna Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump. Vad är nu detta? Denna metod kallas Language Spam och går att läsa mer om nedan där vi samlat lite kort information om de olika spam-metoderna.

Vad är Ghost Spam (spöktrafik)?
Ghost Spam skickas via http-requests direkt till Google Analytics insamlingsservrar utan att egentligen besöka hemsidan. Spöktrafiken gör falska anrop till specifika Google Analytics ”properties” som antigen slumpas fram eller körs via tidigare insamlade listor.

Trafiken kommer alltså inte från vanliga robotar eller spindlar och är därför svårare att blockera eftersom de aldrig ens besöker webbplatsen (trafiken skickas direkt från spammarna till Google Analytics). Spöktrafiken lämnar ofta spår i värdnamn (hostname) eller under hänvisningar (referral) för att locka till sig klick till webbplatserna som de vill driva trafik till. Oftast finns det en kommersiell tanke bakom detta eftersom köp från dessa webbplatser kan ge spammaren en provision på sålda tjänster eller produkter.

Vad är Crawler Spam?

Crawler Spam är en spindel (crawler) som är programmerad att genomsöka webbplatser och lämna märken i form av webbadresser i Analytics- properties och loggar på webbplatsen. Crawler Spam ignorerar vanligtvis alla regler som finns i robots.txt som är tänkta att stoppa spindlar från att ”crawla” av din webbplats.

Crawler Spam är ovanliga i jämförelse med Ghost Spam. Detta eftersom Crawler Spam kräver mer resurser och kunskap från spammaren.

Vad är Language Spam?

Är en form av Ghost Spam men istället för att skicka en ”referral” skickas det som ”språk”.

 

Hur stoppar jag all spam i Google Analytics?

Innan vi går in i detalj på hur varje spam-metod stoppas är det kutym att först säkerställa att vi har en vy där vi lägger alla filter. Detta gör vi för vi alltid vill ha en vy som är ofiltrerad där all rådata finns. För varje filter du lägger kommer trafik att försvinna och filtrerad trafik går inte att återskapa. För att skapa en ny vy välj administration –> vy –> skapa ny vy döp vy till valfritt namn (ex: MasteView) och spara. Det är i denna vy som vi kommer att lägga alla filter som vi kommer att gå igenom nedan.

skapa-ny-vy-analytics

Nu när du har din data skyddad är det dags att blockera spamtrafiken. För att göra detta behövs tre filter samt aktivering av botfiltrering som är en inbyggd funktion i Analytics.

 

1. Skapa ett hostname-filter för motverkan av Ghost Spam

Ghost Spam lämnar alltid ett falskt värdnamn (hostname) eller ett ”odefinierat” värdnamn (not set) i Analytics. Först måste vi identifiera dessa falska värdnamn genom att titta under målgrupp –> teknik –> nätverk –> värdnamn. Kom ihåg att vi letar efter giltiga värdnamn som ska inkluderas, inte exkluderas. Oftast finns ditt domännamn i toppen men det kan även finnas andra domäner som du vill inkludera, till exempel om du har ett bokningssystem på en annan domän som ska inkluderas i dina trafikrapporter. I vårt fall väljer vi att även inkludera blog.google och mail.google.

Nätverk – Analytics

När du nu har en lista med alla giltiga värdnamn är det dags att skapa ett reguljärt uttryck (RegEx) som innehåller alla domäner. I vårt exempel bli det:

dindomän.se|blog.google|mail.google

Pipebar | används för att separera de olika domänerna och kan översättas som ELLER. Punkt . anses som specialtecken i RegEx därför lägger man till ett backslash framför dem.

När ditt RegEx är färdigt, är det dags att skapa filter för att en gång för alla få bort all Ghost Spam. Öppna filter under administration –> vy –> filter 

  • Tryck i inkludera (se bild punkt 3) <–! obs superviktigt att det är inkludera
  • Skriv ett filternamn (se bild punkt 4)
  • Välj filtertyp anpassat (se bild punkt 5)
  • Välj värdnamn i filtreringsfältet (se bild punkt 6)
  • Klistra in ditt RegEx som vi gjorde tidigare i filtreringsmönster (se bild punkt 7)

Glöm inte att spara!

Nu kommer endast trafik från dina giltiga värdnamn att inkluderas i rapporterna framöver.

 

2. Skapa ett crawler-filter för motverkan av Crawler Spam

Skapa ett nytt filter genom att öppna filter under administration –> vy –> filter 

  • Skriv ett filternamn (se bild punkt 3)
  • Välj filtertyp anpassat (se bild punkt 4)
  • Tryck i uteslut (se bild punkt 5)
  • Välj kampanjkälla i filtreringsfältet (se bild punkt 6)
  • Klistra in Crawler spam filter #1 som du finner nedan (se bild punkt 7)
  • Spara (se bild punkt 8)
  • Upprepa proceduren och skapa ett till filter med Crawler spam filter #2

crawler-spam-filter-Analytics

Följande RegEx är till för att blockera alla Crawler Spam som upptäckts under de senaste åren.
OBS! Glöm inte att skapa ett filter för varje RegEx.

Crawler Spam filter #1

(best|dollar|success|top1)-seo|(videos|buttons)-for|anticrawler|^scripted.|-gratis|semalt|forum69|7make|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit.xyz|rankings-|dbutton|-crew|uptime(bot|check|.com)

Crawler Spam filter #2

responsive-test|torrent-to|magnet-to|dogsrun|tkpass|free-video|keywords-monitoring|pr-cy.ru|fix-website|checkpagerank|seo-2-0.|platezhka|timer4web|share-buttons|99seo|3-letter

 

3. Skapa ett language-filter för motverkan av Language Spam

För att motverka Language Spam använder vi oss av ett liknade filter som ovan, men istället för kampanjkälla väljer vi språkinställningar.

Skapa ett nytt filter genom att öppna filter under administration –> vy –> filter 

  • Skriv ett filternamn (se bild punkt 3)
  • Välj filtertyp anpassat (se bild punkt 4)
  • Tryck i uteslut (se bild punkt 5)
  • Välj språkinställningar i filtreringsfältet (se bild punkt 6)
  • Klistra in Language spam filter som du finner nedan (se bild punkt 7)
  • Spara (se bild punkt 8)

language-spam-filter-Analytics

Language spam filter

s[^s]*s|.{15,}|.|,|Vitaly|ɢoogle.*

 

4. Aktivera botfiltrering i Analytics

Google har som sagt en inbyggd funktion för att utesluta kända crawlers (spindlar). Aktivera denna funktion genom att gå till administration –> vy –> inställningar vy

  • Tryck i botfiltrering
  • Spara

botfiltrering-Analytics

Avslutning

Med dessa tre filter bör ni nu vara relativt säkra och slippa ”falsk trafik” i era rapporter framöver. Spammarna kommer däremot säkert att förfina sina metoder och komma på nya sätt att skicka spam, därför bör man alltid hålla utkik efter spam. Tänk på att det är viktigt att uppdatera ert RegEx om ni skulle lägga till ett nytt spårnings-id eller domän. Hoppas detta kom till nytta – skulle ni behöva hjälp kan vi självklart hjälpa till. Det är bara att ringa, använda chatten eller maila.

Väl mött!