Recentemente su uno dei blog che amministro ho notato un sospetto aumento nelle visite in Google Analytics poi facendo un po’ di ricerche ho scoperto che si trattava di “Referrer Spam”. Tipici sintomi possono essere l’avere molte visite senza informazioni sulla lingua, paese, eccetera ( not set ) o da utenti provenienti da paesi che in teoria non dovrebbero visitare il proprio sito. La maggior parte delle visite vengono acquisite tramite Refferal e se si da un occhiata in Google Analytics sotto Acquisizione e poi Referral si troveranno nomi come guardlink.org, event-tracking.com, free-social-buttons.com, semalt.semalt.com, Get-Free-Traffic-Now.com, best-seo-offer.com e altri. Una caratteristica di queste “visite” è che hanno un rimbalzo del 100% o del 0%, cosa che potrebbe avere un impatto negativo sulla qualità delle visite. Come anche altri fattori.

Referreral spam google analytics lingua not set

Come si può vedere nell’esempio, nel giorno in cui ho avuto un forte aumento, la maggior parte delle visite, 200, sono “(not set)”, non forniscono informazioni relative alla lingua o il paese di provenienza.

Il problema per quello che riguarda una corretta analisi delle informazioni riguardanti i propri visitatori è il fatto che avendo tutta questa Spam il risultato delle analisi risulterà alterato e non rispecchierà la realtà. Se si vuole avere dei dati analitici corretti consiglio quindi vivamente di liberarsi della Referrer Spam. Vi sono diversi modi per farlo.

Per impedire che i dati provenienti da alcune fonti vengano registrati nelle statistiche di Google Analytics si potrebbero creare dei filtri.

Io opterei piuttosto per una combinazione tra usare i filtri e bloccare il traffico dai più famosi siti come quelli elencanti direttamente tramite un firewall o delle regole rewrite. Se si creano solo dei filtri non si blocca il traffico verso il proprio sito o blog, si evita solo di inserire nelle statistiche le informazioni provenienti da alcune fonti, o come vedremo, si evita di aggiungere nelle statistiche informazioni riguardanti utenti che hanno la lingua impostata su “(not set)” per esempio.

Referrer Spam Google analytics lingua not set

Nell’immagine si vede che la maggior parte delle visite nel giorno in cui sono aumentate le visite è Referrer Spam.

Tipi di Referrer Spam

Ci sono due tipi di Referrer Spam:bot referrals e ghost referrals.

Referrer Spam

In questo caso gli spammers utilizzano i bot per spammare il nostro account Google Analytics. Dal momento che Google Analytics non può distinguere tra una sessione legittima o una in automatico, in entrambi i casi queste visite saranno conteggiate nelle statistiche e con il tempo inizieranno ad accumularsi.

Ghost Referrer Spam

Nel caso dei ghost referrals gli spammers non visitano neanche il sito web – nemmeno tramite un bot automatizzato – inviano direttamente le informazioni su delle visite “avvenute” a Google Analytics.

Bloccare la Referrer Spam con delle regole Rewrite

La cosa migliore in alcuni casi è negare l’accesso agli hosts da cui arriva la Spam.Uno dei metodi è usare il file .htaccess. Aggiungere le seguenti regole rewrite:

RewriteCond %{HTTP_REFERER} semalt.com [NC,OR]
RewriteCond %{HTTP_REFERER} free-social-buttons.com [NC,OR]
RewriteCond %{HTTP_REFERER} guardlink.org [NC]
RewriteRule .* - [F] 

Bloccare la Referrer Spam con un firewall

Se si ha pieno accesso si potrebbe bloccare l’accesso ai o al proprio server con un firewall. Mettiamo che si abbiano 20 Blog tutti con lo stesso problema, sarebbe un lavoro andare ad aggiungere le regole rewrite o altre impostazioni singolarmente piuttosto che avere il tutto centralizzato. Nel mio caso ho creato una lista di indirizzi IP e li ho bloccati con il Firewall.

Ecco un esempio in cui viene negato l’accesso al server tramite indirizzo IP:

Bloccare la Referrer Spam con un firewall

Bloccare la Referrer Spam in Google Analytics

Per bloccare la Referrer Spam in Google Analytics creare un filtro sotto Amministrazione, tutti i filtri e nuovo filtro.

Dare un nome al filtro come per esempio Referrer Spam, scegliere Personalizzato, Escludi, Sorgente Campagna e sotto Pattern filtro aggiungere i nomi hosts degli Spammers separati da una barra, vedi esempio nell’immagine sottostante.

Google analytics referrer spam Creare un filtro sorgente campagna

Una volta aggiunti gli hosts scegliere “Tutti i dati del sito web”, cliccare su aggiungi e salvare.

Bloccare la Ghost Referrer Spam in Google Anlytics

Come detto in precedenza la Ghost Referrer Spam viene mandata direttamente a Google Analytics da altre fonti, non dal proprio sito. Per controllare chi oltre al proprio sito ha mandato informazioni a Google Analytics impostare la data iniziale alla data in cui si ha lanciato il sito o un anno in dietro così da avere più informazioni da analizzare poi andare sotto Pubblico e infine Rete. Sotto rete cambiare da fornitore servizio in Nome host. Come si può notare dall’esempio nell’immagine sottostante altri hosts hanno mandato informazioni a Google Analytics.

Bloccare la Referrer Spam in Google Analytics

Chiaramente co.lumb.co, darodar.com e il nome host impostato su “(not set)”, è Spam. Di solito l’unico nome host da cui dovrebbero venire inseriti dati in Google Analytics è il proprio. Ma ci sono delle eccezioni, in quel caso, inserire oltre al proprio nome host gli hosts fidati, quando si crea il filtro.

Attenzione, in questa lista si potrebbero trovare anche nomi hosts all’apparenza legittimi come google.com o firefox.com ma non farsi fregare, molto probabilmente non si hanno proprie pagine sul server google.com e quindi si tratta anche in questo caso di spam.

Per creare un Filtro andare in Google Analytics sotto amministrazione poi tutti i filtri e nuovo filtro. Dare un nome al filtro, scegliere personalizzato, includi e infine inserire il proprio nome host nel campo Patter filtro.

Bloccare la Ghost Referrer Spam in Google Anlytics

In basso selezionare “Tutti i dati del sito web”, cliccare su aggiungi e in fine salvare.

Creare un filtro per bloccare sorgenti con valori (not set)

Il problema è che anche bloccando i più famosi “spammers” tramite indirizzo IP o con dei filtri ne saltano sempre fuori di nuovi e non vorremo chiaramente passere il tempo a creare filtri per ogni nuovo spammer. Un host può avere più indirizzi IP.

In alternativa si potrebbe creare un filtro che blocca tutti gli “utenti” che non forniscono informazioni come la lingua o il paese (not set), tipico comportamento della spam. Così facendo si può bloccare la maggior parte della “Referrer Spam” e il traffico indesiderato indipendentemente da dove proviene.

Per creare il filtro andare in Google Analytics sotto amministrazione, tutti i filtri, Nuovo filtro.

Dare un nome al filtro, scegliere personalizzato, Escludi, Impostazioni lingua e poi sotto Pattern filtro aggiungere “(not set)”.

Creare un filtro per bloccare sorgenti con attributi (not set)

Una volta fatto selezionare in basso “Tutti i dati del sito web”, cliccare su aggiungi e in fine salvare.