Come eliminare lo spam nei dati di Google Analytics – Parte 2

 

Come eliminare lo spam nei dati di Google Analytics

Nella prima parte di questo articolo abbiamo visto quali sono le tipologie di spam che interessano generalmente i report di Google Analytics e abbiamo individuato gli errori che spesso  vengono commessi dagli utenti per arginare il problema. In questa seconda parte vedremo, invece, cosa fare realmente per mettere fine allo spam.

Generalmente per risolvere il problema dello spam ghost si consiglia di aggiungere un filtro di esclusione. Questa soluzione porta con se però degli svantaggi:

  • Creare nuovi filtri ogni settimana per nuovi spam rilevati è assolutamente noioso e porta via del tempo prezioso che potrebbe essere invece dedicato al proprio lavoro, soprattutto quando si gesticono molto siti.
  • Alcuni degli spammer oltre ai refferals usano anche visite dirette;
  • Anche se si utilizzano dei filtri queste visite dirette da parte degli spammer non verranno escluse dal filtro, pertanto i dati verranno comunque alterati.

Come arginare il problema dello spam ghosts in Google Analytics

Esiste però un metodo per ovviare a questo problema. Abbiamo detto che la maggior parte dello spam ghost funziona inviando a Google Analytics ID di monitoraggio casuali. Ciò significa che l’autore del reato, ossia lo spammer, non ha idea di chi sia il bersaglio da colpire. Per questo motivo il nome host nei report di Google non è impostato (not set) oppure riporta un nome falso.

spam google analytics nome host

Sulla base di ciò è possibile creare un filtro che consenta di includere solo ed esclusivamente i risultati che riportano un nome host reale. Questo escluderà automaticamente tutte le visite dovute allo spam ghost. Ecco come devi fare per creare il filtro.

  1. Vai nella tab Rapporti in Google Analytics;
  2. Clicca su Pubblico nel menu a sinistra;
  3. Espandi Tecnologia e seleziona Rete;
  4. All’interno del report fai clic sul nome host;
  5. Verrà visualizzato un elenco di tutti li hostname, compresi quelli spam;
  6. Fate quindi una lista di tutti i nomi host validi.

Per i siti di piccole dimensioni questa lista si ridurrà a pochi domini e sottodomini. I siti a maggior traffico dovranno portare un po’ più di pazienza nello stilare la lista.

Al termine è necessario creare una espressione regolare simile a questa:

yourmaindomain \ .com | anotheruseddomain \ .com | payingservice \ .com | translatetool \ .it

Non è assolutamente necessario indicare tutti i sottodomini, il dominio pricipale, infatti, li racchiude già tutti. A questo punto bisogna creare un filtro personalizzato. È necessario assicurarsi che all’interno del campo tipo filtro sia selezionata la voce Hostname e all’interno del campo filter pattern è necessario copiare l’espressione indicata poco sopra. Prima di salvare il filtro è opportuno verificare che funzioni correttamente.

Come ovviare al problema dello spam crawler in Google Analytics

Dopo aver risolto il problema dello spam di tipo ghost , occupiamoci di sistemare anche il problema legato allo spam di tipo crawler. Come abbiamo specificato nella prima parte dell’articolo, questa tipologia di spammer accede al sito, ciò significa che può essere bloccata agendo sul file .htaccess.

Trattandosi di un file molto delicato, un piccolo errore anche sulla punteggiatura potrebbe mandare down il sito, è opporuno prima di procedere di effettuare una copia di backup dello stesso per potero ripristinare in caso di malfunzionamenti.

Per procedere al blocco dello spam basta aggiungere nel documento le seguenti righe:

## STOP REFERRER SPAM
RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC]
RewriteRule .* - [F]

A questo punto ogni tipologia di spam è stata bloccata e sarà possibile effettuare una analisi più veritiera sull’andamento del proprio sito Internet.