Come eliminare lo spam nei dati di Google Analytics – Parte 1

 

Come eliminare lo spam nei dati di Google Analytics

Lo spam in Google Analytics sta diventando un problema piuttosto serio. Sono molti, infatti, gli utenti che tentano di trovare una soluzione per recuperare dai risultati ottenuti le sole informazioni necessarie per comprendere il reale andamento del sito, senza che queste vengano alterate dallo spam. Nella prima parte di questo articolo vedremo quali sono le tipologie di spam e quali gli errori commessi dagli utenti per arginarli. Nella seconda parte ci soffermeremo invece sul metodo per eliminare definitivamente questa problematica.

Due tipologie di spam in Google Analytics

In Google Analytics esistono due tipologie di spam differenti: ghosts e crawler.

La maggior parte dello spam è tipo ghost. Viene definito fantasma, in quanto, non entra mai in interazione con il sito. Ci si chiede allora come ciò sia possibile essendo la funzione principale di Google Analytics proprio quella di monitorare i siti Internet. Un sito web generalmente comunica con lo strumento di Google inviando dei Measurement Protocol che contengono informazioni di monitoraggio riguardanti gli utenti reali che visitano il portale. Lo spam di tipo ghost non fa altro che inviare dei protocolli di misura che sono generati casualmente e assolutamente non reali per il sito Internet in questione.

spam google analytics ghosts

Lo spam di tipo crawler è invece il contrario di quello ghost, in quanto entra in contatto con il sito internet. In particolare questa tipologia di spam effettua una scansione del portale, ignorando il contenuto dei file robots.txt. Al termine della scansione lancia un report del tutto simile ad una visita reale. Quest’ultima tipologia di spam, sebbene molto più rara, è anche molto più difficile da individuare.

Gli errori commessi per bloccare lo spam in Google Analytics

Quando gli utenti cercano di eliminare il problema dello spam in Google Analytics commettono degli errori piuttosto comuni.

Errore #1: blocco dello spam ghost dal file .htaccess. Si tratta dell’errore più comune che in genere si commette. Il file .htaccess ha la funzione principale di consentire/bloccare l’accesso al sito. Come abbiamo detto poco sopra, però, lo spam di tipo ghost con ha alcuna interazione con il portale, pertanto non ha alcun significato in questo caso intervenire sul file .htaccess. Il fatto che lo spam ghost scompaia dopo pochi giorni dalla modifica del file è solo ed esclusivamente una coincidenza. Questa modifica è, invece, efficace sui crawler.

Errore #2: utilizzo di una lista di esclusione di riferimento per bloccare lo spam. La lista di esclusione non ha effetto sullo spam. Essa infatti viene utilizzata per altri scopi. Ad esempio, se deve essere effettuato un pagamento su un sito di un terzo, l’utente viene reindirizzato dal sito dove ha effettuato l’acquisto al portale sul quale effettuare il pagamento. Al termine della procedura, lo stesso viene reindirizzato nuovamente sul sito principale. In questo caso il ritorno al sito non dovrebbe essere registrato come una nuova visita, ecco quindi che la lista di esclusione consente di eliminare questa tipologia di problema, per avere dei dati più precisi e veritieri sulle visite.

Errore #3: credere che la variazione dei tassi di rimbalzo incida sul posizionamento. Quando gli utenti notano una variazione drastica nei tassi di rimbalzo, a causa magari della posta indesiderata, iniziano a preoccuparsi sull’impatto che questo aspetto può avere sulla classifica nella SERP di Google. Bisogna comprendere che Google non prende in alcun modo in considerazione come fattore di ranking le metriche di Google Analytics.

L’incidenza dello spam sui risultati desta forte preoccupazione negli utenti, in quanto altera i risultati e spesso non consente una giusta analisi della situazione attuale.

Ad essere maggiormente influenzati sono proprio i piccole e medi siti, in quanto gran parte del loro traffico deriva proprio dallo spam. I siti a grande traffico, invece, vengono influenzati solo in parte, ma è comunque necessario porre la massima attenzione per non rischiare di generare dei rapporti imprecisi.

Nella prossima parte delll’articolo vedremo come risolvere il problema dello spam in Google Analytics. Continuate a seguirci.