Già da qualche anno, Mozilla Foundation ha lanciato una realtà interessante nel mondo dei big data e del machine learning: Common Voice, una progetto nato per aumentare sempre di più le informazioni presenti nei database per il riconoscimento vocale.
Il progetto Common Voice di Mozilla è, per usare le parole dell’azienda, “un’iniziativa […] per insegnare alle macchine come parlano le persone nella vita reale”, dando la possibilità a tutti di contribuire donando la propria voce, così da costruire una banca dati open source dalla quale potranno attingere gli sviluppatori di applicazioni e programmi sul web. Per la registrazione delle tracce, Mozilla si è affidata a Deep Speech, una piattaforma di machine learning sviluppata dall’azienda stessa.
Per poter collaborare alla creazione del database, ogni singola persona può registrare la propria voce. Allo stesso tempo, chi decide di partecipare al progetto, potrà riconoscere e valutare le voci già registrate. Le tracce già presenti nel dataset vengono convalidate solo quando due utenti diversi la ascoltano e la accettano. Ovviamente la partecipazione è gratuita e libera, l’unica restrizione è quella relativa all’età (minimo 19 anni).
L’iter per aggiungere la propria voce al database quindi comincerà dalla registrazione di una traccia fornita da Common Voice, che verrà messa poi in lista d’attesa per la validazione. Il processo terminerà una volta ascoltata ed approvata da altri utenti. Le registrazioni non approvate non vengono cancellate ma finiscono nel cosiddetto Cimitero delle Registrazioni, anch’esso scaricabile liberamente. Il progetto cerca di avere informazioni sempre più accurate operando in modo diverso dai dataset già creati, questo perché i volontari potranno inserire anche metadati come età, sesso ed accento. Inoltre, se i sistemi classici vedevano una partecipazione minore di utenti di sesso femminile, nel caso di Common Voice i dati raccolti sono paritari, questo per aumentare la gamma di voci per entrambi i sessi.
L’accesso al pannello per registrare la propria voce può essere effettuato utilizzando le proprie credenziali Firefox oppure tramite email, account Google, Thunderbird e via GitHub. Common Voice, grazie all’aiuto di una grande community, è arrivata ad avere dati accurati su oltre 70 lingue, ma punta ad espandersi ancora di più per aiutare il più possibile lo sviluppo di sistemi di riconoscimento sempre più accurati. Attualmente, Common Voice dispone di oltre 7000 ore di registrazioni, 5,5 milioni di tracce incise da più di 42.000 volontari, numeri destinati, come abbiamo visto, ad aumentare ancora.