Cloud: deep learning ed analisi delle immagini

AWS Rekognition, analisi delle immagini nel cloud

I servizi di analisi permettono di  individuare e comparare anche volti umani

Il cloud computing mette a disposizione delle aziende risorse di calcolo aggiuntive e strumenti ad un prezzo conveniente. Tra i servizi che si sono affacciati recentemente sul mercato sono degni di nota quelli dedicati all’analisi e classificazione delle immagini, task che fino a qualche tempo fa erano esclusivamente alla portata di grandi organizzazioni e che ora, grazie al cloud ed all’evoluzione delle piattaforme pubbliche, sono disponibili on demand “as a service” e via API.

Tenendo conto della diffusione di device in grado di catturare immagini e della popolarità del medium in Rete (gif, immagini di vario tipo sono tra i file più scambiati via app di messaggistica, social network etc.), l’analisi, classificazione ed organizzazione di immagini offre inedite possibilità alle aziende (es: ricerche di mercato, sistemi di sicurezza con riconoscimento facciale, localizzazione di persone etc.) e si rivela anzi quasi indispensabile per “estrarre informazioni” dalla mole di contenuti che giungono quotidianamente sul Web – nel 2017 saranno acquisite circa 1.2 bilioni di immagini.

Una delle prime aziende a presentare un servizio ad hoc (Cloud Vision) è stata Google, forte dell’esperienza accumulata con l’omonimo motore di ricerca, le IA ed Android. Cloud Vision, un ‘evoluzione di quanto visto sull’app Android Photos, è in grado di classificare gli elementi analizzati in categorie, riconoscere oggetti e volti, individuare testi, analizzare espressioni facciali etc.

Per capire cosa possano offrire e come funzionino i servizi di analisi immagini nel cloud dedicheremo il post di oggi a Rekognition, la risposta di Amazon a Cloud Vision presentata nel corso del re:Invent 2016 di Las Vegas (28 novembre – 2 dicembre).

Informazioni generali…

AWS Rekognition

Il servizio in azione, a destra è possibile notare le varie “etichette” con relativa percentuale di affidabilità

Come da tradizione, il servizio viene offerto in versione managed, il cliente deve quindi occuparsi esclusivamente di individuare e sottoporre gli archivi di immagini a Rekognition lasciando all’infrastruttura sottostante ed allo staff del provider i restanti compiti di setup e gestione dei vari elementi che renderanno possibile il tutto. Una caratteristica che farà sicuramente piacere agli utenti è la non archiviazione delle informazioni estrapolate e delle immagini nell’infrastruttura Amazon – per l’esecuzione delle task (indicizzazione,ricerca etc.) il servizio si affida a rappresentazioni vettoriali.

Per “estrarre dati utili” dalle immagini, Rekognition si appoggia a sofisticati modelli deep learning in grado di migliorare autonomamente nel tempo la loro accuratezza. Le operazioni possono essere eseguite in tempo reale e non (batch processing). Il servizio è integrato con S3, Lex, Polly, utilizza un’interfaccia intuitiva e di default viene fornito con funzioni di riconoscimento facciale, degli oggetti e delle scene.

.. ed API

Per quanto riguarda il set di API disponibili abbiamo:

  • DetectLabels API. API che si occupa di analizzare singole immagini e restituire un elenco di etichette  percentuali di affidabilità (l’immagine qui sopra).
  • DetectFaces. API che analizza una singola immagine individuando l’eventuale presenza di volti umani. E’ possibile visualizzare anche una serie di attributi relativi al volto individuato come emozioni, sesso del soggetto, accessori utilizzati, caratteristiche somatiche etc.
  • CompareFaces. Funzione il cui obiettivo è, come suggerisce il nome, quello di verificare la presenza o meno di un volto in una seconda immagine comparandolo con tutti gli altri volti individuati. In base a quanto dichiarato da Amazon, il modello deep learning adottato da Rekognition ha un livello medio di precisione pari al 98%.
  • IndexFaces, SearchFacesByImage, and SearchFacedByID. Una serie di API che estrapolano le informazioni facciali rilevate da voluminose raccolte di immagini e creano un indice sul quale è possibile effettuare delle ricerche via ID o upload di immagini: il programma indicherà tutte le immagini originali in cui è presente il volto. Nel caso di ricerche via ID è il caso di annotrare la corrispondenza tra questi ultimi e le immagini originali in quanto, come detto in apertura, i file caricati non sono memorizzate dal servizio.

Nei mesi a venire arriverano probabilmente nuove funzionalità, API, e le risposte dei competitor AWS, a tutto vantaggio delle aziende che disporranno di una vasta selezione di strumenti per supportare i propri modelli di business.