Alcuni dei vantaggi derivanti dall’aver portato un livello di elaborazione (se non di intelligenza) a bordo del sensore sono:
- latenza praticamente nulla tra acquisizione ed elaborazione dell’immagine
- consumo energetico trascurabile e quindi adatto a soluzioni IoT (Internet of Things)
- aumento del grado di privacy (v. oltre)
- costi molto ridotti rispetto alle attuali soluzioni che prevedono sensore di immagine e circuito di elaborazione dei segnali distinti.
L’innovazione consiste nell’accoppiare due sottili wafer; uno con chip sensibili alla luce e l’altro con capacità di elaborazione del segnale e memoria.
Ciò è reso possibile dalla scelta di utilizzare sensori retroilluminati che, benché più costosi da produrre rispetto alla tecnologia usualmente utilizzata per sensori standard CMOS (complementary metal-oxide semiconductor), produce l’effetto di poter ampliare sia la densità dei fotorecettori che le funzionalità associabili al sensore di immagine.
Un esempio di applicazione dei nuovi sensori potrebbe essere quello della sicurezza. Monitorare con decine o centinaia di videocamere un ampio spazio tramite la tecnologia esistente, significa trasmettere enormi quantità di dati al successivo livello di analisi.
La nuova tecnologia consente di programmare le videocamere affinché riconoscano e trasmettano solo le immagini di persone (o parti del corpo, come il viso), ma anche limitarsi ad inviare metadati come il numero di persone inquadrate in un determinato momento.
Un’altra possibilità collegabile al tema della privacy, è programmare i sensori affinché trasmettano immagini sfocate di volti umani o di targhe automobilistiche; in applicazioni di casa intelligente, le apparecchiature potrebbero riconoscere gli abitanti e reagire di conseguenza, senza dover inviare alcuna immagine al sistema centralizzato.
In sostanza, la scrematura di ciò che possa essere utile per una determinata applicazione, avverrebbe sul sensore di immagine stesso piuttosto che a valle di una costosa trasmissione dati.
Se, per estrema semplificazione, pensiamo all’ottica delle videocamere come equivalente al cristallino dell’occhio umano e il sensore di immagine come alla retina, dovremmo immaginare un sistema che, grazie a tecniche di machine learning, sia in grado di trasmettere al cervello (il livello successivo deputato ad elaborare le immagini) non più le immagini grezze così come derivanti dall’eccitazione dei fotorecettori, ma messaggi complessi come “cane”, “prato”,”sei persone”.
Riteniamo che questa nuova generazione di sensori consentirà la nascita di applicazioni sempre più affidabili e rispettose della privacy. Non è difficile immaginare cosa potranno fare apparati che integreranno tecnologie di questo tipo dove l’analisi dei segnali si fonde con il machine learning: saremo immersi in un mondo di oggetti intelligenti, progettati per interagire con noi piuttosto che attendere passivamente di essere utilizzati.
OWL ha in corso l’utilizzo della tecnologia del riconoscimento di immagine e delle reti neurali per l’apprendimento al fine di rilevare difetti nei materiali. Se sei interessato ad approfondire queste tematiche e l’eventuale utilizzo di queste tecnologie nella tua azienda, contattaci.
Fonti: Sony, IEEE, Techcrunch