Negli ultimi anni è sempre più aumentata l’attenzione sull’apprendimento automatico come strumento per elaborare i big data generati dai sensori ormai onnipresenti nella nostra vita quotidiana.
Oggi, infatti, grazie all’intelligenza artificiale, riconoscere un viso o un oggetto, oppure interpretare correttamente una parola o un motivo musicale, sono operazioni accessibili da tutti noi sui più comuni dispositivi elettronici, come può essere il nostro smartphone.
Perché queste operazioni – apparentemente semplici – avvengano, le reti neurali necessitano però di un opportuno addestramento, che richiede un consumo energetico straordinariamente elevato. Talmente elevato che, secondo alcuni studi, la carbon footprint dell’addestramento di una complessa rete neurale, ossia la quantificazione di tutte le emissioni di gas ad effetto serra lungo il suo ciclo di vita, eguaglierebbe quella di cinque automobili.
Per ridurre i tempi e i consumi del training, si è reso necessario mettere in discussione l’attuale tecnologia dei semiconduttori, sviluppando circuiti radicalmente diversi dall’approccio convenzionale, e che mappano più fedelmente la struttura delle reti neurali e le caratteristiche delle sinapsi biologiche.
Un gruppo di ricerca del Dipartimento di Elettronica, Informazione e Bioingegneria ha sviluppato un nuovo circuito di calcolo che permette di eseguire operazioni avanzate, tipiche delle reti neurali su cui si basa l’intelligenza artificiale, in una sola operazione.
L’intuizione dei ricercatori del Politecnico di Milano prende ispirazione proprio dal cervello umano, dove i dati vengono elaborati direttamente all’interno della memoria. Basandosi su questo modello, detto “computing in memoria”, sono riusciti a sviluppare un nuovo circuito che riesce ad eseguire una funzione matematica, chiamata regressione, in una sola operazione.
Per questo scopo è stato utilizzato il memristor, una memoria resistiva capace di memorizzare un dato qualsiasi nel valore della sua resistenza.
Disponendo questi elementi di memoria in una matrice di dimensioni di pochi micron, il nostro team di ricerca è stato in grado di eseguire una regressione lineare su un gruppo di dati, riuscendo a determinare la retta che meglio descrive una sequenza di dati, e permettendo così, per fare un esempio, di prevedere l’andamento della borsa sulla base di un semplice modello lineare.
È stata anche dimostrata la regressione logistica, che permette di classificare un dato all’interno di un database. Questa funzione è fondamentale nei sistemi di raccomandazione, strumenti di marketing fondamentali per gli acquisti sul web.
I risultati di performance in termini di velocità e consumo di energia pongono le basi per una nuova rivoluzionaria generazione di acceleratori di intelligenza artificiale con maggiore efficienza energetica e migliore sostenibilità a livello globale.
Lo studio è stato recentemente pubblicato sulla prestigiosa rivista “Science Advances”.