PizzaGan è il progetto di Intelligenza Artificiale realizzato dal MIT in collaborazione con l’istituto di ricerca del Qatar che attraverso la lettura di un immagine, realizza una pizza non solo con tutti gli ingredienti che desideriamo ma con il giusto punto di cottura
Si chiama PizzaGAN il progetto di Intelligenza Artificiale ideato dal MIT in collaborazione col Qatar Computing Research Institute.
PizzaGAN, il cui nome non è affatto casuale, è un network di reti neurali in grado di prendere delle istruzioni di tipo antagonista generativa: Generative Adversarial Network, pensata per riconoscere dalle immagini di una pizza gli ingredienti che la compongono, la loro distribuzione, il giusto punto di cottura, fino ad arrivare al prodotto finito e sì pronto da mangiare.
Un metodo con potenzialità enormi per l’industria culinaria, e non solo.
PizzaGAN
La pizza è il cibo più fotografato su Instagram con oltre 38 milioni di post che utilizzano l’hashtag #pizza. Il gruppo di ricercatori ha scaricato circa mezzo milione di immagini da Instagram e così dato inizio al progetto.
Dim P. Papadopoulos, Youssef Tamaazousti, Ferda Ofli, Ingmar Weber, Antonio Torralba: gli sviluppatori del progetto di AI spiegano in un dettagliato paper la differenza tra PizzaGAN e i robot programmati per eseguire semplicemente una serie di azioni automatiche.
“Quando pensiamo infatti alle soluzioni di automazione per le cucine solitamente pensiamo a robot, che sono semplicemente programmati per eseguire una serie di azioni in sequenza, come ad esempio nel caso del famoso robot che prepara gli hamburger. A questo genere di soluzioni non interessa minimamente se a cuocere ci sia un hamburger reale o un disco da hockey, perché ovviamente non sono in grado di distinguere l’uno dall’altro”.
PizzaGAN invece è in grado di “comprendere” cosa fare scomponendo le immagini che le vengono fornite. Questo ovviamente non significa che la rete neurale sia in grado di preparare una pizza a partire da una semplice immagine, non ancora almeno, perché per quello avrebbe bisogno di essere abbinata a soluzioni robotiche.
Quel che hanno realizzato il MIT e l’istituto di ricerca del Qatar si differenzia da altri progetti perchè ha ricadute importanti: in teoria PizzaGAN può anche aggiungere o togliere singoli ingredienti dalla ricetta di una qualsiasi pizza, ricavata a partire da una semplice foto.
“Anche se abbiamo testato il nostro modello solo nell’ambito delle pizze, siamo convinti che un simile approccio possa essere promettente anche per altri tipi di cibi compositi, come hamburger, sandwich e insalate. Inoltre, al di là del cibo sarebbe interessante verificare le prestazioni del nostro modello in ambiti assai diversi, come ad esempio in quello degli assistenti digitali per lo shopping, in cui è fondamentale riuscire a combinare abiti e accessori su diversi livelli”, si legge nelle conclusioni del white paper del progetto.
Il metodo GAN: la scomposizione (e ricomposizione) dei livelli
PizzaGAN funziona grazie ad un metodo inventato nel 2014 da un giovane studente di Stanford, Ian Goodfellow, che oggi lavora al progetto Brain di Google e che guarda caso fa parte della lista dei 100 pensatori più influenti del mondo. Goodfellow all’età di ventinove anni pubblicò una ricerca in cui dimostrava che creando due sistemi di algoritmi che si sfidano denominati GAN, la macchina è in grado di generare una sorta di apprendimento automatico senza supervisioni.
In questo specifico progetto, i due algoritmi antagonisti hanno creato immagini della pizza prima e dopo la cottura, con più o meno ingredienti: mozzarella, pomodoro, basilico, peperoni, olive, funghi, bacon e chi più ne ha più ne metta. In questo modo il robot in futuro saprà esattamente cosa aggiungere o togliere e fino a che punto cuocerla per avere una pizza perfetta. E che incontra i gusti esclusivamente soggettivi degli amanti della pizza.