L’intelligenza artificiale come strumento di conversazione

Innovazione
Luca Della Dora
A un primo sguardo Prisma sembra una delle tante applicazioni di photo editing. Niente di speciale insomma: una collezione di filtri che rendono le nostre foto simili a quadri (o a fumetti). No. E a essere interessante è la tecnologia alle sue spalle: Prisma usa l’intelligenza artificiale per ricostruire – da zero – le nostre foto.

Non si tratta della prima applicazione che sfrutta algoritmi di questo tipo per modificare immagini: a Marzo Facebook ha acquistato Masquerade, che grazie al suo algoritmo di self-learning permette alle persone di modificare i propri selfie. L’intelligenza artificiale – in questo caso – permette all’applicazione di riconoscere i tratti dei volti delle persone e di applicare in modo preciso effetti e filtri.



Prisma è qualcosa di ancora diverso, perché si serve di “neural networks”, un tipo di intelligenza artificiale in grado di apprendere una serie di stili e applicarli a immagini anche molto diverse tra loro: l’algoritmo non applica un filtro alla foto – come fa, ad esempio, Instagram – ma usa l’intelligenza per creare nuove immagini dallo stile “imparato” da Picasso, Van Gogh o dai disegnatori Marvel.



via @ohhcouture and #prisma #venice #italy #venicecanals #blondehair


A photo posted by Prisma Official (@prisma) on Jul 12, 2016 at 12:18am PDT




Siete tra quelli che hanno passato mesi a modificare le proprie foto con i filtri Crema, Mayfair o Valencia, e oggi rabbrividiscono riguardando quello che condividevano su Instagram qualche mese fa? Non temete, Prisma è qualcosa di molto diverso.

In queste settimane non si fa che parlare di chat bots, e tecnologie che lavorano sul machine learning, e siamo quindi molto influenzati da applicazioni di questo tipo quando pensiamo all’intelligenza artificiale come mezzo per ottimizzare le nostre attività.

Siamo portati a vedere l’intelligenza artificiale come una tecnologia capace di creare conversazioni (o interazioni) tra persone e bot: in alcuni casi si tratta esattamente di questo, ma Prisma è un ottimo esempio per renderci conto che non è soltanto questo.

Con la diffusione di Instagrame di altre App, come VSCO – ci siamo abituati a modificare (quasi) ogni foto che scattiamo prima di condividerla. E la facilità di condivisione, unita all’immediatezza nel rendere una foto “qualsiasi” un pezzo di contenuto unico, è alla base del successo di Prisma, che dopo una sola settimana dal suo lancio poteva già contare 1.6 milioni di download.

Prisma non è un’alternativa a Instagram, ma una sua “estensione”: è un modo per creare contenuti diversi, inventando – di fatto – nuovi linguaggi, nuovi modi di condividere i propri momenti o di esprimere se stessi, grazie a una tecnologia molto diversa da quelle già esistenti.

Ecco qualche esempio di quello che si può ottenere:

PRISMA_wearesocial.002

Probabilmente quando i soggetti sono persone la resa è ancora migliore (e grazie a Mirta e Ornella per essersi prestate volontariamente):

PRISMA_wearesocial.001

Questi sono esempi semplicissimi, realizzati in pochi secondi, ma è possibile – ad esempio – far lavorare Prisma su un’immagine, scaricarla, e far lavorare di nuovo l’App scegliendo uno stile diverso, e – successivamente – modificarla con Instagram. Insomma, la creatività resta – come sempre – nelle mani delle persone.

PERCHÉ PRISMA È DIVERSA DALLA ALTRE APP DI PHOTO EDITING


1. ON THE CLOUD


Prisma modifica tutte le immagini su cloud, e non sul dispositivo da cui vengono scattate o scelte. La modifica dell’immagine non avviene infatti immediatamente, ma richiede qualche istante (non si tratta di un’attesa “fastidiosa”, ma veramente di pochi istanti).
“Non conserviamo le immagini che modifichiamo. Non sappiamo chi ci invia le foto, e non conosciamo le foto in sé, perché si tratta di un formato che non leggiamo. Conserviamo soltanto il risultato finale per un po’ di tempo, semplicemente perché a volte la connessione non è delle migliori e non vogliamo che i nostri utenti perdano le modifiche che avevano apportato”, dichiara Moiseenkov – CEO e co-fondatore di Prisma.





 

2. Ai


Come anticipato, Prisma usa algoritmi basati sul deep learning e che lavorano su 3 layer separati, ognuno dei quali svolge un compito specifico per modificare l’immagine.
“Non ci occupiamo soltanto di sovrapporre dei filtri come fa, ad esempio, Instagram, ma creiamo delle foto partendo da zero. Quindi quando riceviamo un’immagine, la prendiamo, e i nostri 3 “neural networks” compiono una serie di operazioni che restituiscono una foto completamente nuova. Potremmo definire il deep learning come un artista, o qualcosa del genere”.





 

3. VARIETÀ


In questo momento sono disponibili circa 20 filtri, ma entro poche settimane saranno almeno 40. L’obiettivo è di evitare che l’effetto “novità” si esaurisca quando le persone avranno provato tutti i filtri, arrivando a fornire un’esperienza simile a quella che offre Snapchat con i suoi filtri che vengono rinnovati costantemente.
A breve sarà disponibile anche la possibilità di modificare video, come anticipato attraverso il profilo Instagram di Prisma:



Something really cool is coming… #prisma #prismaart


A video posted by Prisma Official (@prisma) on Jul 9, 2016 at 11:26am PDT




 




 

Ok, dopo questo (neanche tanto) breve approfondimento su Prisma, non vi resta che provare a modificare le vostre foto per capire ancora meglio di cosa si tratta, o di scorrere le immagini già condivise da altre persone con l’hashtag #prisma su Instagram – o, in molti casi, di dare un’occhiata ai vostri feed di Facebook e capire perché all’improvviso metà dei vostri contatti sembravano diventati disegnatori Marvel, o giovani Magritte in vena di sperimentare.

Ma torniamo al tema da cui siamo partiti: intelligenza artificiale non significa soltanto “sostituire l’interazione umana con quella di un robot”, ma molto più spesso “facilitare e rendere più efficienti le conversazioni TRA persone”.

La dimostrazione di questo aspetto è offerta da Allo – una nuova messaging App creata da Google, disponibile a breve – che rappresenta un nuovo inizio per il reparto Communication di Google, come dichiara Eirk Kay – Director of Engineering & Communications Products.

google-allo

Senza entrare nel dettaglio delle feature offerte, è interessante il modo in cui Google sfrutta il suo “Knowledge Graph” – che capisce migliaia di diverse possibili modalità di interazione che gli umani possono intrattenere – per suggerire, ad esempio, il modo in cui rispondere ai nostri contatti sulla base delle nostre conversazioni precedenti. Allo non riconosce soltanto i testi, ma anche le immagini che condividiamo con i nostri contatti, ed è quindi in grado di suggerire – attraverso le “Smart Reply” – il tipo di commento quando ci viene inviata una foto.

Più lo utilizziamo, più Allo capisce il nostro linguaggio e sarà in grado di suggerire la risposta più adatta grazie al machine learning.

Google è da tempo al lavoro su tecnologie in grado di sfruttare il machine learning, e il 1 Giugno di quest’anno – grazie a Magenta Program – ha prodotto il suo primo prodotto tangibile: una melodia di 90 secondi generata completamente grazie a neural networks “istruiti” per imparare a suonare il piano.



L’obiettivo di Google è quello di creare community di artisti, sviluppatori e ricercatori esperti in machine learning in grado di creare nuove opportunità per gli artisti stessi: anche in questo caso la tecnologia non vuole sostituire gli esseri umani, ma generare nuove forme di espressione e conversazione.

Qui potete trovare alcuni dettagli relativi a Magenta Program.




Questi esempi ci aiutano a capire un po’ meglio in che modo innovazioni di questo tipo possono aiutare i brand a sviluppare esperienze sempre più utili, e ad agevolare le conversazioni con le persone, o a porsi come abilitatori per mettere in contatto le persone, non soltanto offrendo gli strumenti affinché le conversazioni stesse avvengano, ma diventando loro stessi lo strumento di relazione.