In che modo il web consente alle IA di diventare artisti?
Nell’articolo di questa settimana, ho intenzione di approfondire come un’IA può creare immagini basate su istruzioni di testo.
Poiché la tecnologia è ancora in crescita, questo sarà un livello elevato, ma ho pensato che sarebbe stato comunque interessante avere un’idea di come funziona.
Innanzitutto, voglio iniziare con il modo in cui un’IA può creare immagini e i metodi che può utilizzare.
Successivamente, esamineremo questi metodi un po’ più in dettaglio.
Infine, elencherò solo alcune risposte ad alcune domande che avevo sugli x<AI (Dall-E in particolare).
Quindi, senza ulteriori indugi, parliamo dell’arte generata dall’IA.
Come possono essere utilizzate le IA per creare immagini
Da decenni ormai, gli informatici utilizzano l’apprendimento automatico per addestrare i computer a comprendere il mondo.
I computer hanno filtrato le immagini per apprendere le differenze tra oggetti e oggetti particolari.
La prossima progressione è imparare a creare immagini.
Ma come può un’IA creare immagini? Come probabilmente avrai intuito, è un processo complicato.
Per generare immagini, la macchina utilizza due reti neurali. La prima rete neurale viene utilizzata per creare l’immagine in base al testo immesso dall’utente.
La seconda rete neurale analizza l’immagine generata con immagini di riferimento.
Confrontando le foto, crea un punteggio per determinare l’accuratezza.
I sistemi continueranno a valutare la somiglianza fino a quando l’immagine generata non corrisponderà all’immagine di controllo.
Quella corrispondenza finale sarebbe quindi l’immagine generata che l’utente vede.
Un po’ di più sulla generazione di immagini dell’IA
Proprio come con altri metodi di Machine Learning, la macchina apprende da sola con la minima interferenza da parte dell’uomo.
Ciò significa che quando vedi l’output finale delle immagini generate, probabilmente non è l’unico raggruppamento di immagini.
Probabilmente ce ne sono molti altri che non vedi perché non hanno ottenuto un punteggio abbastanza alto da consentire al Generatore di restituirli.
Per quanto riguarda i limiti, la macchina si sta allenando da sola.
Ciò significa che i dati non sono sempre accurati.
Il computer non comprende le immagini che visualizza, poiché non può “vedere” le immagini nel modo in cui possiamo.
Inoltre non è in grado di distinguere ciò che “dovrebbe” o “non dovrebbe” creare.
Quindi ci sono dei limiti, ma la tecnologia sta crescendo.
Una limitazione, tuttavia, è la tua creatività.
Poiché la macchina non sa cosa dovrebbe o non dovrebbe creare, cercherà di creare qualsiasi cosa tu gli dai.
Quindi qualsiasi richiesta tu possa pensare.
Ora, non sempre sembrano “buoni”, come nei casi di Dall-E. Con Dall-E, alcune delle immagini sono davvero sorprendenti.
Ma altri possono sembrare un po’ terrificanti.
Conclusione:
L’ultima domanda che mi sono posto è come le IA possano ottenere una così grande quantità di dati.
Ma la risposta non è del tutto chiara.
Alcune IA hanno accesso solo a ciò che gli informatici danno loro.
Notizie aggiuntive;
Nell’articolo di oggi, abbiamo appreso come le IA creano immagini.
Il primo metodo discusso sono stati gli algoritmi NST (neural style transfer).
Questi algoritmi prendono immagini preesistenti e le traspongono nello stile di un secondo input.
Il secondo metodo che abbiamo discusso è stato il GAN (Generative Adversarial Networks) per due reti neurali.
Questi tipi di metodi utilizzano una rete neurale come generatore e la seconda come discriminatore.
Il Generator viene utilizzato per creare l’immagine in base alla didascalia di input, mentre il Discriminator classifica le immagini generate come reali o false.
Le immagini false vengono inviate per addestrare il generatore a ingannare il discriminatore e, una volta ingannate con successo, le immagini finali possono essere visualizzate all’utente che richiede il prompt.
Ci sono ancora molti limiti, ma il mondo dell’Intelligenza Artificiale è cresciuto moltissimo negli ultimi decenni.
Abbiamo anche esaminato solo due metodi oggi, ma ce ne sono molti altri là fuori.