Pogled na novi Al Generative Art

Al Generative Art je vrsta umjetnosti, najčešće vizualne, koja se zasniva na saradnji čovjeka i autonomnog sistema. “Autonomni sistem” je definisan kao Umjetna inteligencija softver, algoritam ili model sposoban za izvođenje složenih operacija bez potrebe za intervencijom programera.

Od bizarnih jukstapozicija slika koje stvara Dall-E Mini u Nft na tržištu, slike koje generiraju AI algoritmi sve više ulaze u mainstream maštu. Zapravo, dva važna projekta na ovu temu koja zaslužuju da budu analizirani su: midjourney i DALL-E2.

Naravno, vijest je stigla i do Twittera. To, između ostalih, komentariše Charles Hoskinson, koji je napisao:

Al Generativna umjetnost: rani eksperimenti i karakteristike

Pošto smo shvatili šta je generativna umjetnost, važno je naglasiti jedan od njenih temeljnih principa: slučajnost. Što je temeljno svojstvo generativne umjetnosti.

Zapravo, u zavisnosti od tipa softvera, autonomni sistem je u stanju da obrađuje rezultate koji su uvek različiti i jedinstveni svaki put kada se izvrši naredba generisanja, ili može da vrati promenljiv broj rezultata kao odgovor na korisnički unos.

Prvi eksperimenti u generativnoj umjetnosti datiraju iz 1960-ih s eksperimentima Harold Cohen i njegova AARON program. Cohen je prvi koristio samostalni softver za generiranje apstraktnih umjetničkih djela inspiriranih Pop Art sitotiskom. Cohenovi radovi su sada izloženi u galeriji Tate u Londonu.

Još jedan atribut generativne umjetnosti, ali onaj koji je sve manje i manje prerogativ, je ponavljanje obrazaca ili apstraktnih elemenata koje obezbjeđuje programer i implementira u softverskom kodu.

Osim toga, razvoj sve složenijih neuronskih mreža koje rade na asocijaciji tekst-slika omogućio je razvoj generativnih modela sposobnih za stvaranje sve realističnije i preciznije slike. Najpoznatiji primjer ove kategorije generativne umjetnosti je Slab.

Dall-E je multimodalna neuronska mreža zasnovana na GPT-3 model dubokog učenja iz OpenAI, ista kompanija koja se također nedavno razvila Chat GPT, chatbot je pokrenut u novembru 2022. i optimiziran sa "nadgledan" i tehnike učenja potkrepljenja.

Vraćajući se na Dall-E, vidimo da je ovaj sistem sposoban da generiše slike iz tekstualnog opisa, nazvanog "brzi", na osnovu skupa podataka parova tekst-slika.

Prva verzija Dall-E, koja je javnosti predstavljena u januaru 2021. godine i ostala prerogativ malog broja profesionalaca u ovoj oblasti, predstavljala je pravu revoluciju u smislu ove vrste generativnog modela, nadmašivši inovacije GPT-a. 3 sama.

Značajna je i činjenica da se tačnost rezultata koje obrađuje Dall-E pokazala kao savršeni opseg za još jedno OpenAI rješenje: CLIP (Pretreniranje kontrastivnog jezika i slike).

Neuronska mreža za klasifikaciju i rangiranje slika obučena na osnovu asocijacija tekst-slika, kao što su natpisi pronađeni na internetu. Zahvaljujući CLIP-ovoj intervenciji, koja smanjuje broj rezultata predloženih korisniku po promptu na 32, utvrđeno je da Dall-E u većini slučajeva daje zadovoljavajuće slike.

Midjourney: dizajn, ljudska infrastruktura i umjetna inteligencija

Kao što se očekivalo, midjourney je važan projekat koji je dio novonastalog koncepta Al Generative Art. Konkretno, Midjourney je nezavisna istraživačka laboratorija koja istražuje nove načine razmišljanja i proširuje imaginativne moći ljudske vrste.

Korištenje je jednostavno: prvo se mora kreirati račun Diskord, platforma koja ugošćuje različite zajednice, a Midjourney je jedna od njih. Unutar aplikacije su različite chat sobe u kojima se može aktivno ili ne učestvovati u diskusijama.

Važno je istaći da da biste prvi put pokušali koristiti umjetnu inteligenciju, morate otići na "novaci" kanala, gdje 25 besplatnih rendera je dostupno.

Jedan render odgovara generisanju četiri različite varijante generisane iz istog tekstualnog unosa.

Dakle, 25 rendera se odnosi na 25 poslova obrade koje obavlja Midjourney bot. Shodno tome, generiranje slike zahtijeva interakciju sa Midjourney botom putem tekstualne poruke koja se zove "prompt", u kojoj će biti ključne riječi koje opisuju sliku koju korisnik ima na umu.

Možete dodati koliko god detalja želite, važno je da ključne riječi podijelite zarezom. Kada je renderovanje završeno, računar vraća četiri različite slike na osnovu opisa koje možete izabrati.

Osim toga, nakon što program završi sa renderiranjem, možete komunicirati svoje želje na osnovu slika i, ako želite, ponovo generirati još četiri verzije.

DALL-E 2: novi AI sistem za umetnička dela

Uz Midjourney, DALL-E 2 je također novi AI sistem koji može kreirati realistične slike i umjetnička djela iz opisa prirodnog jezika. I ne samo to, DALL-E 2 može kombinovati koncepte, atribute i stilove.

Snaga novog AI sistema takođe leži u mogućnosti da proširi slike izvan onoga što je na originalnom platnu, stvarajući nove ekspanzivne kompozicije. Osim toga, može napraviti realistične promjene u postojećim slikama iz naslova na prirodnom jeziku i može dodavati i uklanjati elemente uzimajući u obzir sjene, refleksije i teksture.

Mogućnosti DALL-E 2 takođe uključuju snimanje slike i stvaranje nekoliko njenih varijacija inspirisanih originalom. DALL-E 2 je naučio odnos između slika i teksta koji se koristi za njihovo opisivanje.

Koristi proces tzv "difuzija", koji počinje uzorkom nasumičnih tačaka i postepeno mijenja taj obrazac prema slici kada prepozna određene aspekte te slike.

Dakle, nakon što je OpenAI predstavio DALL-E u januaru 2021. godine, sada najnoviji sistem, DALL-E 2, generiše realističnije i preciznije slike sa četiri puta većom rezolucijom.

DALL-E 2 je započeo kao istraživački projekat i sada je dostupan kao beta verzija. Sigurnosne mjere koje je sistem razvio i nastavlja da se poboljšava uključuju: ograničavanje sposobnosti sistema da generiše nasilne slike, slike mržnje ili slike odraslih i faznu implementaciju zasnovanu na učenju.

Izvor: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/