Sztuka & AI: Wonder

in #polishlast year (edited)

Pod poprzednim wpisem na temat grafik tworzonych przez AI @helcim stwierdził, że to kontynuacja eksperymentów z dawaniem małpie pędzla i farb. Nie jestem specjalistą od sztucznej inteligencji, ale wydaje mi się, że to jednak coś zupełnie innego. Małpa malująca obraz jest tylko małpą malującą obraz. Niczym innym. W przypadku AI jest to chyba coś więcej, bo jednak musi ona na czymś bazować. A konkretnie: na czymś co już zostało stworzone. Oczywiście trudno tu mówić o twórczości. Jest to bardziej odtwórczość. Tak czy owak podobne mechanizmy zaobserwujemy wśród żywych "artystów", którzy w swojej pracy jedynie naśladują.

I żeby było jasne: to co robi AI nie uważam za sztukę. Sztuczna inteligencja wciąż jest mocno ograniczona w swoim "myśleniu" i niezdolna do wyjścia poza pewne schematy. Warsztat bardzo często robi wrażenie, ale tylko w przypadku mało skomplikowanych zadań. I tylko dlatego, że (tak mi się zdaje) bazuje to na pracy ludzi. Takie przynajmniej odniosłem wrażenie po pracy z aplikacją Wonder.

Na początek wpisałem standardowe: "Kingdom without limit"

Kingdom without limit

Kingdom without limit

Kingdom without limit

Kingdom without limit

No rezultaty całkiem ciekawe. W przeciwieństwie do Midjourney nie mamy jednak żadnej możliwości modyfikowania otrzymanego obrazu.

Kolejnym poleceniem był oczywiście "Latvian forest".

Latvian forest

Latvian forest

Latvian forest

Latvian forest

Latvian forest

Tu również otrzymane wyniki są całkiem dobre. Mam jednak wątpliwości co do ich oryginalności. Biorąc pod uwagę fakt, że pojawiły się na nich postaci, to mogą być one przetworzonymi obrazami, które już gdzieś istnieją. W podejrzeniu tym utwierdziły mnie jeszcze bardziej kolejne frazy.

Three longhair girls reading the same book

Three longhair girls reading the same book

Three longhair girls reading the same book

Three longhair girls reading the same book

Three longhair girls reading the same book

Three longhair girls reading the same book

Jak widać na podanych przykładach, coś zaczęło się psuć i rozjeżdżać. Książki często wyglądają nienaturalnie. W dodatku AI zdarza się robić błąd w rachunku i zamiast 3 generuje 2 długowłose dziewczyny.

Jako, że im więcej określeń, tym trudniej, to dodałem kolejne: blonde.

Three longhair, blonde girls reading the same book

No dobra, ale blondynek jest pełno. O wiele mniej jest rudych. Postanowiłem więc spróbować z redheadami.

Three longhair, redhead girls reading the same book

Three longhair, redhead girls reading the same book

Three longhair, redhead girls reading the same book

Three longhair, redhead girls reading the same book

Problemy dokładnie te same. Tylko, że spotęgowane. Cóż, łatwiej znaleźć dwójkę rudych niż trójkę.

No dobra. Spróbujmy czegoś innego. Jako, że pisałem artykuł o RCRT wykorzystywanych do wynagradzania osób poprawiających błędy, to pomyślałem, że AI mogłoby mi wygenerować jakąś ilustrację do wpisu. Girl with gold in the pot - to powinno się nadać!

Girl with gold in the pot

Girl with gold in the pot

Girl with gold in the pot

Girl with gold in the pot

Girl with gold in the pot

Girl with gold in the pot

Girl with gold in the pot

Z tym zadaniem AI miała wyraźny problem. Zamiast złota w garnku w większości przypadków generowała mi złoty garnek. Czasem złoto było tylko tłem a na pierwszym planie było garncarstwo, czyli pottery.

Postanowiłem sprecyzować zapytanie.

Girl with golden coins in the pot

Girl with golden coins in the pot

Girl with golden coins in the pot

Girl with golden coins in the pot

Girl with golden coins in the pot

Okazało się, że Girl with golden coins in the pot wyszło nieco lepiej. Wciąż jednak można mieć poważne zastrzeżenie do wygenerowanych grafik. Zdarzają się niedoróbki anatomiczne (np. palce). Również same monety nie są idealne. Często różnią się od siebie kształtem. Logika podpowiada, że powinny być podobnej wielkości.

Podobny problem pojawił się w przypadku rudej grającej na gitarze.

Longhair, redhead girl playing guitar

Longhair, redhead girl playing guitar

Longhair, redhead girl playing guitar

Longhair, redhead girl playing guitar

AI ewidentnie ma problem z gitarą. Powyższe trzy przykłady są najlepsze z wszystkich wygenerowanych. Pierwszy przypomina większość. Słowem: gitara nie przypomina gitary.

Na koniec trochę abstrakcji.

Anthropomorphic fox soldier

Anthropomorphic fox soldier

Anthropomorphic fox soldier

Anthropomorphic fox soldier

Anthropomorphic beaver soldier

Anthropomorphic beaver soldier

Anthropomorphic beaver soldier

Anthropomorphic badger soldier

Anthropomorphic badger soldier

Anthropomorphic badger soldier

Anthropomorphic badger soldier

Anthropomorphic badger soldier

Anthropomorphic stork soldier

Anthropomorphic cat soldier

Z tym zasadniem AI poradziła sobie całkiem dobrze. Przynajmniej jeśli chodzi o Wonder, bo kiedyś próbowałem podobnej sztuczki na innym silniku i rezultaty były kiepskie.

Na razie tyle. Sam Wonder daje do wyboru różne style. Ja korzystałem głównie z jednego (Novelistic). Ma też opcję modyfikacji fotografii. Ale o tym może innym razem.

Sort:  

Z założenia rendery AI uczą się z pewnej ogromnej puli obrazów. Gdyby porównać sztuczną inteligencję do prawdziwej, możemy powiedzieć, że inspirowała się tymi plikami graficznymi. Prawda jest jednak taka, że nieprecyzyjnie odzwierciedlone elementy ciała człowieka dowodzą, że sztuczna intelignecja renderuje te obrazy za pomocą zlepek wielu innych grafik, ale również dowodzą, że algorytmy uczące, nie są w stanie nauczyć sieć neuronową kształtów ludzkiego ciała z odpowiednią szczegółowością. Model DALL-E mini ma dobre właściwości do renderowanie różnej abstrakcji - jeżeli zdjęcie nie musi przypominać niczego co istnieje w naszym świecie to jest fajny efekt:

craiyon1.png

craiyon2.png

Ale gdy chcemy wyrenderować coś bardziej prawdziwego, to w najlepszym wypadku powiemy, że królik z załączonego przykładu ma pewien stopień upośledzenia😀 :

craiyon3.png

Warto zauważyć, że dużym osiągnięciem modeli generujących obrazy, jest to, że z całkiem dobrą trafnością ,komponują ze sobą różne elementy obrazu - wygenerowany królik, ma bardzo mało defektów, ale ogólny wynik mocno trafia w wygląd królika albinosa.

A co jeżeli spróbujemy zmusić sztuczną inteligencję, żeby nie trafiała w ogólny schemat? Wynik eksperymentu zazwyczaj jest dziwny:

craiyon4.png

Dla zainteresowanych lista różnych generatorów obrazów: https://www.unite.ai/10-best-ai-art-generators/
Pozdrawiam!

Jestem ogólnie pod wrażeniem tych 'prac', jak i tych wrzucanych przez @jhalik - ich jakość pozwala na wywalenie ilustratorów jako zbędnych. Na szczęście prawo jest czasami nielogiczne i prawnicy jeszcze zostaną trochę na rynku

Fakt. To jednak jest następny poziom. Chociaż możliwości wydają się dość mocno ograniczone nie tylko problemami jakie ma algorytm, ale także preferencjami stylistycznymi programistów. Ogólnie wszystko dość podobne do siebie. Widać uznano, że taka stylistyka dominuje w pop-kulturze i każdy będzie chciał mieć obrazek w takim słodko-sentymentalnym stylu. Nawet jeżeli są inne style do wyboru, to prawdziwy artysta potrafi łączyć konwencje, stylistyki i wychodzić poza ich ograniczenia, nawet jeżeli daje się do jakiegoś stylu przyporządkować, jak jest w większości przypadków.