Jak sztuczna inteligencja zmienia historię sztuki?

Jak sztuczna inteligencja zmienia historię sztuki?

Odpowiedź generatora obrazu AI DALL-E na monit „Mondrianowskie malowanie pomidora wspinającego się po drabinie nad morzem” (dzięki uprzejmości DALL-E)

Ludzie wstają, gdy ręka artysty zostaje oderwana od końcowego dzieła sztuki. Czy fotografie prawdziwy sztuka?” mruczeli w XIX wieku. „Boże, nienawidzę tego Pollocka” – krzyczeli hejterzy, widząc poplamione płótno, którego artysta najwyraźniej nigdy nie dotknął. Nic więc dziwnego, że generatory obrazów AI wprawiły historyków sztuki w zakłopotanie, ponieważ coraz więcej artystów korzysta z tych narzędzi, aby informować o swojej praktyce. Uwielbiam zagłębiać się w to, co doprowadza ludzi do wrzenia w świecie sztuki, a tego lata sztuczna inteligencja wkradła się do tabeli liderów irytujących. Ale dlaczego? I czego może nas to nauczyć o historii sztuki i konsumpcji wizualnej?

DALL-E 2, program do generowania sztucznej inteligencji przetwarzający tekst na obraz, został udostępniony publiczności tej jesieni. Początkowa wersja modelu – której żartobliwa nazwa pochodzi od sympatycznego robota Disneya WALL-E z 2008 roku i surrealistycznego artysty Salvadora Dali – została wydana w styczniu 2021 roku przez laboratorium badawcze OpenAI. Wersja technologii, DALL-E Mini, została wydana wcześnie na platformie Hugging Face, szturmem podbijając Twittera jako sensację memów i sprawiając, że program zyskał międzynarodowe zainteresowanie poza ekspertami AI. Ponad 1,5 miliona użytkowników tworzy ponad 2 miliony obrazów dziennie za pomocą DALL-E.

DALL-E 2 wykorzystuje model „GPT-3” CLIP (Contrastive Language-Image Pre-Training, ogłoszony przez OpenAI w zeszłym roku), komputerowy system wizyjny, do generowania obrazów o rozdzielczości 1024 × 1024 pikseli z wpisywanych poleceń tekstowych. Narzędzie zostało wyszkolone przy użyciu 650 milionów par obrazów i podpisów pobranych z Internetu. Po zebraniu par obraz-tekst naukowcy przeszkolili model CLIP w celu generowania tekstu w celu dokładnego opisania obrazu, tworząc matematycznie zależny model. Następnie DALL-E odwrócił ten proces, generując obrazy, które są dobrze opisane przez wprowadzone dane tekstowe na podstawie danych CLIP. Użytkownicy mogą również używać DALL-E 2 do „przemalowywania” obrazów — rozszerzania istniejących obrazów poza ich poprzednie granice — oraz do edytowania wcześniej istniejących obrazów za pomocą poleceń tekstowych.

Obraz DALL-E na podstawie podpowiedzi: „Impresjonistyczny obraz przedstawiający pomidora wspinającego się po drabinie nad morzem”.

Podczas wprowadzania żądania DALL-E 2 otrzymujesz instrukcję „zacznij od szczegółowego opisu” oraz przykład „impresjonistycznego obrazu olejnego słoneczników w fioletowym wazonie”. Ale co właściwie DALL-E 2 „rozumie” przez styl impresjonistów? Lub jakiś styl artystyczny lub ruch, jeśli o to chodzi? Używając tej samej podpowiedzi „pomidor wspinający się po drabinie nad morzem”, wystawiłem na próbę historyczną sprawność DALL-E 2.

Dla impresjonistów („Impresjonistyczny obraz pomidora wspinającego się po drabinie nad morzem”), DALL-E 2 wydaje się identyfikować, że jest to styl oparty na luźnych pociągnięciach pędzla i kontrastach kolorów wskazujących na wpływ światła.

Wykonał zaskakująco dobrą robotę, określając również, co rozumie się przez sztukę „XVIII wieku”. Dodanie elementów tekstury po bokach i stworzenie naprawdę dość królewskiego obrazu. Co ciekawe, DALL-E 2 reprezentował dzisiejszy wygląd XVIII-wiecznych dzieł sztuki, których paleta kolorów zmatowiała przez czas.

Interpretacja DALL-E przedstawiająca „XVIII-wieczny obraz przedstawiający pomidora wspinającego się po drabinie nad brzegiem morza”.

Moim osobistym faworytem była interpretacja stylu Roberta Mapplethorpe’a przez DALL-E. Monochromatyczny obraz nadał pomidorowi wyraźnie piggijski wygląd, seksowny ukłon w stronę postaci Mapplethorpe’a. Monit „Rzeźba Henry’ego Moore’a” również wywołał u mnie uśmiech: wydawałoby się, że DALL-E 2 ma drugą naturę, że rzeźba wymaga cokołu.

Było kilka stylów, w których DALL-E był mniej biegły w odtwarzaniu, jak De Stijl czy surrealiści. Udało się dobrze zinterpretować „Mondriana” na monicie, dodając proste linie, które przecinają obraz. Wystarczająco blisko. Pomidor Warhola również uchwycił trochę płaskości związanej z jego pracą, a próba kubizmu była – miejscami – kanciasta.

Zabawa z DALL-E 2 rodzi dwa pytania: w jakim stopniu ta technologia może naprawdę „zrozumieć” sztukę i czy warto widzieć historię sztuki wyrażoną ilościowo w „umyśle” maszyny?

Iryna Ryslyayeva, kierownik ds. komunikacji w firmie konsultingowej Provectus zajmującej się sztuczną inteligencją, powiedziała Hyperallergic, że chociaż DALL-E 2 nie ma zdolności emocjonalnych ludzkiego naukowca, „modelka widziała więcej obrazów, obrazów, stylów itp. niż większość ekspertów” [in] ludzkości, a jej opinia będzie subiektywnym, ale wszechstronnym poglądem”.

Prawdą jest, że DALL-E 2 rzeczywiście zoptymalizował setki miliardów parametrów w swoim poszukiwaniu wiedzy, ale należy pamiętać, że obrazy, które wykorzystał, niekoniecznie były „neutralne”. Podobnie jak artyści rzucają spojrzenie na swoje płótna, DALL-E 2 wchłonął zestaw danych nie bez własnych uprzedzeń. José Lizarraga, starszy doradca ds. innowacji i kreatywny w Algorithmic Justice League, rozmawiał ze mną na temat tego problemu spojrzenia: „Uderzające w sztuce generowanej przez sztuczną inteligencję jest to, że jest ona zależna od systemów i korpusu artefaktów wizualnych, które wciąż wyśrodkowują biel. Heteroseksualne męskie spojrzenie — ze względu na to, kto jest reprezentowany w świecie projektowania i rozwoju technologii oraz kto zajmuje się moderacją treści… Podobnie wykazano, że generuje obraźliwe i rasistowskie obrazy ze względu na niefiltrowane dane, z których korzysta sztuczna inteligencja.

Kubistyczny „pomidor wspinający się po drabinie nad morzem” DALL-E.

Zgadza się z tym profesor Sunil Manghani z University of Southampton, który niedawno założył specjalną grupę zajmującą się sztuką i sztuczną inteligencją. Powiedział, że uprzedzenia w zbiorze danych wpływają nie tylko na to, jakie spojrzenie jest platformowane przez kreacje DALL-E 2, ale także na jego dokładność w odtwarzaniu niektórych gatunków.

„Będą historyczne uprzedzenia” – powiedział Manghani w wywiadzie dla Hyperallergic. „Prawdopodobnie mniej będzie obfitować w bardzo wczesne dzieła, podczas gdy dzieła bardzo współczesne również mogą zostać zniszczone (częściowo z powodów związanych z prawami autorskimi). To stawia nas w „środku” z być może dużą przewagą stylów, takich jak impresjonizm, surrealizm, [and] Ekspresjonizm.”

Jakie miejsce zajmuje więc ta technologia w toczącym się pisaniu historii sztuki? Manghani podaje trafną metaforę generowania obrazu DALL-E 2: „Gdy rzucę monetą trzy razy i wyrzucę wszystkie orły, mogę pomyśleć, że prawdopodobieństwo wyrzucenia orła jest większe. Ale jeśli rzucę monetą 1 milion razy, będzie całkiem jasne, że jest 50/50. W związku z tym modele dyfuzji obrazu, choć niezwykle sprytne pod względem metody (konwertują obrazy na szum, a następnie ponownie dostrajają się do wiarygodnego lub prawdopodobnego obrazu), tak naprawdę działają tylko na podstawie wcześniej istniejących obrazów. W tym sensie, po co mielibyśmy je dodawać do historii sztuki? DALL-E 2 odtwarza wszystko, co było wcześniej”.

Andy Warhol w wersji DALL-E „pomidor wspinający się po morskiej drabinie”.

Jednak te obrazy – choć oparte na stałym zbiorze danych z przeszłości – są Nowy. Maghani widzi sedno problemu jako to, co definiujemy „historię sztuki” jako: „Jeśli traktujesz [art history] jako dyscyplina, którą należy kontrolować, jesteś skłonny odrzucić obrazy DALL-E 2. Jeśli traktujesz historię sztuki jako po prostu wyraz światowej historii tworzenia obrazów (cofając się do początków cywilizacji), to logicznie powinieneś teraz zaakceptować DALL-E 2”.

Wkrótce po opublikowaniu technologii w Hugging Face, memy DALL-E przetoczyły się przez Internet. W ciągu dwóch miesięcy od ogłoszenia DALL-E 2 technologia ta została wykorzystana do wyprodukowania pierwszej okładki magazynu Cosmopolitan wygenerowanej przez sztuczną inteligencję. Wielkie marki, takie jak Heinz i Nestlé, również wykorzystały tę technologię do kampanii reklamowych — Nestlé wybrało szczególnie historyczny punkt widzenia, przemalowując obraz Johannesa Vermeera z 1657 r. Dojarka. Technologia zaczyna głęboko zakorzeniać się w kulturze wizualnej.

Artysta SI Mario Klingemanna zwraca uwagę, że skłonność DALL-E do wiedzy o sztuce niekoniecznie jest jego ostatecznym celem. „Myślę, że powielanie istniejących stylów sztuki i tak nie jest prawdziwym powołaniem dla tych modeli” – powiedział w wywiadzie. Ich prawdziwy potencjał tkwi w uczeniu się, co jest istotne i ważne we wszystkich formach tworzenia obrazów i percepcji, a następnie, miejmy nadzieję, pozwala[ing] nas do odkrywania nowych środków wyrazu”.

DALL-E może stać się instrumentem edukacji artystycznej i niewątpliwie zostanie włączony do praktyk artystów. Rishabh Misra, starszy inżynier zajmujący się uczeniem maszynowym na Twitterze, wspomina o potencjale sztucznej inteligencji jako niezależnej formy sztuki. „AI drastycznie zmieniła naturę procesów twórczych i zakłóca przemysł artystyczny” – powiedział Hyperallergic. „Sztuczna inteligencja może być traktowana jako samodzielna jednostka twórcza, zdolna do powielania aspektów twórczego zachowania artystycznego i zwiększania ludzkiej kreatywności”.

Aditya Ramesh, główny badacz projektu DALL-E, skomentował znaczenie DALL-E dla miłośników sztuki, mówiąc Hyperallergic: „Sztuka generowana przez sztuczną inteligencję stwarza możliwość tworzenia spersonalizowanej sztuki. DALL E pokazało nam, że wiele osób znajduje wartość w procesie tworzenia sztuki i angażowania się w społeczność twórców, nawet jeśli nie mieli formalnego wykształcenia artystycznego”.

To, czy obrazy generowane przez DALL-E mają samoistną wartość jako samodzielne dzieła sztuki, otwiera zupełnie inną debatę. Ale OpenAI przewidział już potencjał DALL-E jako generatora obrazów, wdrażającego przepisy dotyczące treści i zapobiegających fałszywym funkcjom zapobiegawczym, co oznacza, że ​​nie można wygenerować żadnych rozpoznawalnych twarzy. Wydawać by się mogło, że znalezienie ostatecznej odpowiedzi na pytanie, jakie miejsce zajmuje DALL-E 2 w historii sztuki, wymaga ograniczonego spojrzenia na to, czym jest historia sztuki i redukcyjnego zrozumienia potencjału technologii.

Leave a Comment

Your email address will not be published. Required fields are marked *