Paradoks i ironia kreatywności wspomaganej sztuczną inteligencją
Inspiracją do napisania artykułu było bombardowanie LinkedIna copypastami napisanymi przez aplikację Viral Post Generator, która na podstawie 100 tys. przeanalizowanych wpisów potrafi wygenerować nieskończoną liczbę trafnych i prześmiewczych komentarzy, utrzymanych w stylu użytkowników portalu. Początkowa idea zakładała, że napiszę tylko pierwszą część tekstu, o tym, w jaki sposób sztuczna inteligencja zmieni stanowiska i kulturę branży kreatywnej. Wpadłem nawet na pomysł, żeby samemu wykorzystać narzędzie oparte na sztucznej inteligencji do napisania wstępu. Poprosiłem o to narzędzie Copymatic.ai, oto co otrzymałem:
Obrzydliwym wyjaśnieniem automatyzacji humanistyki w latach 2020 - pięćdziesiątych XXI wieku jest możliwość zaproponowania innej, szersze perspektywy życia. [pisownia oryginalna]
Zdecydowałem, że ten artykuł powinien być trochę dłuższy.
Dyskretna, nieuchwytna rewolucja
Nowe technologie powstają, gdy dostrzeżona zostanie możliwość ulepszenia, lub przyspieszenia określonego procesu. Jednak AI to coś więcej dla branży kreatywnej. Narzędzia takie jak DALL-E 2, czy Midjourney służące do generowania obrazów na podstawie wpisanego tekstu, obiecują wzmocnienie kreatywności, odwołując się nie tyle do pracy projektanta, co do powszechnej aspiracji w dzisiejszym społeczeństwie. To bardzo silna, a przede wszystkim prawdziwa obietnica, spełniona przez istniejące narzędzie.
To, co zaskakuje jeszcze bardziej, to szczerość twórców, którzy otwarcie mówią o ograniczeniach narzędzia. Materiały promocyjne komunikują, że sztuczna inteligencja jest jedynie tak dobra, jak baza danych na której operuje. Cała procedura, której efektem jest magiczna zamiana tekstu na obraz, w języku twórców to coś naprawdę prostego i zrozumiałego: algorytm łączy kilka różnych obrazów, identyfikując występujące w nich podobieństwa. W ten sposób sztuczna inteligencja nie próbuje konkurować z unikalnością i niepowtarzalnością ludzkiej percepcji, gdyż widzi inaczej niż my. To co w głowie operatora jawi się jako wizualna reprezentacja czegoś, dla AI jest zbiorem pikseli o określonych parametrach.
Rzadko w opowieściach o futurystycznych technologiach można spotkać się z tak wierną realizacją obietnicy, czy wręcz skromnością w opowiadaniu o niej. Jednocześnie gołym okiem da się dostrzec ogromne tempo w jakim technologia ta rozwija się . W zaledwie 9 miesięcy jakość i precyzja generowanych obrazów zaliczyła przeskok porównywalny do tego, który w grach komputerowych zajął dekadę. Już dziś nie ulega wątpliwości, że przy obecnym tempie rozwoju, narzędzia do sztuki generatywnej w ciągu najbliższych lat staną się następnym, rewolucyjnym, a przede wszystkim powszechnym narzędziem.
Renesans inżynierii wspartej wiedzą bezużyteczną
Aby w pełni zrozumieć potencjał, trzeba posłuchać ludzi, którzy na poważnie zajmują się designem. John Mauriello prowadzący na YouTube kanał Design Theory, projektant i wykładowca na California College of Arts, określa doświadczenie z DALL-E 2 jako szok porównywalny z zobaczeniem po raz pierwszy działającej żarówki. Podobnie jak w jej przypadku, uderzająca jest prostota i inkluzywność rozwiązania: samo zobaczenie działania, nawet bez faktycznego zaangażowania, wystarczy by zamienić cię w użytkownika lub beneficjenta. Powtarza się także uzależniający mechanizm: tak jak w po pierwszym wieczorze przy świetle żarówki trudno wyobrazić sobie powrót do depresyjnej izby z kapiącą świeczką, tak po kilkugodzinnej sesji eksperymentowania ze sztuczną inteligencją, projektant nie może zasnąć podekscytowany ogromem możliwości po przeniesieniu się na nowe plateau świadomości.
Metafora transhumanizmu i farmakologii poszerzającej świadomość tu się nie kończy. Sztuczna inteligencja wspomagająca projektowanie to w istocie narzędzie o nadludzkich możliwościach, bo pozwala na automatyczny wgląd we wszystko, co dotychczas zdołała zobaczyć, udokumentować i skatalogować ludzkość. Przyspieszenie z jakim projektant ma dzięki temu do czynienia jest mniej więcej stukrotne: 2 godziny wystarczają na wytworzenie 400 wczesnych prototypów dowolnego rozwiązania, z czego część stanowi frapującą i godną rozwijania koncepcję. Jest jednak haczyk związany z taksonomią baz danych.
Wszystkie opisywane aplikacje idealnie wpisują się w schemat prawa Bushnella: easy to learn, difficult to master. O ile każdy może wpisać w narzędzie dowolne hasło i otrzymać satysfakcjonujący wynik, powiedzmy:
… to już bardziej zaawansowane prompty, nastawione na wygenerowanie obrazów wpisujących się w określone konwencje estetyczne wymagają posiadania ponadprzeciętnej wiedzy o kulturze, oraz zdolności do posługiwania się zniuansowanymi pojęciami odnoszącymi się do konkretnych nurtów, efektów i artystów:
Wyłania się równanie: kulturowe kompetencje osoby posługującej się narzędziem + jej znajomość bazy danych narzędzia decydować będzą o jakości, dopasowaniu i oryginalności wyniku. Dlatego jeszcze zanim nastąpi masowa adopcja narzędzia, ujawni się konieczność wytworzenia systemowych rozwiązań zapewniających pojawianie się sensownych wyników. Już teraz mówi się o konieczności adaptacji firm chcących wykorzystywać AI w projektowaniu do przyjęcia zupełnie nowego typu pracowników: osób z akademicką wiedzą z zakresu historii sztuki i teorii kultury, które jako nieliczne posiadają kompetencje do bardzo precyzyjnego formułowania instrukcji dla sztucznej inteligencji. Wyłonienie się stanowiska prompt designera, oznaczać będzie również konieczność zmian organizacyjnych w firmach inżynierskich. Rezydujący w nich na stałe absolwenci politechnik nie będą mogli już tak otwarcie wyśmiewać niepraktycznych, odklejonych i nieprzystających do nowoczesnych realiów humanistów, bo dzielić będą z nimi open space i okno w Teamsach.
Koniec efektu czystej kartki
Jednak związanych z kulturą wyzwań wyłaniających się w procesie adopcji rozwiązań opartych na AI będzie więcej. Jednym z nich jest całkowita redefinicja etapu eksploracji. Dziś poszukiwanie wstępnego punktu zaczepienia jest jednym z najbardziej chaotycznych, wywołujących niepewność odcinkiem projektowania. Ten etap jest trochę jak jazda na deskorolce: trudny z zasady i mocno zależny od fuksa. Chociaż od dekad korporacje próbują facylitować kreatywność i promować agile’owe myślenie, a nawet wstawiają piłkarzyki i Play Station do sali relaksu, po prostu nie da się wymusić pomysłu stosując tego typu metody. Tak jak zaproszony do reklamy napoju gazowanego skejt może przez 6 godzin nie wykonać tricku, tak projektant może na początku generować same nudne i niepasujące do zadania koncepcje. Dopiero trwający dziesiątki godzin etap poszukiwań pozwala zapoznać się z tematem i własnym procesem myślenia, przez co wykrystalizowanie się spójnej i dopasowanej do tematu myśli po prostu staje się możliwe.
Z psychologicznego punktu widzenia, etap ten polega na uczeniu się nowych rzeczy po przez obserwację szeregu eksperymentów. Doświadczenie staje się podstawą selekcji obiecujących konceptów, argumentacji, i zaangażowania projektanta. Popularyzacja AI nie tyle zastąpi ten proces, co zmieni jego kolejność: pozwoli na oglądanie prototypów jeszcze zanim rozpocznie się wspomniany etap uczenia się, bo możliwym stanie się wytwarzanie 400 wersji wobec których nikt nie ma żadnego stosunku.
Innym problemem jest sposób działania narzędzia: AI nie jest w stanie śnić o niczym, czego już wcześniej nie zwizualizowano. Dlatego herbata z owocami i laską cynamonu w mroźny wieczór przy kominku jest dla algorytmu czymś oczywistym, natomiast szklanka stojąca na łyżce jest czymś, czego ta wyrocznia nie może i nie będzie mogła zobaczyć. Jeśli połączyć to z logiką działania narzędzia: łączenia różnych obrazów po przez odnajdowanie podobieństw, prowadzi to do konkluzji, że wynikiem przestawienia się ludzkości na AI-assited design będzie jeszcze bardziej zglobalizowany i stereotypowy design.
Powstaje pytanie: Dlaczego w takim procesie ktokolwiek miałby uwierzyć w konkretny kierunek i chcieć uargumentować go przed innymi? Niwelując trudność wczesnego projektowania, a przy tym nie wspomagając abstrakcyjnego myślenia o projekcie po jakimś czasie proces ten przestanie jakkolwiek fundamentalnie różnić się od scrollowania treści na Facebooku, o których ani się nie myśli, ani nie czuje. Tymczasem projektowanie to taki dziwny safe zone, w którym da się zarabiać na niestaniu się nigdy częścią świata revenue, który na zmianę zupełnie pozbawiony jest kształtu, lub przybiera formę strzałki w stanie bezustannej erekcji. To dyscyplina, w której występuje priming osób, które bardziej niż wynik fascynuje zabawa w ciuciubabkę i poszukiwanie tego czegoś, czego jeszcze nie udało się zdefiniować. Trudno uwierzyć, że na dłuższą metę disrupting suszarka wygenerowana w chmurze podczas parzenia kawy to naprawdę to, o co chodzi tym ludziom.
W najlepszej wersji może to oznaczać zmianę profilu projektanta niedalekiej przyszłości, a w najgorszej całkowitą inflację tej profesji, gdyż w świecie gdzie istnieje chmura wyrzucająca gotowe obrazki projektantami staną się wszyscy posiadacze wifi. Dodając do tego retoryki o przyspieszaniu, zwiększaniu efektywności i usunięciu niepewności, myślenie koncepcyjne zblatowane zostaje z manufakturą w rozumieniu dystopijnej taśmy, gdzie kilku prompt designerów generuje po 400 obrazków, które przed godziną 17:00 muszą zostać ocenione na korytarzowym warsztacie design thinking. Najlepsza koncepcja to ta, do której przyklejonych zostanie najwięcej żółtych karteczek, przez osoby zmierzające do toalety.
Dlatego…
Jeśli:
Narzędzia do sztuki generatywnej pozwolą na natychmiastowe tworzenie prototypów, skracając do minimum proces uczenia się w projekcie
To:
Koniecznym stanie się wytworzenie zupełnie nowej kultury decydowania, analizowania i obróbki prototypów w projektowaniu przemysłowym
Więc:
Masowa adopcja tych narzędzi wytworzy zapotrzebowanie na osoby o humanistycznym, nietechnicznym profilu w firmach o profilu stricte inżynierskim.
Przyszłość powoli i stopniowo anulowana
Charakterystyczną, powtarzającą się reakcją na wspomagające twórczość algorytmy sztucznej inteligencji jest ekscytacja przyspieszaniem, przy jednoczesnym całkowitym pomijaniu refleksji na temat ich roli i wpływu na kulturę. Sztuczna inteligencja oparta na bazie danych wypełnionej obrazami z przeszłości, od poziomu idei do wykonania kontynuuje kurs, na którym znajdujemy się od conajmniej 30 lat, w dodatku pogłębiając zapętlające się tendencje kultury współczesnej.
Brytyjski krytyk kultury i pisarz Mark Fisher pisał, że ostatnią dekadą, w której ludzie naprawdę oczekiwali czegoś nowego były lata 90. Sprowadzając tę myśl do ikony: tylko do wtedy oczywistym było, że Kurt Cobain nie powinien być kolejnym Michaelem Jacksonem. Jednak już tak nie jest. Utraciliśmy zdolność wyobrażania sobie zupełnie nowych, oryginalnych idei, a wręcz przestaliśmy ich oczekiwać od czegokolwiek. Megatrend estetyczny modern retro, obsesja remiksowania staroci, inicjowanie bezustannych powrotów i tworzenie remake’ów treści, które nie są nawet stare, stają się tego egzemplifikacją w erze postinternetowej.
W sztukach audio-wizualnych:
Motoryzacji:
Kinie i serialach:
Konwencjach nazewniczych:
Gamingu:
…i dosłownie wszędzie indziej.
Umieranie estetyk przed epoką internetu pozwalało zaistnieć potrzebie czegoś nowego, co zapełniłoby powstającą lukę. Dziś nie jest to już możliwe, gdyż utrwalony cyfrowo i zmultiplikowany na tysiącach serwerów estetyczny skansen uniemożliwia wytworzenie przestrzeni na cokolwiek czego jeszcze nie było i nic nie zapowiada się, żeby miało się to odmienić. Właśnie to miał na myśli Fisher pisząc w książce Ghosts of My Life: Writings on Depression, Hauntology and Lost Futures, że przyszłość powoli i stopniowo zostaje anulowana.
Na płytkim poziomie można zrozumieć to jako utyskiwanie starego punka na wszystko, co nowe. Jednak te rozważania mają swoje drugie dno. Jeśli uświadomimy sobie, że przeciętna osoba doświadcza i przeżywa życie jako uczestnik kultury, to nawiedzające nas duchy w postaci tej pętli nawiązań to nie tylko symptom powierzchownej fascynacji, ale przede wszystkim faktycznej tęsknoty za utraconą, lepszą rzeczywistością. Zarówno tej z przeszłości, jak i dopiero nadchodzącej, a co stało się dla wszystkich w tej chwili jasne - nigdy nie mającej nadejść. To tak, jakby całe społeczeństwo niczym bohater filmu Memento doświadczało amnezji następczej, przez co sens teraźniejszości i wynikającej z niej bliskiej przyszłości dało się poznawać wyłącznie poprzez przypadkowe zapiski, rysunki i tatuaże z przeszłości.
Przyczyną takiego stanu jest wieloletnia dominacja ideologii ciągłego wzrostu, będącej istotą neoliberalnego fundamentalizmu. Podporządkowanie kolejnych systemów społecznych prawu popytu w pierwszej kolejności zmienia ich funkcjonowanie, długoterminowo anulując ich sens. Gdy przyjmiemy, że refleksja ta dotyczy wyłącznie dziedzin związanych ze sztuką, łatwo da się tę myśl zbanalizować i sprowadzić do przebrzmiałej narracji o komercjalizacji. Jednak analizując jego wpływ na materialne wymiary naszej egzystencji, oznacza to proces gentryfikacji miast i zawłaszczania przestrzeni publicznych przez deweloperów i korporacje. Dlatego mimo wzrostu na papierze coraz częściej żyjemy w nierealizującej potrzeb jednostek, coraz nudniejszej i mniej inspirującej przestrzeni, zamieszkując struktury przypominające ludzki chów klatkowy. Idąc głębiej, ideologia ciągłego wzrostu zysków i efektywności deformuje nawet samą siebie, czego odzwierciedleniem jest hasło fake it till you make it, które oznacza tyle, że możesz nic nie zrobić by stać się milionerem. Jednym z wielu ekstremalnych przykładów tego zjawiska jest przypadek Elizabeth Holmes, która otrzymała 700 mln. $ na rozwój firmy Theranos, obiecującej skondensowanie całego szpitala do urządzenia wielkości drukarki laserowej. Punktem kulminacyjnym tego procesu jest upadek mitu merytokracji w społeczeństwie informacyjnym, którym rzekomo jesteśmy. Objawia się to degradacja roli instytucji naukowych i NGOs, które aby przetrwać muszą spełniać zachcianki tych, którzy zamawiają u nich kolejne raporty i podręczniki pełne wiedzy sprzyjającej ich interesom, lobbying na rzecz szkodliwych idei, a także mediami podporządkowanymi koniunkturze clickbaitów. To symulowana rzeczywistości, w której cokolwiek przestało mieć swój pierwotny sens.
Właśnie ten stan umysłu reprezentuje sztuka generatywna, która jak każdy inny system z pewnością stanie się kolejnym trybikiem w machinie deformowania rzeczywistości.
Marzenia o Francuskiej Riwierze w świecie Trumana
Paradoksem i ironią jest, ze postępujące anulowanie sensów zaczyna się u źródła jakim jest sama kreatywność. Przykładem na to jest ewolucja międzynarodowego konkursu kreatywności Cannes Lions. To co chcę podkreślić: konkurs ten jest bardzo wymagający, a zdobycie w nim wyróżnienia oznacza konieczność posiadania konkretnych umiejętności, z tego miejsca pozdrawiam wszystkich jego laureatów. Obserwacja zwycięskich prac, wyłania kompleksowy schemat rozumowania, który leży tu u podstaw. Najprostszym sposobem na zdobycie wyróżnienia w konkursie jest identyfikacja problemu społecznego i zwrócenie na niego uwagi w zaskakujący sposób, tak jak od lat robi to na przykład Dove, co roku rozbijając bank w Cannes.
Po pierwsze, zupełnie przezroczystym stało się dla wszystkich, że rozwiązywania problemów społecznych nie oczekujemy już od instytucji pożytku publicznego i państw, tylko od marek, których jedyną funkcją jest zdobywanie dominacji na półce w supermarkecie. Takim sposobem istotą kreatywności stało się wynajdowanie problemów, które sam neoliberalizm tworzy, a potem zatrudnianie tworów neoliberalizmu do ich rozwiązywania, co przekłada się na ich ciągły wzrost. Zgodnie z tą logiką, opłaca się więc hodować społeczeństwo z problemami psychicznymi, funkcjonujące w warunkach pogłębiającego się kryzysu klimatycznego i pogrążonego w wojnach, bo te zapewniają wzrost na wysokomarżowych rynkach.
Po drugie, konkurs reprodukuje schematy uprzedzeń i konserwuje postkolonialny porządek świata. W skrócie: jeśli chcesz wygrać, a jesteś przypadkowo na przykład z Afryki, Środkowego Wschodu, Europy Wschodniej, lub Ameryki Południowej to optymalnym będzie jeśli pokażesz międzynarodowej komisji, że twój pomysł walczy z typowymi dla twojego świata problemami, np: przemocą wobec kobiet, homofobią, degradacją środowiska naturalnego, kataklizmami spowodowanymi zmianami klimatu, czy wojną i złym reżimem. Nie ważne, że w twojej części świata nie ma bogatego, zachodniego społeczeństwa, a dziejące się problemy są pochodną globalnej polityki, lat wyzysku i kolonializmu, wszechobecnego politycznego populizmu i ideologii bezustannego wzrostu. Ważne, żebyś przeganiał ich smoki u siebie i robił to posługując się znakomitym angielskim.
Po trzecie, powstająca w wyniku aspiracji do zdobycia nagrody w firmach panuje przyzwolenie na ghost ads, których nikt nigdy nie widział, a mimo to zgłaszane są do konkursu. Do tego dochodzi zwyczaj przeszukiwania repozytorim Canness przez projektantów, w celu odnalezienia inspiracji. Popularną praktyką jest spędzanie godzin w archiwach na przeglądaniu prac konkursowych z poprzednich dekad, jako rodzaj szkolenia rozwijającego potencjał kreatywny, co wpisuje się w fisherowski opis współczesnej kultury. Nagroda należy się za łączenie kilku różnych konceptów z zamkniętej bazy danych, poprzez zhiperbolizowanie występujących wśród nich podobieństw, doklejenie do wytworzonej w ten sposób koncepcji logo klienta i narracji wpisującej się w postkolonialne stereotypy o zacofanym, dzikim południu i wschodzie. Trudno odróżnić ten sposób wsobnego recyklingu case'ów od tego, w jaki sposób w oparciu o swoje bazy danych myśli algorytm do tworzenia sztuki generatywnej.
A jeśli tak, to po co dalej grać w taką grę? Ja nie potrafię na to pytanie odpowiedzieć.
Poniżej przykładowe prace wytworzone przez użytkowników DALL-E 2: