Erdély és MI: így értelmezi és készít festményt akár tájainkról is a mesterséges intelligencia
2022. október 27. – 12:31
frissítve
Már évek óta vita folyik arról, hogy a mesterséges intelligencia képes-e ember által művelt művészetre? Legutóbb 2019 környékén kapott nagyobb médiafigyelmet a téma, azóta idén nyáron ért el újabb szintet a technológia. Erdélyben most először Csíkszeredában mutatnak be kimondottan olyan festményeket, amelyeket MI generált, a témáról Szabó W. Péter MI kutatóval, a Tengr.ai platform alkotójával beszélgettünk.
Idén Csíkszereda ad otthont a 8. Digitális Székelyföld Konferenciának, ahol ritkaságnak számító kiállítás is lesz: olyan festményeket mutatnak meg az érdeklődőknek, amelyeket mesterséges intelligencia (MI) állított elő. Igaz, nemrég Kolozsváron is szerveztek hasonló témakörben művészeti performanszt, csakhogy az ott bemutatott képeket nem az MI generálta, hanem helyi művészek különböző digitális eszközökkel alkották meg.
„Az MI kiállítások nemzetközi szinten is ritkaságnak számítanak, de ez csak idő kérdése” – fejtette ki a marosvásárhelyi Szabó W. Péter MI kutató, a Tengr.ai platform megalkotója, aki Túros Eszter csíkszeredai művészettörténész közreműködésével többek között Nagy Imre, csíkzsögödi származású festőművész munkásságát „tanította meg” az MI-nak. A fejlesztő itt kiemelte: erre csak úgy volt lehetőségük, hogy a Csíki Székely Múzeum nagyon jó minőségben digitalizálta a festő munkásságát.
A kiállításra öt különböző témakört dolgoztak fel a mesterséges intelligencia kapacitását kihasználva: Erdély, gyerekjáték, háború, születés és 2084 (Orwell 1984 című regényének koncepcióját egy jövőbeni kontextusba helyezve).
„Erdély egy könnyen érthető koncepció, főleg azoknak, akik itt élnek. A gyerekjáték is elsőre egyszerűnek tűnik, de ez egy olyan témakör, amit nagyon nehéz a mesterséges intelligenciának feldolgoznia. Ennek az a magyarázata, hogy a »gyerekjáték« gyűjtőfogalomra nagyon kevés találat áll rendelkezésére a tanuló adathalmazból, lévén, az emberek egy gyerekjátékot inkább specifikusan címkéznek: plüssmackó, labda, kisvonat, stb. Ha egy hagyományos művésztől azt kéred, hogy fessen egy gyerekjátékot, akkor ő könnyebben át tudja lépni ezt a logikai bukfencet, ugyanis egyszerűen kiragad valamit az ő elképzelése szerint és azt lerajzolja” – magyarázta a fejlesztő.
„A kubista stílussal ötvözve például érdemesebb távolról megnézni a képet: ebben benne van egy kis játék a színekkel és távolról mintha kirajzolódna egy mosolygós arc, valami kis bábu, egy gyerekjáték. Itt nem a részleteket kell figyelni, hanem az összhatást” – hívta fel a figyelmet. Hozzátette, hogy a Kandinsky stílusával ötvözve érdekes módon már a társasjátékok darabjait és azok formavilágát emeli ki az MI. A fejlesztő ugyanitt elmondta, a művészeti alkotások értelmezéséről a művészettörténész fog bővebb betekintést adni a konferencián: mégis melyik kép illik bele a kor művészeti ívébe, mi az, ami működik és mi az, ami nem.
Konkrétan mire lehet használni az MI által generált képeket?
„Az egyik legegyszerűbb és legnyilvánvalóbb felhasználási módja, hogy alternatívát ad a stock fotók piacának. A globális fotóarchívumoknak 2020-ban már körülbelül 3,3 milliárd dolláros nagyságú piaca volt, ami azóta is bővült. Ezeket az illusztrációkat rengeteg sajtóorgánum, marketinges cég használja világszerte, a legnagyobb baj, hogy sok esetben így sem találsz olyan fotót, amelyre neked épp szükséged lenne. Ha rá is bukkansz valamire, hamar rájössz, hogy azt már nagyon sok felületen használták. Erről jut eszembe, mennyire vicces volt, mikor 10 évvel ezelőtt minden cég weboldalán ugyanazt az asztalnál ülő, multikulturális társaságból álló stock fotót lehetett látni… Az MI által biztosított képek ebben nagy segítségedre lehetnek, mert minden generált kép egyedi és olcsóbban megszerezheted, mintha stock fotós csomagokat vásárolnál” – magyarázta a szakértő.
„Egyébként én hiszek abban, hogy ez vissza fog gyűrűzni valamilyen szempontból a művészeti ágazatba is: úgy gondolom, hogy 1-2 éven belül eljutunk oda, hogy nem az infósok generálják ezeket a képeket, hanem a művészek fogják. Ez azért fontos, mert vannak jól működő modelljeink, amelyek minőségi képeket tudnak generálni rekord idő alatt, csakhogy emellé kellene egy »művészeti látásmód is«: ők kellene kitalálják a témát, ki kell emelni a legjobbakat és utómunkával még egyedibbé tenni azokat. Egyébként már számtalan ilyen kezdeményezés létezik” – mutatott rá a kutató.
Művészet, nem művészet?
Valószínűleg nem kell jövőt jelölő képzőt használnunk akkor, ha automatizációról, tehát a robotok által végzett „munkáról” folytatunk diskurzust. A mesterséges intelligencia most már ott van a gyárakban, a szolgáltatói iparban, a banki szektorban vagy kommunikációs felületeken is beszőtték a munkafolyamatokba. Ettől függetlenül ugyanúgy megoszlanak az álláspontok arról, hogy a technológia fejlődése segíti az ember munkáját, vagy épp az ellenkezőjét éri el és teljesen kitaszítja a humán erőforrást ezekből az ágazatokból.
Valamilyen hasonló dilemmázás zajlott az utóbbi négy évben arról, hogy a mesterséges intelligencia értékesebb művészetet alkothat-e az embernél. Ez a kérdéskör főként 2018 után került a figyelem központjába, miután egy hagyományos árverésen mesterséges intelligencia által generált festményt adtak el. A képet a párizsi Obvious Art művészcsoport fejlesztése hozta létre, a GAN (Generative Adversarial Networks) modellre épülő program több mint tizenötezer portrét vizsgált át a 14. századtól egészen a 2018-as időszakig és ezek alapján alkotta meg többek között a fiktív francia úriember, Edmond De Belamy portréját. A liciten végül „egészen hihetetlen áron”, 432 500 dollárért kelt el a festmény, azóta is ez tartja a rekordot a hagyományos műkincspiacon. Ezt valószínűleg azért nem döntötte meg azóta senki, mert az NFT-k felvirágzása óta a mesterséges intelligencia alkotásait sokkal egyszerűbb volt digitális tokenként értékesíteni, ezen a szinten pedig már dollármilliós tranzakciók is történtek az elmúlt időszakban.
Több elemző, művészettörténész is úgy tartotta, hogy a generatív művészet gyökerei még a huszadik századba nyúlnak vissza. A mesterséges intelligenciát használó első kísérleteken főként absztrakt elemek, geometriai minták jelentek meg, melyeket az orosz Wassily Kandinsky vagy a svájci Paul Klee munkásságával vontak párhuzamba.
De ha már 20. század: az AI művészet pártfogói a dadaista Marcel Duchamp-t is említik, a digitális művészet forradalmát többen a híres, piszoárból készült Szökőkút című alkotáshoz hasonlítják. A francia művész itt az alkotói folyamat helyett inkább az alkotás koncepcióját állította középpontba, az érvelők szerint pedig nagyon hasonló folyamatok történnek akkor, ha az AI hozza létre a műalkotást. Más – szintén támogató meglátások szerint – a digitális művészet egy olyan úttörő, mint amilyen a fénykép volt. A tradicionális művészek egy része a fényképezőgép megjelenésekor is tiltakozott, a másik része viszont megtanult fényképezni.
Az AI művészetét kritizáló tábort erősítő vélemények főként abban összpontosulnak, hogy a mesterséges intelligenciával gyakorlatilag gúnyt űznek azokból a képzőművészekből, akik több évtizeden keresztül tökéletesítenek egy stílust, egy alkotási formát. Most pedig jön egy programozó, aki egy nap leforgása alatt megtanítja a mesterséges intelligenciának ezt a stílust, a festő pedig semmilyen anyagi hozzájáruláshoz nem jut.
Szabó W. Péter nyitva hagyta ezt a kérdéskört. A fejlesztő szerint ha a „végterméket vesszük”, mára már a szakemberek sem tudják megkülönböztetni, hogy ember vagy AI festett egy bizonyos képet. „Ezt az is bizonyítja, hogy egy coloradói állami vásáron egy Ai által készített kép versenyzett az emberek által készített alkotásokkal, az első helyet pedig a mesterséges intelligencia munkája kapta meg. Az ilyen összehasonlító versenyeket véleményem szerint nem nevezhetünk fairnek, mert egy ember csak limitáltan tud más alkotóktól, képekből inspirálódni. Jelen pillanatban sokkal hatékonyabban tanul az AI, és úgy jön ki, mintha egy futóversenyen valaki motorbiciklivel indulna” – vélte a szakember.
Dr. Mérő László matematikus, pszichológus mondta egyszer: „Elvileg nevezhető művészetnek az, amit mesterséges intelligencia alkot, ennek ellenére nem gondolom, hogy az is lesz, ugyanis az MI nem érti, mi célja a művészeteknek. Az emberi alkotónak céljai és mondanivalója van azzal, ha fest egy képet, a gép azonban »csak« az utánzásban jó. Abban a pillanatban, amikor nincs mit utánozni, unalmassá válik a »munkásságuk«”.
„Itt egy alapvető feltevés sántít” – reagál Szabó. Szerinte téves az a percepció, miszerint a gép csak utánozni képes. „Sajnos mi, mint mesterséges intelligenciával foglalkozó szakemberek is rájátszunk erre, és ez a csíkszeredai kiállítás is ezt húzza alá. De mindezt azért tálaljuk így, mert ebben a formában láttuk azt, hogy befogadható és érthető lehet a laikus érdeklődőknek. Festmények és képek készítéséhez nem lett volna muszáj megadni egy ismert festő stílusát. A mesterséges intelligenciának adhatunk csupán egy témát, ami lehet mondjuk az »idő születése«. Most egyébként azon dolgozunk, hogy olyan modellt alkossunk, amelyhez nem kell semmilyen »human input«, azaz emberi parancs” – árulta el Szabó.
Legutóbb 2019-ben kapott nagyobb médiafigyelmet az AI Art, mi történt idén?
Ha nagyvonalakban szeretnénk összesíteni, Szabó szerint három fontos fejlemény játszik közre abban, hogy a művészettel foglalkozó technológia sokat fejlődött az elmúlt 3 évben:
- A “mesterséges intelligencia művészettel foglalkozó, nagyobb startupjai (például: a Stability AI) egy körülbelül egymilliárd dolláros értékelést és több befektetői csoportot is kaptak. Ez az egymilliárd dollár egy fontos lélektani határ, ettől kezdve számítanak ugyanis unikornis cégeknek (az unikornis startup vállalkozásokról itt írtunk bővebben). A Stability AI két nagy dobást hozott idén nyárra: egyrészt közzétettek egy óriási, non-profit adathalmazt, amelyben szinte 6 milliárd kép-szöveg párt gyűjtöttek egybe, ebből tudnak tanulni a mély neurális hálózatok. Ez az adathalmaz komoly nagyságrendi ugrás ahhoz képest, hogy eddig mit használtak a korábbi modellek.
- A Stability AI kutatási alapja a korábbi, fentebb is említett GAN (Generative Adversarial Networks) modell mellett egy sokkal stabilabb és megbízhatóbb, úgynevezett diffúziós modellt is használ. Ennek a lényege, hogy a képgenerálás az adott paraméterekkel kevésbé “véletlenszerű”, ezért az ipari felhasználása is biztosítható.
- 2019 óta megnőtt azoknak a publikációknak a száma, amelyek kimondottan a deep learningre (mély tanulásra) fókuszálnak, ezért egyre több cég kezdett gépi tanulással foglalkozni az olyan nagy klasszikusok mellett, mint a Meta, a Google, vagy az Amazon.
„Utóbbival kapcsolatban magyar vonatkozású érdekesség: a múlt héten üzemelték be Magyarországon a Komondor nevű szuperszámítógépet, amelynek a mesterséges intelligenciát kutató része a régióban a legfejlettebbnek számít” (…) Ugyanúgy Spanyolország és Németország is bejelentette, hogy teljesítmény szempontjából jóval nagyobb számítógépeken dolgozik, de meglátásom szerint az MI-kutatásban a gyorsaság sokkal fontosabb a kutatók számára, hiszen mire azok elkészülnek, már az is lehet, hogy elavultakká válnak. Egyébként a környéken Bulgáriában is készítettek szuperszámítógépet és nagyon szomorú, hogy Romániában még csak projekt szinten sem létezik elképzelés ezzel kapcsolatban. Ez azért baj, mert rengeteg MI kutató él az országban, például innen indult az egyik leghíresebb unikornis startup, az UiPath is, ami most már amerikainak számít. Sajnos az alapító, Daniel Dines nem tudott itt maradni, mert az ország nem a szolgáltatások exportálására törekszik, hanem az emberek munkáját akarja eladni, ami a romániai adókörnyezet mellet egy hatalmas öngól: rengeteg a szakember, abból nagyon sokan foglalkoznak mesterséges intelligenciával, ehelyett a munkánk gyümölcsét más országok aratják le" – mondta a kutató.
A művészettel foglalkozó MI erdélyi vonatkozásával kapcsolatban elmondta: 2022 azért is számít egyfajta mérföldkőnek, mert a világ legnagyobb startupjai egyre több open bétát (a béta verzió a fejlesztési ciklus része, amikor a fejlesztők megmutatják munkájukat egy nagyobb közösségnek, időközben tesztelik és javítják a jelentett hibákat) tettek közzé, ami fontos előrelépés, hiszen eddig nagyon nehezen tudot a laikus közösség MI képeket generálni.
Szabó szerint a frissen alapított Tengr.ai -val igyekszik majd részben választ találni arra az öt nagy problémára, ami a béta modellekkel kapcsolatban eddig felmerült:
- még mindig nehézkes a felhasználói élmény,
- szeretné, ha valamilyen szinten az angoltól függetlenné tennék az MI művészetet;
- jobban bevonni a hagyományos művészeket;
- kihasználni, hogy az Európai Unióban sokkal rugalmasabb a szerzői jogi keret, mint például az Amerikai Egyesült Államokban;
- a fejlesztéseket lassítja, hogy komoly energiát kell fektetni a cenzúrázásba: “az MI kutatásban rengeteg időt, energiát és feszültséget jelent, hogy a modellek megfeleljenek a kulturális elvárásoknak. A korábbi modelleknek például azért nem voltak befektetőik, mert nagyon rasszisták. Ha például beírod a »CEO« címkét, akkor a generált képeken mind fehér férfiak lesznek. Ugyanígy, ha »kórházi ápoló« szókapcsolatot adsz meg, akkor mind latino nőket dob ki. Csakhogy az a helyzet, hogy nem a mesterséges intelligencia rasszista, hanem a világ rasszista, az MI tulajdonképpen egy tükörképet ad azokból a digitális eszközökből, ami a rendelkezésére áll. Az MI-nak nincs ilyen kulturális érzékenysége, neki evidens, hogy a világ így működik. Erre olyan mgoldásokat találtak, hogy számtalan kulcsszót kizártak, mint például Hitler, vagy »big black« (nagy fekete). Persze ezt is könnyen ki lehet játszani a körbeírással. A lényeg, hogy a folyamatos cenzúrázás nagyon belassítja a folyamatokat.
A Transtelex egy egyedülálló kísérlet
Az oldal mögött nem állnak milliárdos tulajdonosok, politikai szereplők, fenntartói maguk az olvasók. Csak így lehet Erdélyben cenzúra nélkül, szabadon és félelmek nélkül újságot írni. Kérjük, legyél te is a támogatónk!
Támogató leszek!