A mesterséges intelligencia vadnyugattá változtatta a digitális művészetet
2023. február 2. – 22:18
2022 kétségtelenül a mesterséges intelligencia (MI) éve volt, és minden jel arra utal, hogy innentől igazából mindegyik az lesz. A Microsoft a napokban jelentette be, hogy több milliárd dollárral támogatja meg a ChatGPT és a DALL-E 2 nevű MI-modellek mögött álló OpenAI-t, és lassan úgy érezheti az ember, hogy akárhová nyúl, MI által generált tartalmakba fog ütközni. A technológia robbanásszerű fejlődését a ChatGPT csetbotja mellett legjobban talán a különféle képgenerátorok előretörése mutatta meg az átlagembereknek, így
nem meglepő módon ezzel kapcsolatban merült fel a legtöbb aggály is, az adatvédelmi problémáktól a főként a digitális művészek által vizionált disztópikus látomásokig, ahol az MI megfojtja az emberi kreativitást.
Utóbbi különösen forró téma volt az elmúlt hónapokban, és amellett, hogy parázs viták alakultak ki az MI-n alapuló képgenerátorok támogatói és ellenzői között, egy rakás fontos piaci szereplő is állást foglalt a kérdésben, és több per is indult már az ügyben. Az olykor kemény acsarkodásig fajuló viták és a világvége-hangulat ellenére a mesterséges intelligencia belátható időn belül nemhogy nem megy sehova, hanem valószínűleg még prominensebb is lesz, de az is biztos, hogy jelenlegi formájukban nem véletlen, hogy sokan aggódnak miatta.
Ebben a cikkben arról lesz szó, hogy mi a bajuk a digitális művészeknek a feltörekvő generatív modellekkel, miért olyan nehéz kérdés megállapítani, hogy egy MI-n alapuló modell képei jogilag rendben vannak-e, és hogy elveheti vagy tönkreteheti-e az MI a digitális művészek munkáját.
Legyen ön is művész!
Mielőtt belevágnánk a témába, először érdemes gyorsan rögzíteni, hogy a generatív MI egy olyan szoftver, amelyet egy hatalmas adathalmaz segítségével megtanítottak arra, hogy korábban nem létező, új tartalmakat állítson elő, a szövegektől a képeken át a videókig. A mesterséges intelligenciákról, illetve az ezek által generált tartalmakról utoljára tavaly nyáron írtunk részletes cikket, amikor a legtöbb képgeneráló szoftver még nem volt egyszerűen elérhető a nagyközönségnek, azóta azonban jelentősen megváltozott a helyzet. Noha korlátlan használatra továbbra sincs lehetőség, a DALL-E 2-höz és a Midjourney-hez is viszonylag könnyen lehet hozzáférést szerezni, és nagyot mentek az olyan alkalmazások is, mint a Stable Diffusion nevű modellen alapuló Lensa, amellyel másodpercek alatt lehet profilképeket generálni a saját arcunk alapján mindenféle stílusban.
A huzamosabb ideig történő használatért persze fizetni kell, de az egyértelmű, hogy már a tavaly júliusi állapothoz képest is jelentősen demokratizálódott a technológia azzal, hogy akár egy Discord-szerveren vagy egy telefonos alkalmazásban is hozzá lehet férni. Ennek megfelelően az elmúlt hónapokban a csapból is MI által generált képek folytak. Az utóbbi időben különösen népszerű trend volt, hogy a Harry Pottertől a Bosszúállókig mindent újragondoltak már nyolcvanas években készült dark fantasy-filmként, a magyar interneten pedig nagyot futottak a We Plants Are Happy Plants néven zenélő Bergmann Péter képei, aki ugyancsak MI-vel képzelte el, milyen lehetne például Budapest 2064-ben.
Ezen a ponton gyakorlatilag csak egy ötlet kell ahhoz, hogy valaki digitális műveket alkosson, attól függően pedig, hogymennyit szöszölünk a képek generálásához használt parancsokkal, egészen meggyőző eredményeket is el lehet érni. Jó példa erre az, hogy tavaly szeptemberben egy MI által generált kép nyerte meg a digitális művészeknek kiírt kategóriát a coloradói állami vásár képzőművészeti versenyén. Jason Allen a Midjourney-vel alkotta meg a Théâtre D’opéra Spatial című győztes pályaművet, amit jelzett is, és bár a zsűri tagjainak ez semmit sem mondott, később a tudás birtokában is megvédték a döntésüket.
Allen a New York Timesnak hangsúlyozta, hogy semmilyen szabályt nem sértett meg, ami valóban így is volt. A vászonra nyomott kép győzelme viszont így is nagy port kavart a művészvilágban, sokan a művészet halálának és az emberi kreativitás meggyalázásának nevezték az alkotást, és azt is kifogásolták, hogy Allen művésznek nevezi magát, pedig nem tett mást, csak bepötyögött pár szót egy generatív modellbe. Mások viszont azzal érveltek, hogy kreatív munkára így is szükség volt, és az egész tulajdonképpen nem sokban különbözik attól, mintha Photoshopot vagy más hasonló szoftvert használt volna.
Allen egyébként azt írta, hogy több száz képet generált, és hetekig tartó finomhangolás után választott ki hármat, amelyeket végül vászonra nyomtatott. Ezt tényleg fontos kiemelni, mert ahogy arra a Wired korábbi cikke is rámutatott, a végeredmény szempontjából egyáltalán nem mindegy, hogy milyen parancsokat adunk az MI-nek. Már az is sokat számít, hogy melyik modellt használjuk – a Midjourney által generált képek általában festményszerűek, a DALL-E 2 viszont inkább a realizmus felé hajlik –, maguk a parancsok pedig alapjaiban tudják megváltoztatni azt, hogy egy kép pontosan hogy néz ki, még ha az alapötlet nem változik is menet közben. Ha valaki jó képet szeretne, annak ugyanúgy meg kell dolgoznia érte, csak a munka itt ecsetvonások helyett szavakkal zajlik.
A cikk egészen odáig ment, hogy a filmrendezőkhöz hasonló művészeknek nevezte azokat, akik MI-vel generálnak képeket, amivel azért lehet vitatkozni, de az tény, hogy már most létezik olyan virtuális piactér, amelyen különféle parancsokat lehet venni néhány dollárért, és az is biztos, hogy a legjobb képek mögött álló emberek nem szívesen osztják meg csak úgy a saját, aprólékosan kidolgozott parancsaikat. A Wired a folyamatot a fotózáshoz hasonlította, ami egyébként nem rossz analógia – ahhoz nem kell sokat gondolkodni, hogy csináljunk egy képet, de hogy azt művészetnek lehessen nevezni, már nem elég csak simán megnyomni egy gombot.
Egyszer már elmaradt a világvége
A fotózás azért is jó példa, mert ez az egyik, ha nem a leggyakrabban előkerülő érv amellett, hogy az MI nem fogja kitúrni a valódi művészeket, elvégre a fényképezőgép megjelenése sem jelentette a festészet halálát. A fotótörténettel foglalkozó Hans Roseboom egy 2006-os cikkében írt arról, hogy a fotózásnak gyakorlatilag semmilyen negatív hatása nem volt a 19. századi holland festőkre. Roseboom szerint még a portréfestőket sem forgatta ki a vagyonukból az új technológia, sőt évtizedekkel a megjelenése után is volt egy fellángolása ennek az iparágnak.
A fotózás persze jelentős hatást gyakorolt a festészetre, és sokkal szélesebb körben tette elérhetővé a pillanat megörökítését, de ennek számos pozitív hatása volt az alkotókra nézve is. A festés mellett például már fotózni is tudtak, skiccek helyett használhattak fényképeket referenciaként, és a megrendelésre készült festményeket is meg tudták örökíteni maguknak, amire korábban legfeljebb akkor volt lehetőség, ha nem kis munkával készítettek egy másolatot. Azt is érdemes megemlíteni, hogy a fotózás megjelenésének fontos szerepe volt az impresszionizmus megjelenésében.
A fényképezőgép tehát a korai években megfogalmazott aggályokkal ellentétben valójában kiszélesítette a művészek lehetőségeit, és azt is, hogy pontosan mit nevezünk művészetnek. Ebből kiindulva könnyen lehetne amellett érvelni, hogy jelenleg valami ilyesmi történik az MI-n alapuló modellekkel is, a művészek ellenállása pedig nem más, mint egy minden ilyen esetben törvényszerűen lezajló folyamat egyik lépése, pár évtized múlva pedig már egyértelmű lesz, hogy kár volt emiatt aggódni. A Wired cikkét jegyző Kevin Kelly pontosan így is tett, és olyan jövőt vázolt fel, amelyben a művészek végső célja az lesz, hogy bekerülhessenek abba az elitbe, amelynek gondosan kiválasztott művei alapján tanítják az MI-modelleket.
Az elképzelés kétségtelenül izgalmasan hangzik, de rengeteg alkotó és piaci szereplő korántsem ilyen optimista, és az elmúlt hónapokban sokan fogalmaztak meg sarkos véleményt arról, hogy mi a bajuk az MI-vel. Az egyik leggyakrabban előkerülő videó ezek közül Steven Zapata nevéhez fűződik, aki meglehetősen lesújtóan beszélt az MI-ről, illetve a művészek jövőjéről abban a világban, ahol ezek a modellek szabadon garázdálkodhatnak.
Zapata szerint egyértelmű, hogy az MI hosszú távon biztosan nem egy újabb eszköz a művészek kezében, hanem olyasmi, amit konkrétan a leváltásukra hoztak létre, és ami ennek megfelelően előbb-utóbb emberi interakció nélkül is működni fog. Annak ellenére pedig, hogy valószínűleg nem lesz képes olyan dolgokat alkotni, mint egy valódi művész, a tőlük begyűjtött és szintetizált tudás birtokában annyival nagyobb tempóban és mennyiségben fog dolgozni, hogy lehetetlen lesz érvényesülni vele szemben.
Zapata víziója kétségtelenül extrém, gyakorlatilag a lehető legrosszabb forgatókönyvet vázolja benne. Abban viszont igaza van, hogy a képalkotó MI-modellek jelenlegi formájukban etikusan minimum megkérdőjelezhető módon tanulnak, az ezekhez felhasznált adatbázisok ugyanis tele vannak jogvédett tartalmakkal, amelyek alkotói nem járultak hozzá ahhoz, hogy ilyen célra használják fel a képeiket.
Mosó Masa adatmosodája
A jogvédett tartalmakról szóló vitáknak a téma szempontjából kevésbé fontos, de mindenképpen érdekes kérdésük az, hogy lehet-e jogvédett tartalom valami, amit egy gép alkotott meg. Tavaly az Egyesült Államokban jogvédettséget kapott egy Midjourney-vel készített képregény, nem sokkal később viszont az amerikai szerzői jogi hivatal visszatáncolt, és további bizonyítékokat kért arról, hogy a képregény elkészítésében számottevően részt vett annak alkotója vagy ha úgy tetszik, generálója is, így az ügy jelenleg is folyamatban van. Kanadában viszont vettek már szerzői jogi nyilvántartásba mesterséges intelligenciát, az Egyesült Királyságban pedig kizárólag számítógép által generált alkotásokat is be lehet jegyeztetni, bár az a szöveg alapján nem egyértelmű, hogy ilyenkor ki az alkotó.
A témával az Európai Unió is évek óta foglalkozik. Tavaly is jelent meg róla részletes anyag, egy ugyancsak tavalyi elemzés szerint pedig az MI közreműködésével készített alkotások lehetnek jogvédettek az EU-ban is.
A fontosabb kérdés viszont nyilván az, hogy lehet-e jogvédett tartalmakat használni az MI-modellek tanítására, és ha igen, akkor pontosan mikor. A DALL-E 2 és a Midjourney tanításához használt adatbázisok például nem nyilvánosak, így nem lehet tudni, hogy dolgoznak-e ilyen tartalmakból a modellek. A Stable Diffusion (és nem mellesleg a Google Imagen) mögött álló LAION-5B viszont igen, ahogy az erről publikált tanulmány is, ebből pedig le lehet vonni néhány aggasztó következtetést. Ebbe az adatbázisba egy több milliárd weboldal adatait csokorba szedő nonprofit szervezet, a Common Crawl által kiadott adatokból gyűjtöttek össze közel 6 milliárd képet, többek közt olyan helyekről is, mint a DeviantArt vagy a Getty Images, noha az itt közzétett tartalmak nem szabadon felhasználhatók.
Ez önmagában nem feltétlenül baj: az MI-vel foglalkozó cégek és szakemberek is előszeretettel állítják, hogy ez az úgynevezett méltányos használat (fair use) alá esik, amely a véleménynyilvánítás szabadsága érdekében lehetővé teszi a jogvédett tartalmak szabad felhasználását. Ez a doktrína alapvetően az Egyesült Államokban létezik, de a nem kereskedelmi célú felhasználás esetében a briteknél és az EU-ban is van ilyesmi. A LAION-5B-t egy LAION nevű nonprofit szervezet hozta létre, a már említett tanulmányban a kutatók nyomatékosan jelzik, hogy csak kutatási célokra javasolják a felhasználást, az ezen az adathalmazon betanított Stable Diffusiont pedig hivatalosan egy német egyetem licenceli.
A valóságban viszont ez inkább amolyan fedősztori a modell mögött álló Stability AI-nak, amely rengeteg pénzt tolt bele a LAION-ba, hivatalosan mégis eltávolította magát a projekttől, és nyugodtabban kérhet pénzt az ugyancsak a Stable Diffusionön alapuló, DreamStudio nevű szolgáltatásáért. De ugyanezt lehet elmondani a már említett Lensáról is, ami ugyancsak a Stable Diffusion modellt használja a képek generálásához. Baio erre a jelenségre korábban adatmosásként (data laundering) hivatkozott, és azt is hozzátette, hogy ezzel a módszerrel már korábban is sikerült elkerülni a felelősségre vonást. Ez pedig most is könnyen megtörténhet, hiába nyílt titok, hogy a LAION működését nagyrészt pont a Stability AI finanszírozza.
Nem tudni, mi lesz, de lehetne mit tenni
Hogy mindennek mekkora a jelentősége, az persze attól függ, hogy kit kérdezünk. Az MI támogatói szerint lényegében nulla, mert egy-egy kép vagy portfólió hatása elenyésző, és még ha valaki befolyásos művész is, a stílusa már annyi embert inspirált, hogy nélküle is simán reprodukálható lenne. A művészek szerint viszont nonszensz, hogy míg más szektorokban meg van oldva a szerzői jogok védelme, addig itt simán megtörténhet az, hogy a képeiket nem pusztán felhasználják, hanem gyakran pénzért árulják a stílusukat másoló, potenciálisan az ő saját munkájuk értékét csökkentő képeket, miközben még az aláírásuk maradványai is ott vannak rajtuk.
Emiatt még akkor is teljes joggal vannak felháborodva a művészek, ha a technológia támogatóihoz hasonlóan feltételezzük, hogy ennek a gyakorlatban nem lesz valódi jelentősége. Az elmúlt hónapokban kifejezetten forró téma volt az, hogy etikus, sőt egyáltalán legális-e az a gyakorlat, ahogy jelenleg a modelleket tanítják, és nem véletlen, hogy konkrét intézkedések is születtek ennek a visszaszorítására. Az egyik legnagyobb stock fotókat és illusztrációkat áruló ügynökség, a Getty Images szeptemberben döntött úgy, hogy a jogi aggályokra hivatkozva betiltja az MI-modellek által generált tartalmakat, nemrég pedig keresetet nyújtott be a Stable Diffusion mögött álló Stability AI ellen, arról írva, hogy a cég jogtalanul gyűjtött be több millió képet a platformról.
Craig Peters, a Getty vezérigazgatója a Verge-nek azt mondta: a módszer, ahogyan a cég begyűjtötte az adatokat a modellje tanításához, szerinte nem tartozik a már emlegetett méltányos használat alá, és ugyanerre jutott három prominens digitális művész is, akik néhány nappal korábban pert indítottak a cég, illetve a Midjourney, valamint az ugyancsak saját generatív MI-vel előálló DeviantArt ellen. Annak ellenére tehát, hogy a Stability AI már decemberben megígérte, hogy a művészek eltüntethetik majd a képeiket a Stable Diffusion következő verziójának tanítására használt adatbázisból, és az ArtStation, a DeviantArt és a Shutterstock is lehetővé tett ilyesmit, jogosan merül fel a kérdés, hogy számít-e ez még akkor, amikor a mostani modelleket is szabadon lehet használni, és az is egyértelmű, hogy a korábbi tapogatózás után elkezdődött a jogi háborúzás a felek között.
Azt, hogy ennek mivel lehetne véget vetni, egyelőre senki nem tudja megmondani. A Verge tavaly nagyon részletes cikkben vesézte ki az MI-modellek jogi problémáit, ez alapján pedig leginkább a zeneipar kétezres években végbement átalakulásához hasonló módszerekkel lehetne közelíteni egymáshoz a feleket. A lapnak akkor egy szakértő arról beszélt, hogy a kétezres évek elején pár évig tündöklő Napstert mindenki imádta, de természetesen teljesen illegális volt, később viszont a zeneiparban sikerült olyan megállapodásokat kötni, amelyek tiszteletben tartották a szerzői jogokat is, így pedig megszülettek az olyan zenei streamingszolgáltatók, mint a Spotify vagy az iTunes.
Ez a párhuzam azért különösen jó, mert a Stability AI egyébként dolgozik egy generatív zenei modellen is, és érdekes módon itt külön kiemelik, hogy kizárólag jogtiszta és beleegyezéssel biztosított zenéket használnak fel az adatbázisban, hogy megfeleljenek a zeneipar szigorú szerzői jogi előírásainak.
A licencelős modellnek persze megvannak az ellenzői, egy sokat idézett cikk például amellett érvel, hogy olyan hatalmasak a modellek tanításához használt adatbázisok, hogy egyszerűen nem reális, hogy minden bennük szereplő alkotást licenceljenek, és az is gyakori érv ez ellen, hogy egy ilyen méretű adathalmaz esetében elenyésző összeget kapnának a művészek a saját képeik után. És persze azt is hozzá kell tenni, hogy függetlenül attól, hogy licencelik-e a képeket vagy sem, továbbra is ott van az az elemi szintű probléma, hogy az MI-modellek előretörése sokak szerint közvetlenül árthat a digitális művészeknek, és megnehezítheti, hogy megéljenek a munkájukból. Hogy végül ez következik be, vagy az MI a fényképezőgéphez hasonlóan új életet lehel a művészetbe, azt ezen a ponton lehetetlen megmondani, az etikai problémákat viszont már most is el lehetne kezdeni megoldani.
A Transtelex egy egyedülálló kísérlet
Az oldal mögött nem állnak milliárdos tulajdonosok, politikai szereplők, fenntartói maguk az olvasók. Csak így lehet Erdélyben cenzúra nélkül, szabadon és félelmek nélkül újságot írni. Kérjük, legyél te is a támogatónk!
Támogató leszek!