Maskinerna ritar bilder

AI-verktyg används allt oftare i den kreativa processen, bland annat i skapandet av bokpärmar. Det har väckt kritik, men praxisen har också sina försvarare. Otto Donner funderar över skillnaden mellan konst skapad av mänsklig och maskinell intelligens.

Diskussionen om AI-genererade bokpärmar blossade upp hösten 2024 när Yle publicerade nyheten om att Finlandiaprisvinnaren Anni Kytömäkis senaste roman Mirabilis (Gummerus 2024) publicerats med ett AI-genererat ”fotografi” på pärmen.

I Yle-artikeln säger sig Kytömäki ha varit tveksam över omslaget men att hon ändrat sig efter att ha hört förlagets motiveringar.

”I sin helhet skiljer sig processen inte jättemycket från hur bokpärmar har gjorts före AI. Gummerus har i åratal använt bildbanksbilder som grafiker sedan modifierat. Helheten har skapats genom att kombinera och redigera ett flertal bildbanksbilder med ett bildbehandlingsprogram” säger Aleksi Pöyry, förläggare på Gummerus med ansvar för inhemsk skönlitteratur och digitala böcker till Yle. (min översättning)

Det handlar alltså inte om att mata in bokens text i bildgeneratorn och låta den skapa pärmen, utan om att en människa har bestämt vad den vill ha på pärmen och sedan bett AI-generatorn producera det.

Vad är en bokpärm?

Vad är en bokpärm? Vad är den till för? Till stor del beror det på boken.

Är boken en nöjesprodukt, och pärmen dess etikett som, likt serveringsförslagen på livsmedelspaket, ger tips om hur innehållet ska avnjutas?

Är den ett informationspaket som lär läsaren något nytt, som främst behöver vara stryktålig, okänslig för smuts och hållas öppen på köks- eller arbetsbänken?

Eller är boken ett konstverk, nåt som utmanar läsaren och visar det bekanta i ett nytt ljus, och pärmen konstverkets framsida, med uppgift att förmedla något av vad det handlar om, försköna och i bästa fall tillföra något till helheten?

Är den fysiska boken behållaren för författarens tankar, textens kropp, och pärmen dess ansikte?

Vilken inställning man väljer påverkar hur man ser på pärmens uppgift, och därmed pärmens visuella uttryck.

Ofta används pärmen för att signalera till läsaren vilken sorts bok det är frågan om.

Till exempel brukar deckare ha pärmar som passar bra in med idrottsbiografierna och böckerna om romarriket i ”ge pappa en bok till farsdag”-annonserna i kvällstidningarna. Tänk svart bakgrund, författarens namn i stora röda bokstäver, spindelnätsliknande kulhål i svartvita fönster.

Chick lit-böckerna lyser rosa och turkosa en hylla bort, med sina snirkliga skrivstilstitlar, glittriga högklackade skor och cosmoglas.

En synlig trend inom den ”seriösa” litteraturen är att återgå till stramt typografiska omslag, för att signalera att här är vi minsann inga skojare.

Kort sagt, det finns många slags böcker, och många slags behov.

Vad menar vi med AI?

Den här texten behandlar inte framtidsvisioner om hyperintelligenta syntetiska medvetanden, utan bildgeneratorer, det vill säga AI-modeller som ”tränats upp” på miljontals bilder, och utgående från denna enorma mängd data kan producera nya bilder på basen av användarnas textkommandon.

AI-modellerna är problematiska eftersom en del av materialet de ”tränats” på är copyright-skyddat och många konstnärer upplevt att de blivit plagierade av AI-modellen.

Modellerna reproducerar också fördomar och stereotyper som finns inbakade i träningsmaterialet, och har till exempel en förkärlek för en viss typ av generiskt ”vackra”, ofta vita, ansikten. På det sättet bidrar bildgeneratorerna paradoxalt nog till en snävare visuell kultur, med mindre utrymme för genuin mångfald.

Förutom det behöver bildgeneratorerna och hela den generativa AI-industrin (vid sidan av bildgeneratorer också mer textbaserade verktyg som ChatGPT och andra stora språkmodeller) så mycket energi för att fungera att datacentren ofta byggs med egna kraftverk.

I en tid där mänskligheten, för att hålla planeten beboelig, borde minska på sin energianvändning är det svårt att etiskt motivera alla de naturresurser vi använder på att generera skojiga bilder på hundar med hattar och mejl vi inte orkar skriva själva.

I en tid där mänskligheten, borde minska på sin energianvändning är det svårt att etiskt motivera alla de naturresurser vi använder på att generera skojiga bilder på hundar med hattar och mejl vi inte orkar skriva själva.

Är inte allt en remix?

Men om vi bortser från klimatproblematiken och den strukturella rasismen då, säger AI-entusiasten, vad är det egentligen som är så problematiskt? Är inte all konst en blandning av nåt som funnits tidigare, kombinerat på ett nytt sätt? Är det inte själva definitionen på kreativitet? Varför är ett collage gjort av upphittade foton bättre än en AI-generators simulation av samma sak?

Man kunde ju förstås säga att generativ AI fungerar på samma sätt som mänsklig kreativitet, det vill säga att en ”hjärna” tar in gamla idéer, blandar om dem och skapar något nytt. Men skillnaden där är att när en människa gör det så filtreras det genom ett mänskligt medvetande och kan skapa något genuint nytt. En AI-modell skapar någonting som är ett medeltal av allt material den tränats på, det mest sanno-lika önskade resultatet, enligt algoritmen.

AI-konst kan aldrig vara överraskande, utom när den gör nånting som för oss – de mänskliga betraktarna, meningsskaparna – ter sig komiskt eller obehagligt.

En värld dominerad av AI-bilder är dekorerad till tänderna men tom på mening.

Och hur är det med gränsfallen? Säg att jag gör ett collage av AI-genererade bitar. Är det nån skillnad då? Svar: ja, om det syns.

För vi ska inte lura oss själva: vi bryr oss bara om att pärmen är AI-genererad om vi märker det.

Tillbaka till Mirabilis

Omslaget till Anni Kytömäkis roman Mirabilis. Foto: Gummerus

Pöyry på Gummerus säger i Yle-artikeln att AI i fallet Mirabilis har ersatt och försnabbat bildbehandlingsarbetet, men att grafikerns konstnärliga vision för bokpärmen ändå har förblivit likadan, och att grafikern även bearbetat den AI-genererade bilden och gjort ändringar i den.

Den sista låter som något som förlagets advokater bett honom poängtera. Enligt nuvarande finsk lag har AI-genererade bilder ingen upphovsperson, och kan därför inte skyddas av upphovsrätten. Undantaget är om de har modifierats av en människa tillräckligt mycket för att räknas som ett helt nytt verk.

Om detta är grafikerns konstnärliga vision kan man konstatera att grafikern måste ha haft bråttom den veckan som Mirabilis-omslaget gjordes. Det är okej, det kan hända den bästa. För att undvika burnout tar man ibland till en nödlösning, men det är synd när nödlösningen landar på pärmen till en prisbelönt författares roman.

Med ett tydligt AI-genererat ”porträtt” på AI-genererade vågor, och en typografi så generisk att fonten är ett mem i sig själv, är pärmen som en övning i att uppfylla konventioner utan att introducera ett enda intressant element, det mest visuellt färdigtuggade man kan tänka sig.

Problemet med Mirabilis-pärmen är alltså inte användningen av AI i sig, utan att pärmen är generisk och fantasilös.

Just den här pärmen hade inte varit speciellt bra även om den gjorts som ett klassiskt fotomontage, utan AI. Men den hade varit bättre.

Det tydligt AI-genererade porträttet av ett generiskt ”vackert” ansikte som ändå inte liknar någon som någonsin funnits på riktigt och sättet ljuset faller som smetiga penseldrag på tigerns päls får pärmen att se plastig, billig och ”fejk” ut, som en bok som -Barbie skulle läsa i en 3d-animation.

Och det är kanske här problemet ligger: när jag ser Mirabilis-pärmen tänker jag att ingen brytt sig tillräckligt mycket om texten för att ens försöka göra den rättvisa med en genom-tänkt pärm,vilket får mig att undra varför jag då själv skulle bry mig om boken.

Meningslöst bildflöde

Bland AI-entusiasterna på Reddit är det vanligt med kommentarer i stil med att AI-bildgeneratorer innebär en stor demokratisering av bildkonsten.

Som om alla människor innerst inne var fulländade konstnärer, och allt bara är fråga om hantverk, om vem som orkat träna upp sin hand.

Men det handlar om så mycket mer än så.

Att öva sig på någonting, att lägga ner så mycket tid på någonting, påverkar också ens tänkande.

Lika mycket som det handlar om att lära sig att rita så handlar det om att lära sig se.

Den kreativa processen handlar om att konstant göra val.

Val av linje, färg, komposition, foto, typsnitt.

Valen baserar sig på erfarenhet, på denna förmåga att se som tränats upp under alla tusentals timmar man stirrat, och ritat, och stirrat, och justerat.

AI reducerar mängden val som måste göras, erbjuder större helheter att välja mellan, men gör det svårare att påverka enskilda detaljer – användaren går från skapare till något som mer påminner om en kräsen kund. ”Designprocessen” börjar påminna om att använda en bildbank, att sitta och klicka sig genom dåliga alternativ tills man hittar ett acceptabelt.

Men naturligtvis kan det ibland bli riktigt fint också.

I Jorge Luis Borges novell Biblioteket i Babel innehåller det ofattbart stora biblioteket böcker med alla tänkbara bokstavskombinationer. Detta inbegriper allt från Shake-speare till instruktionsmanualer till rent nonsens. Men det krävs en läsare, en betraktare, en människa, för att ge det mening.

Och precis som i Borges bibliotek eller liknelsen om en miljon apor med skrivmaskiner, så lyckas AI-generatorer ibland producera intressanta resultat. Men ”skaparen” vet inte om att de är intressanta, kan inte se nån skillnad mellan dem och allt det andra den producerat. För det krävs en betraktare, nån med en hjärna. Nån som kan uppleva verket, och ha en åsikt om det.

AI kan producera nåt som liknar mänsklig konst, men kan inte skapa mening.

Här närmar vi oss på många sätt diskussioner som ofta förs om nutidskonst, och hur avsikt, orsak och kontext kan göra konst av alldagliga ting. Det viktigaste är inte vad, utan hur och framför allt varför.

En femåring kunde antagligen ha skapat vissa av exempelvis Cy Twomblys konstverk, men om femåringen hade gjort det så kunde hen inte säga varför hen gjort just på det sättet, eller vad som är fint med just det här verket.

Det går säkert att producera intressant bildkonst med hjälp av AI. Men det måste vara konceptet, konstnärens vision, och inte det AI-producerade materialet i sig som är det intressanta.

”Designprocessen” börjar påminna om att använda en bildbank, att sitta och klicka sig genom dåliga alternativ tills man hittar ett acceptabelt.

Och sen då?

Så hur ser framtiden ut?

På basen av intresseföreningarna Grafias och Kuvittajat ry:s medlemsundersökningar verkar den allmänna uppfattningen inom branschen vara att generativ AI är ett potentiellt användbart verktyg, men att det bör användas på ett ansvarsfullt sätt, av en människa som vet vad den håller på med. Detta kombinerat med oro över etiska, upphovsrättsliga och ekologiska problem, samt över att klienternas villighet att betala för ”traditionell” design och illustration minskar.

Som jag ser det kommer AI knappast att försvinna, även om den nuvarande hypen kommer att lugna ner sig när den ekonomiska bubblan oundvikligen spricker i något skede. Och med tiden blir det säkert svårare att se vad som är gjort av en maskin och vad som är gjort för hand.

Och knappast försvinner det mänskliga, handgjorda heller – men risken finns att det blir en lyxprodukt, nåt som bara de med ”god smak”, det vill säga mycket pengar, har råd att hålla sig med.

Människor kommer inte att sluta göra bilder för hand, men i framtiden kommer säkert en del av böckerna att ha AI-genererade pärmar. Man kunde säga att det i vissa fall inte är så farligt – det är inte som om alla bokpärmar är stor konst nu heller.

Men man kunde också säga att vi alla, och särskilt författarna, har rätt att kräva mer.

Ett manuskript som skrivits och slipats i hundra- och tusentals timmar förtjänar en yttre form skapad med en omsorg och en uppmärksamhet som motsvarar den som gått in i att producera textmaterialet.

Bilder: Otto Donner, Gummerus

Maskinerna ritar bilder

Otto Donner

Lämna en kommentar

Läs mer om stödmedlemskapet.