Site logo
Fabula-net – et fakta tjek

Af Karsten Pers – 19. september 2024

Ugens store bogdebat har handlet om at forskere ved Aarhus Universitet har udviklet en AI-baseret teknologi, der kan bruges til at vurdere, om et ukendt manuskript besidder litterære kvaliteter der har potentiale til at blive en succes.

Fabula-net hedder projektet, som har fået meget opmærksomhed i medier og blandt forfattere og forlæggere den seneste uge. Dagbladet Politiken har fortaget en rundspørge til forlag, om det er et værktøj, de forestiller sig at tage i anvendelse, og Politikens litteraturredaktør Jes Stein Petersen har fået kuldegysninger.

Men hvad er det konkret, forskerne har udviklet, hvilket litteraturkorpus er anvendt til træning, og er der faktisk tale om et praktisk værktøj, som vil blive stillet til rådighed for offentligheden.

Vi bad ‘talsmand’ for projektet Mads Rosendahl Thomsen om at tage os et spadestik dybere. Mads Rosendahl Thomsen er professor i litteraturhistorie ved Institut for Kommunikation og Kultur, leder af Center for Language Generation and AI (CLAI), og siden marts 2023 forperson for Kulturministeriets Bogpanel.

***

Mads Rosendahl Thomsen: Ja, der har været en del omtale. Og noget af det på et grundlag, som ikke repræsenterer projektet korrekt. Vi har altså ikke en maskine, der bare lige kan bruges. Vi stiller snart et dashboard til rådighed (gratis), hvor man kan uploade tekster og se dem sammenlignet på en række parametre med et referencekorpus på engelsk. Men vores brug af maskinlæring, hvor vi træner et system til fx at give et bud på en GoodReads score for en for systemet ukendt tekst, er ikke noget som vi lægger ud. Og det er udelukkende trænet på et engelsk materiale. Vi har beskrevet principperne, og hvis andre kan få noget ud af det, så er det op til dem.

Bogbrancheguiden: Det korpus I har anvendt til at træne på, rummer det helt nutidig litteratur? Og er alle skønlitterære genrer repræsenteret – inkl. ‘populær’ litteratur?

Mads Rosendahl Thomsen: Det er et korpus med bøger fra 1880-2000, og der er alle genrer med, også populærlitteratur. Vi har været glade for at kunne arbejde med det, fordi det er velkurateret og med tekster af høj kvalitet. Det er beskrevet her, og en del af værkerne er også offentligt tilgængelige: https://textual-optics-lab.uchicago.edu/us_novel_corpus. Men det er jo ikke helt ny litteratur, så man kan ikke bare stoppe et nyt manuskript ind i den bunke, og så regne med, at man rammer plet i forhold til 2024.

Bogbrancheguiden: Hvordan definerer I kvalitet i jeres model? Af omtalen kan man få det indtryk, at det primært er kvantitativ succes, der lægges til grund.

Mads Rosendahl Thomsen: Kvalitet er en stor diskussion. To korte svar: på den ene side mener vi at have kunnet udpege nogle bestemte egenskaber ved tekster, som man kan betegne som positive kvaliteter, også i en litteraturhistorisk sammenhæng (men som ikke er udtømmende). Og en anden måde at se kvalitet på, er at læsere – af mange forskellige slags – vurderer et værk som vellykket. Og det er det, som vores forsøg har givet os et bedre greb om. Inklusive forståelse af bias.

Bogbrancheguiden: Har I undervejs haft konkrete overvejelser om hvad Fabula-net kan/skal bruges til, versus ren grundforskning? Og hvad ser I selv af muligheder og risici ved brug af Fabula – for branchen, udbuddet af litteratur, osv.?

Mads Rosendahl Thomsen: Jeg ser os i et større felt af anbefalingssystemer og AI, som på forskellig vis kommer ind i vores kultur på godt og ondt. Mængden af skriveassistenter er fx overvældende allerede nu, og behovet for gode anbefalinger af bøger er noget som vil kunne være til gavn for læsekultur. Vi håber at kunne bidrage til at øge kvaliteten på feltet, men i den sidste ende, så er det jo op til de mange aktører i feltet at være ansvarlige brugere, fra forfatter over forlag til streamingtjenester og biblioteker. Og så kan vores forskning altså også bruges i litteraturvidenskab.

Bogbrancheguiden: Det korpus I har trænet på er engelsksproget, er det helt uproblematisk at teste dansksprogede manuskripter op mod modellen?

Mads Rosendahl Thomsen: I forhold til det engelsksprogede, så er der egenskaber, som er sammenlignelige, men det vil samlet ikke være godt nok til for alvor at kunne bruge.

***

Find yderligere information og artikler på Fabula-nets hjemmeside:
https://centre-for-humanities-computing.github.io/fabula-net/

Del artiklen

artiklens
forfatter