Tilmeld dig

Forbundet Kultur og Informations generalforsamling 2021

Gå til sidens indhold

Forskningsprojekt kan afsløre litterær succes

Nogle bøger bliver læst igen og igen på tværs af generationer. Forskere ved Aarhus Universitet undersøger ved hjælp af computere, hvad der gør en bog til en succes, og finder måske oversete værker.

Kan en computer forudse, hvilke forfattere der kan udpeges som en del af den danske kulturkanon, ligesom Karen Blixen blev det for sit forfatterskab, da daværende kulturminister Brian Mikkelsen i 2005 gik i spidsen for arbejdet med at udnævne den danske kulturkanon?

Tekst Ulla Abildtrup 

Der er bøger, som bliver lånt igen og igen og debatteres i læserkredse i hele landet. Og så er der bøger, som ingen tager ned fra bibliotekshylden, og som til sidst bliver kasseret. Men nogle af sidstnævnte er måske lige så læseværdige som klassikerne, siger Mads Rosendahl Thomsen, professor i litteraturhistorie ved Aarhus Universitet. Sammen med kollegaen Kristoffer Laigaard Nielbo fra Center for Humanities Computing Aarhus vil han ved hjælp af kraftige computere undersøge tusindvis af litterære værker for at afæske dem koden til succes.
- Ét menneske kan analysere og sammenligne et begrænset antal værker, måske 10, måske 100, men vores computere kan sammenligne store mængder tekster fra verdenslitteraturen på flere sprog og se, hvordan teksterne er bygget op og hænger sammen. Ved hjælp af computerne vil vi blandt andet se på bøgernes kompleksitet og forfatternes arbejde med spændingskurver. Som en sidegevinst kan det resultere i, at vi finder værker, som minder om klassikerne, men er blevet overset eller glemt i tidens løb, fortæller Mads Rosendahl Thomsen.
- Sagt lidt forsimplet vil vores forskningsprojekt kunne vise, om en klassiker er exceptionel eller bare eksemplarisk. Altså, er Herman Bangs værker for eksempel anderledes end hans samtidige forfattere og dermed unikke? Eller var det i virkeligheden sådan, man skrev på det tidspunkt? Er der et bagtæppe, som ingen læser mere, selvom værkerne er lige så læseværdige? Det bliver interessant, både for os og forhåbentlig også for bibliotekarer og i sidste ende læsere, siger Mads Rosendahl Thomsen.

Computer kan forudsige gode læseoplevelser

Projektet på Aarhus Universitet har fået millionstøtte af Velux Fonden og skal blandt andet være til gavn for bibliotekarer, som vil kunne få bedre anbefalingssystemer til lånerne.
- Vi kender allerede systemerne fra kommercielle sider som Saxo og Amazon: »Hvis du kunne lide denne bog, kan du sikkert også lide denne her…«. De algoritmer bygger på brugernes oplysninger om for eksempel køn og tidligere bogkøb. Vores metode dykker ned i et værks indre struktur, og selvom det aldrig bliver eksakt videnskab, vil vores anbefalingssystem formentlig kunne give en god forudsigelse af, hvilke bøger der vil give den enkelte en god læseoplevelse, og dermed kan det blive til gavn for blandt andet bibliotekarer, som skal vejlede lånere, siger Mads Rosendahl Thomsen.
Rent praktisk giver forskerne computerne adgang til tusindvis af tekster på dansk, engelsk og kinesisk:
- Project Gutenbergs arkiv indeholder for eksempel titusindvis af digitaliserede værker på engelsk, og på Københavns Universitet har man i et nyt projekt samlet over 700 værker på dansk fra den sidste del af 1800-tallet. Dertil kommer værker fra andre arkiver og en mængde bøger på kinesisk, fortæller Mads Rosendahl Thomsen.
Sammen med værkerne får computerne oplysninger om bibliotekernes udlån og læsernes vurdering af bøgerne fra blandt andet sitet bog.nu, der har samlet anmeldelser af bøger siden 2010.
- Ud fra vores viden om, hvad virkelige mennesker og anmeldere godt kan lide, kan vi træne maskinen til at forstå, hvad der har værdi for mange. Dermed vil computeren også kunne forudse, hvilke værker læserne godt vil kunne lide, måske endnu før bogen bliver sat til salg og kommer til udlån, siger litteraturprofessoren.

Sagt lidt forsimplet vil vores forskningsprojekt kunne vise, om en klassiker er exceptionel eller bare eksemplarisk.

Udlån fortæller om læseres præferencer

Forskerne arbejder også med en teori om, at det bliver muligt at lave en grov opdeling af værkers mulighed for succes afhængig af læserens køn, alder, uddannelse og bosted.
- I anmeldelser fortæller læsere jo om deres præferencer, og deres sprogbrug afslører ofte demografiske karakteristika som køn, alder, uddannelsesniveau. Vi får også information om udlån fra bibliotekerne, og når alle disse oplysninger samkøres, håber vi at blive i stand til at kunne vise, hvilke værker der er mest populære blandt forskellige befolkningsgrupper, såsom unge og ældre, borgere fra land og by og højt- og lavtuddannede, siger Kristoffer Laigaard Nielbo, lektor ved Center for Humanities Computing Aarhus.
- Der foregår allerede en automatiseret screening af tekster i mange sammenhænge, for eksempel af jobansøgninger, eksamensopgaver og brugeranmeldelser. Nu flytter vi det bare over i litteraturens verden, så både læsere, forfattere og redaktører kan få glæde af beslutningsunderstøttende computersystemer, siger Kristoffer Laigaard Nielbo.

Måske finder vi ukendte mesterværker

Det aarhusianske projekt bygger på forskning, som har vist computeres nøjagtighed. Maskiner har for eksempel med stor præcision kunnet afgøre, om en tekst var skrevet af en mandlig eller kvindelig forfatter.
I tilfældet med den yderst private forfatter Thomas Pynchon har en amerikansk forsker brugt computere til at gennemgå nyhedsbreve fra 1960’erne fra flyselskabet Boeing for at finde frem til dem, der var skrevet af den dengang unge og ukendte forfatter, som ikke brugte byline hos Boeing.
- Det lykkedes ret præcist forskeren at finde frem til, hvad Pynchon havde skrevet og ikke skrevet. Potentielt vil man også kunne bruge vores system til at sandsynliggøre et nyopdaget værk af for eksempel H. C. Andersen eller se, hvordan det placerer sig i forhold til hans andre værker. I hvert fald har man brugt metoden i USA til at undersøge romaner af blandt andre Jane Austen og Herman Melville for at fastslå, om det vitterligt var deres værker eller ej, fortæller Mads Rosendahl Thomsen.