Digitale metoder kan gøre store mængder data overskuelige og hjælpe forskerne med at stille skarpt på nye sammenhænge. Men inden for de humanistiske fag er der fortsat få studerende og forskere, der bruger digitale metoder. Det vil Københavns Universitetsbibliotek ændre og invitererede blandt andet til et datasprint i december 2020.
Tekst Anette Lerche
Museer, biblioteker og arkiver har hovedsageligt set internettet som en mulighed for at nå nye brugergrupper ved at lægge samlingerne ud til borgerne.
Siden 2001 har Det Kgl. Bibliotek og Det Danske Sprog- og Litteraturselskab eksempelvis indscannet tekster, gjort dem digitale og lagt dem ud frit tilgængelige på nettet, så de kunne nå flere. Det er blevet brugt af gymnasieelever og universitetsstuderende, der fik adgang til dansk litteratur tilbage fra middelalderen. For Lars Kjær, der er specialkonsulent på Det Kgl. Bibliotek og uddannet historiker, er det interessante dog ikke længere kun, at der er så meget data inden for humaniora tilgængeligt på nettet. For ham handler det nu også om at udnytte data på nye måder.
Men hvordan får man præsenteret de nye måder at arbejde med data på for ansatte og studerende på humaniora og statskundskab, der ikke har en tradition for at arbejde med digitale metoder?
Lars Kjær er optaget af det, han kalder digital humaniora, hvor man bruger computere til for eksempel at analysere tekster, så forskningen i langt højere grad kan bygge på digitale metoder. Den arbejdsmetode bør forskningsbibliotekerne understøtte og blive stedet, hvor forskere og studerende stifter bekendtskab med de digitale muligheder, mener han.
Derfor har Lars Kjær siden 2016 planlagt datasprints på Det Kgl. Bibliotek i selskab med forskellige forsknings- og kulturinstitutioner, for eksempel med Det Danske Sprog- og Litteraturselskab i 2017, hvor forskere, undervisere og studerende var inviteret til et datasprint, hvor øvelserne handlede om at finde strukturer i tekster inden for enten en genre eller et værk.
I 2018 blev der igen afholdt et datasprint. Denne gang i samarbejde med Rigsarkivet og Københavns Stadsarkiv, som har gjort de danske folketællinger og københavnske begravelsesprotokoller digitale, så forskere og studerende kan bestille datauddrag. Til datasprintet var øvelsen at inddrage data fra Rigsarkivets Dansk Demografisk Database og Københavns Kommunes begravelsesprotokoller. Med data helt ned til gadeniveau om for eksempel befolkningstæthed og børnedødelighed fik man en helt ny måde at anvende og kombinere data.
Digitaliseringen af 35 millioner avissider, der var gjort søgbare via OCR – en teknologi, hvor man bruger computere til at genkende bogstaver ud fra et digitalt billede - blev senest i 2020 brugt til et datasprint, hvor deltagerne sammenlignede begreber i aviser fra Sønderjylland og København i perioden fra 1830 til 1870 for at afdække den politiske retorik.
- De nye muligheder for at undersøge og kombinere data giver nye vinkler på forskningen, siger Lars Kjær.
- Den udvikling, der er sket med big data og textmining, er for mange bare ord, men til datasprintet får de et indblik i de muligheder, digital humaniora giver. Forskerne skal jo søge nye bevillinger, og de studerende skal besvare opgaver, og her er det interessant at inddrage digitale metoder.
Big data: Meget store mængder og forskellige typer data, der indsamles på kort tid, og som på grund af størrelsen ikke kan analyseres med traditionelle analyseværktøjer
Datasprint: Workshops, hvor deltagerne arbejder med samme datasæt eller
forskningsspørgsmål, men har forskellige faglige baggrunde
Textmining: Digitaliseret tekstanalyse. Maskinel analyse af store mængder tekst, hvorigennem man kan finde nye sammenhænge og mønstre.
Digital humaniora: Traditionel humanistisk forskning møder digitale hjælpemidler og metoder og finder sammen om helt nye problemstillinger og muligheder
Python: Et programmeringssprog, der kan bruges til mange programmer, og som kan få computeren til at udføre ønskede kommandoer.
Kilder: samfundsdesign.dk, libereurope.eu, ufm.dk, simplecode.dk, researchgate.net
Men selvom Lars Kjær ikke er i tvivl om, at det er nødvendigt for forskere og studerende at tage det digitale til sig, så understreger han, at bibliotekets formål ikke er at skabe ny forskning.
- Det primære formål er at lave et trinbræt til digital humaniora eller digital social science og hjælpe studerende og ansatte med at finde et sted, hvor de kan eksperimentere og lære. Som bibliotek skal vi vise, at dansk kulturarv er vores fælleseje, og at det data, der er digitaliseret, kan bruges til text- og datamining. Som bibliotek er det at introducere til de nye måder at bruge den digitaliserede kulturarv også at aktualisere samlingen, siger Lars Kjær.
En anden vigtig pointe for Lars Kjær er, at biblioteket ikke er universitetet. Når de studerende er deltagere i et datasprint, så løser de ikke opgaver, men bliver introduceret til øvelser, får en god oplevelse, og både ansatte og studerende får mulighed for at lære andre at kende, der har samme nysgerrighed på de digitale muligheder.
- Bibliotekets vigtigste rolle er at inspirere og være et sted, hvor man kan eksperimentere uden at skulle præstere noget. Det er vigtigt, at alle kan være med, så man skal ikke kunne kode på forhånd. Øvelsen er at få introduceret et nyt mindset omkring data ved at blive introduceret for metoder og datasæt via korte introduktioner til bestemte historiske temaer, software og data. Ellers er den didaktiske vinkel at lægge vægt på praksis, så deltagerne selv afprøver metoderne og selv koder, siger Lars Kjær, der mener, at man som organisator skal påtage sig ansvaret for læringen.
- Det er i virkeligheden modsat den generelle tendens, hvor studerende har høj grad af ansvar for egen læring, men jeg har iagttaget, at den store interesse og læring opstår, når vi tilrettelægger forløbet og understøtter dem. Så får deltagerne en god oplevelse, bliver lidt klogere og tør prøve tingene af.
Rent praktisk samarbejder deltagerne til et datasprint i grupper om et projekt, som de skal fremlægge til sidst. Der er øvelser, de kan lade sig inspirere af, men det er ikke et krav, at man laver dem.
- Du kan altså både komme og følge en sti, som, vi garanterer, nok skal bringe dig i mål, og er du ekspert (men det er de færreste), så kan du selv slå dig løs, siger Lars Kjær.
Der er en perfekthedskultur på universitetet, der gør, at det er svært for en underviser at tage de nye metoder til sig.Lars Kjær
Digital humaniora er stadig ukendt land for mange ansatte og studerende i de humanistiske fag. Og dem, Lars Kjær afholder kurser eller workshops for, er de få nysgerrige, der på eget initiativ vil afprøve mulighederne i KUB Datalab, hvor biblioteket afholder kurser i textmining eller de årlige datasprint.
- Universiteterne mangler flere, der kan bringe digital humaniora ud i klasselokalerne. Der er en perfekthedskultur på universitetet, der gør, at det er svært for en underviser at tage de nye metoder til sig, siger Lars Kjær.
Lidt generaliseret kan forskerne opdeles i to grupper: De forskere, der ikke vil inddrage de nye metoder, hvis ikke de selv har styr på det, fordi de risikerer at miste autoritet, og en anden gruppe, der vurderer, at det, de ikke selv kan inden for dette område, kan de få andre til at hjælpe sig med – altså biblioteket.
- Jeg laver eksempelvis workshops sammen med undervisere fra engelsk og kinesisk. Jeg er ikke ekspert i hverken kinesisk eller engelsk litteratur – det er forskerne – men jeg kan bidrage med det tekniske, og det er en god arbejdsdeling, siger Lars Kjær.
For det er vigtigt, at forskerne tager digital humaniora til sig.
- Der er flere og flere forskningsartikler, hvor man har benyttet sig af digitale forskningsmetoder, og derfor skal man både som studerende og forsker kende til de metoder, ellers kan man ikke forholde sig kritisk til ny forskning. Hvordan skal man eksempelvis forholde sig kritisk til en forskningsartikel, der bygger på tekstanalyse af tweets inden for et bestemt emne, hvis man ikke forstår metoden? Her kan et datasprint hjælpe til at gøre det mindre mystisk, fordi vi introducerer det nye sprog.
- Bibliotekerne har altid undervist i informationskompetencer. Oprindeligt handlede det om at søge information frem gennem bøger, søgereferencer og litteraturlister, og med digitaliseringen brugte man metadata til at finde information i databaser, men nu er der behov for at undervise i datakompetencer. Når data ikke længere er opbygget efter en kendt struktur, såsom en bog, opstår der nye veje, fordi data kan manipuleres på hundredevis af måder. Det kan lettest forklares ved, at man kan inddrage hundredvis af bøger i stedet for kun én. Dermed kan den forskning, man ellers skulle bruge årtier på, gøres langt hurtigere. Man får nye muligheder for viden, og det kan præsenteres på nye måder. Det skal biblioteket være bevidst om og vejlede i, siger Lars Kjær, der håber, at flere universitetsbiblioteker vil gå den vej og ansætte specialister, der kan undervise i datakompetencer og bidrage til, at flere får lyst til at arbejde med digitale metoder.
- Det burde være en naturlig opgave for bibliotekerne.
Der er tre medarbejdere på KUB, der har som kerneopgave at undervise i de digitale metoder. Men flere kolleger er tilknyttet i mindre grad.