Gå til sidens indhold

Data Steward - uddannelse i overblik

»Datafeltet« er eksploderet. Der er fra virksomheder til universiteter brug for at holde styr på data, udnytte data og frembringe nye data. En Data Steward kan være svaret, hvis en ny uddannelse bliver en realitet.

Tekst: Sabrine Mønsted

Der er behov for en ny rolle i arbejdet med data i både virksomheder, på universiteter og i offentlige organisationer. En digital tovholder med overblik over krav til databehandlingen lige fra etik og lovgivning til den rette registrering og dokumentation af data, siger specialkonsulent på Københavns Universitetsbibliotek Michael Svendsen og Data Management-specialist Lorna Wildgaard, der begge er en del af en arbejdsgruppe, der skal komme med anbefalinger til en eventuel kommende uddannelse som Data Steward.

Hvad skal en Data Steward?
- Vi har set en stor stigning i antallet af kandidater inden for data science, der har ekspertise i programmering og datamodellering, men der er også brug for kandidater, der sikrer et bredere overblik og at håndtering og udstilling af data går efter reglerne. Det kan blandt andet være at sikre, at de medarbejdere, der arbejder med data, har de redskaber og den viden, de skal bruge. Det langsigtede mål i Danmark er en strategi for »FAIR data« (findable, accessible, interoperable og reusable), så man (maskiner og mennesker) kan genfinde data og bygge ovenpå. I dag bruger for eksempel forskere meget lang tid på at finde data, og det er ikke for alvor muligt at genbruge dem, fordi de ikke er dokumenterede, siger Michael Svendsen.

Hvad er en Data Steward?
- En Data Steward arbejder med planlægning, implementering og styring af identifikation, (gen)brug og vedligeholdelse af data i en organisation. Data Stewards har ansvar for andres data – og det kræver tillid fra kollegerne til deres kompetencer og viden. Data Stewards gør det muligt for en organisation at tage kontrol over alle typer af data og deres tilknyttede systemer. Så en Data Steward kan have flere roller - for eksempel en analytisk rolle, hvor de er med til at udvikle nye måder at bruge data på eller en administrativ rolle, hvor de rådgiver om politikker for brug af data, siger Lorna Wildgaard.

Hvorfor kan de opgaver ikke rummes i stillinger, der allerede arbejder med data?
- De nuværende roller er mere »isolerede« såsom datamanager, data quality manager eller DPO (data protection officer), som arbejder med ét specifikt område omkring data. En Data Steward har en unik rolle med at binde trådene sammen på tværs af fagligheder og organisatoriske strukturer. Derfor er deres personlige egenskaber afgørende. De skal være gode til at netværke, samarbejde og være udadvendte, siger Lorna Wildgaard.

Hvem er uddannelsen rettet til?
- I udgangspunktet er den tænkt som en ét-årig uddannelse, der bygger ovenpå en bachelor og rettet ud mod arbejdsmarkedet. Det var en idé, som Tommy Ahlers fik som uddannelses- og forskningsminister. Der er en pulje, man kan søge til at lave prækvalificeringen af den slags uddannelser, og det er det, Data Stewarden er tænkt ind i, så den kan bygge ovenpå stort set alle uddannelser. Det kunne også være ovenpå en professionsuddannelse for eksempel som laborant eller bachelor som bibliotekar, siger Michael Svendsen.

Er ét år ikke kort tid at lære det på?
- Det er også den største udfordring, som vi ser det, siger Lorna Wildgaard, der i arbejdet med at komme med anbefalinger til en ny uddannelse har afdækket, hvilke arbejdsområder der er inden for datafeltet, og hvordan opgaverne løses nu og af hvem. Og resultatet er ret brancheafhængigt.
I industrien ser vi i dag, at rollen som Data Steward er et »entry level«, hvorfra du videreuddannes og de kommer især fra business schools. Så giver en etårig uddannelse jo mening. Men på universiteterne er det som regel en ph.d.-studerende eller post. doc., der påtager sig opgaverne i forskningsprojekter. Vi ser et stort behov, der ikke bliver dækket i dag hos for eksempel medicinalvirksomheder og mange offentlige styrelser.
Så ideelt kunne man forestille sig to spor i uddannelsen. Et retter sig mod industrien og et andet mod den akademiske verden. Muligvis med studerende med forskellige profiler og erfaringer. Det er umuligt for én person at specialisere sig i hele feltet, men der er alligevel nøglekompetencer, som en Data Steward skal have. Såsom FAIR-principperne, der handler om at skabe konsistente metadata og ens formater, så data let kan genfindes, genbruges og høstes og for eksempel bruges til text- og datamining.

Vil en Data Steward uddannelse være oplagt for studerende på Informationsstudier?
- Ja, der er helt sikkert bibliotekariske kompetencer i spil her, og vores sektor bør gribe mange af de nye roller omkring data. I Data Steward rollen ligger også, at man kan være med til at forme politiker og strategier omkring databehandling, privacy og kvalitetssikring, fordi man arbejder på tværs og har overblik. Og en vigtig kompetence er, at man skal kunne undervise og uddanne andre og være forandringsagent, siger Michael Svendsen.

Hvem sidder i den gruppe, der kommer med anbefalinger til uddannelsen?
- Ud over os fra Københavns Universitetsbibliotek er Rigsarkivet, Syddansk Universitetsbibliotek, universitetsbibliotekerne i Aarhus og Aalborg samt CBS repræsenterede, ligesom vi har budt Københavns Professionshøjskole inden for i projektet for at sikre bredde udover universiteterne.

Hvad er næste skridt?
- Det er at lade vores anbefalinger gå videre til uddannelsesinstitutionerne, da det er dem, der kan søge puljen til at udforme den endelige uddannelse.

Hvad er jeres anbefalinger?
- Vi har haft meget fokus på aftagernes behov. Vores anbefalinger er, at uddannelsen skal være et samarbejde med mange partnere fra industrien, universiteter og professionsskoler og at både de samfundsvidenskabelige og humanistiske fag skal inddrages, så det ikke kun er databehandling ud fra et datalogisk perspektiv.
Uddannelsen skal være konkret og casebaseret, og formidlingsaspektet og de menneskelige aspekter er vigtige. For selvom Data Stewardens vigtigste opgave er at sikre, at dataudvekslingen mellem maskiner bliver optimal, så kræver det stadig stærke menneskelige kompetencer at sikre, at det er de rigtige data, der kommer ind i maskinerne.

Arbejdsgruppen afleverer deres anbefalinger i midten af januar 2020.

Du kan læse mere om projektet her.