Sidste år nedsatte regeringen, KL og Danske Regioner en Taskforce for Kunstig Intelligens, der skal bidrage til, at Danmark bliver verdensførende i at anvende kunstig intelligens (AI) i den offentlige sektor.
At få sådan en taskforce til at tage styring på, hvordan man ved hjælp af øget brug af AI i den offentlige sektor kan reducere administration, frigøre arbejdskraft og øge kvaliteten af den offentlige service, er en rigtig god idé. For potentialet ved AI er stort.
Men taskforcens opgave er også kompliceret. For mange førende eksperter er uenige om, hvor stort potentialet faktisk er. Og selv inden for områder, der virker oplagte til brug af AI, kan der være snubletråde i implementeringen, der skal håndteres klogt, hvis brugen af AI skal bære frugt.
Måltal skal fastsættes til foråret
I foråret 2025 skal Taskforcen for Kunstig Intelligens fastsætte et måltal for, hvor meget arbejdskraft AI kan frigøre i den offentlige sektor. Indtil videre har det lydt, at AI skal frigøre ressourcer svarende til mindst 10.000 årsværk i 2030.
Men spørger man AI-eksperter om, hvor stort et automatiseringspotentiale ny teknologi som AI rummer, får man vidt forskellige svar, alt efter hvem man spørger. Det viste Kraka og Deloitte i en analyse fra sidste år, der afdækkede AI-potentialer.
I vores analyse var den gennemsnitlige vurdering fra 18 eksperter, at 46 procent af den samlede arbejdstid i alle lønmodtagerjobs i Danmark kan automatiseres ved hjælp af ny teknologi.
Tager man udgangspunkt i de seks mest optimistiske eksperters vurderinger af, hvor stor en andel af arbejdstiden, der kan automatiseres, stiger andelen til 70 procent. Omvendt vurderer de seks mest pessimistiske eksperter, at andelen er 21 procent.
Resultaterne viser, at automatiseringspotentialet er betydeligt, uanset om man er optimist eller pessimist. Men resultaterne viser også, at der er stor usikkerhed om potentialet for automatisering.
Taskforcen for Kunstig Intelligens står derfor overfor en svær opgave, når de skal fastsætte deres måltal. For læner taskforcen sig op ad et analytisk grundlag, der alene er baseret på få eksperters vurdering af automatiseringspotentialet i en række offentlige jobs, har det stor betydning, om disse eksperter er pessimister, optimister eller noget ind imellem.
Oplagt brug af AI – eller hvad?
Noget andet taskforcen skal være opmærksom på er, at der kan være stor forskel på, hvor meget af et job der teknisk set kan automatiseres, og hvor meget der reelt kan automatiseres.
Tag som eksempel et af de områder, som den tidligere digitaliseringsminister Marie Bjerre fremhævede som et særligt fokus for Taskforcen: Billeddiagnostik inden for sundhedsvæsenet.
Netop dette område fremhæves ofte som et sted, hvor AI kan frigøre ressourcer og øge kvaliteten af den offentlige service. Dette skyldes, at AI allerede i dag er rigtig god til at genkende mønstre på billeder og derudfra stille en diagnose – en af de arbejdsopgaver, som i dag typisk udføres af læger med speciale i radiologi.
Men der en række mellemregninger, man skal være opmærksom på, inden man begynder at frigøre radiologiske ressourcer på Danmarks hospitaler.
I langt de fleste tilfælde er der nemlig kun en enkelt radiolog, der kigger på fx et scanningsbillede. Så medmindre man er villig til at lade en AI-algoritme stille en diagnose helt uden menneskelig indblanding, bliver det svært at frigøre meget arbejdstid her.
I de fleste tilfælde må man derfor forvente, at AI primært vil arbejde sammen med radiologerne, frem for at erstatte dem. Det kan også være fint, hvis det øger kvaliteten af de stillede diagnoser, fx ved at nedbringe antallet af fejl.
Men et nyt studie fra forskere ved MIT og Harvard viser, at anvendelsen af AI ikke nødvendigvis øger produktiviteten inden for billeddiagnostik. Og i nogle tilfælde kan produktiviteten faktisk falde.
I undersøgelsen designede forskerne et eksperiment, hvor diagnoserne enten blev stillet af radiologer, af en AI-algoritme eller af radiologerne med algoritmens hjælp. Algoritmen viste sig at være mere præcis end to tredjedele af de deltagende radiologer, hvilket antydede et betydeligt potentiale for at højne kvaliteten af diagnoserne ved at lade radiologerne samarbejde med algoritmen.
Overraskende nok viste eksperimentet imidlertid, at radiologerne ikke forbedrede deres diagnoser, når de fik assistance af AI. Til gengæld faldt radiologernes produktivitet, fordi de brugte længere tid på at stille diagnoserne, når de skulle forholde sig til algoritmens input.
Ifølge forskerne kan fraværet af forbedret nøjagtighed tilskrives menneskelige bias: I de tilfælde, hvor radiologerne rent faktisk var dygtigere end algoritmen, undervurderede de deres egen ekspertise, og i andre tilfælde overså de den information, algoritmen leverede. Samspillet mellem AI og menneske fungerede altså ikke optimalt.
Dette er selvfølgelig alene baseret på ét studie, og den endelige fagfællebedømmelse af resultaterne udestår stadig. Men eksemplet viser tydeligt, at det ikke er nok at have en god AI-model. Man skal også tænke klogt, når det kommer til den praktiske implementering.
Sidst, men ikke mindst, bør man også se på økonomien. For selv hvis AI kan varetage udvalgte opgaver, er det ikke givet, at det bliver mere omkostningseffektivt end at lade mennesker udføre dem. Selvom det kan være fristende at tro, at en veludviklet algoritme hurtigt kan levere varige besparelser, så er det vigtigt at huske på, at algoritmerne kræver løbende vedligeholdelse, kvalitetssikring og opdatering – og det koster.
Kombiner teknisk ekspertise med praktiske erfaringer
Taskforcen for Kunstig Intelligens står altså over for en krævende opgave. Ekspertvurderingerne af teknologiens muligheder er langt fra entydige, og selv områder, der umiddelbart forekommer oplagte til automatisering, kan vise sig at levere færre gevinster end forventet – i hvert fald hvis man ikke tænker grundigt over hvordan de implementeres og bruges i praksis.
Hvert fagområde har sine særlige udfordringer. Hvad der umiddelbart kan virke enkelt at automatisere inden for radiologi, er måske alligevel ikke så enkelt. Og det samme vil kunne gøre sig gældende inden for en række andre fagområder.
En fornuftig tilgang er derfor at rulle AI ud gradvist og teste løsningerne og business casen omhyggeligt, inden de bliver skaleret til hele den offentlige sektor. Dette sikrer, at man løbende kan justere indsatsen. Samtidig bør man sørge for, at de løsninger, der beviseligt virker, bliver udbredt hurtigst muligt, så alle ikke skal opfinde den dybe tallerken hver for sig.
Ved at kombinere teknisk ekspertise med praktisk erfaring kan Danmark sikre, at AI skaber de mærkbare forbedringer, som teknologien har potentialet til – og ikke blot bliver endnu et digitalt fatamorgana i den offentlige sektor.
Af Ulrik Beck, cheføkonom, Kraka og Thomas Wilken, seniorøkonom, Kraka