Regeringen har netop afsat penge til en Taskforce for Kunstig intelligens, hvis opgave bliver at drive arbejdet med kunstig intelligens (AI) på tværs af den offentlige sektor.
Ifølge den daværende digitaliseringsminister Marie Bjerre skal taskforcen fokusere på bl.a. to områder: 1) billeddiagnostik såsom røntgenbilleder i sundhedsvæsenet, og 2) generelt bureaukrati i den offentlige sektor.
Det sidstnævnte område er meget bredt, mens det første område er ret konkret. Et område, som af mange bliver anset for at være en ’most likely case’ – altså, at hvis AI skulle kunne hjælpe inden for et område, er det med stor sandsynlighed inden for billeddiagnostik. I 2016 udtalte en af AI’s fædre, Geoffrey Hinton, f.eks. at man skulle til at stoppe med at uddanne flere radiologer, da AI snart ville være bedre end radiologerne.
Problemet er bare, at et nyt studie fra forskere ved Harvard og MIT har vist, at anvendelsen af AI ikke nødvendigvis vil øge produktiviteten inden for billeddiagnostik – og i nogle tilfælde faktisk kan mindske produktiviteten.
I et eksperiment blev en række diagnoser stillet af enten radiologer, en algoritme eller af radiologerne med assistance fra algoritmen. Algoritmen var bedre end to tredjedele af radiologerne, så der var et stort potentiale for, at radiologerne kunne øge kvaliteten af deres diagnoser ved at arbejde sammen med algoritmen.
Eksperimentet viste dog overraskende, at radiologernes diagnoser ikke blev forbedret, når de fik AI-assistance. Radiologernes produktivitet blev endda påvirket negativt, fordi de brugte længere tid på at stille diagnoserne, når de blev assisteret af algoritmen.
At samarbejdet med algoritmen ikke øgede radiologernes præcision tilskriver forskerne menneskelige biases: I de tilfælde, hvor radiologerne stadig var bedre end algoritmen, undervurderede de deres egen viden, og i andre tilfælde så de bort fra den information, som algoritmen gav dem. Samarbejdet mellem AI og mennesket fungerede simpelthen ikke optimalt.
Vi kan ikke ud fra dette ene studie afskrive, at AI kan forbedre produktiviteten inden for billeddiagnostik. Men spørgsmålet er hvor meget? Specielt når regeringen – og formentlig også store dele af befolkningen – ikke er villige til at lade algoritmer stille en diagnose alene.
Og spørgsmålet er selvfølgelig også, i hvor høj grad de ovennævnte biases kan forekomme i andre sammenhænge?
Regeringen og den nye Taskforce bør derfor passe på med at drage for hurtige konklusioner i forhold til, hvor mange ressourcer AI kan frigøre – selv inden for områder, hvor brugen af AI virker oplagt.
I stedet bør brugen af AI testes i mindre skala, evalueres og først derefter rulles ud – hvis det altså øger produktiviteten. For hypen om AI må for alt i verden ikke blive endnu et digitalt fatamorgana, der medfører utidige besparelser i den offentlige sektor.
Debatindlægget er bragt i Finans.