AI og revisjon

10-13

Revisjon står ved et veiskille – en magisk mulighet som vil endre bransjen. Kunstig intelligens representerer en radikal innovasjon som åpner for ny vekst, flere medarbeidere og flere partnere. En strategisk mulighet for å styrke revisjonens kvalitet.

Erik Mamelund

Spesialrådgiver i Nærings- og fiskeridepartementet

Artikkelen reflekterer forfatterens egne synspunkter og ikke Nærings- og fiskeridepartementets.

1. Overordnede perspektiver på revisjon og kunstig intelligens

Fokuset i denne artikkelen er ikke effektivisering av revisjonsarbeidet, men mer bruk av ressurser for å styrke revisjonskvaliteten i en stadig mer kompleks verden.

De siste 25–50 årene har digital teknologi i stor grad automatisert antall jobber eller fortrengt arbeidskraft, jf. blant annet Nobelprisvinnere i økonomi som Daron Acemoglu og Simon Johnsen som omtalt i boken Power and Progress (2024). De nevnte økonomene argumenterer for at vi i fremtiden i stedet må se etter mulighet for å skape nye arbeidsplasser med digital teknologi, og ikke minst ta i bruk kunstig intelligens på en ny måte.

Betydningen av kunstig intelligens, og særlig når det kan kombineres med spesialiserte mikroprosessorer og etter hvert kvantedatamaskiner, kan revolusjonere verdenssamfunnet. Det vil skape uendelige muligheter, men også store trusler. Det kan skape massearbeidsledighet, og det kan gjøre en massiv klasse av mennesker irrelevante – økonomisk, politisk og sosialt. Alle, inkludert revisjonsbransjen, må tenke nytt. Bærekraft i revisjonsbransjen har en sosial dimensjon som kan bety at kunstig intelligens bør sikte mot bedre revisjonskvalitet og flere arbeidsplasser.

Et kappløp om å ta i bruk kunstig intelligens

Omgivelsene endrer seg med kunstig intelligens. Aktørene i kapitalmarkedet vil ta i bruk kunstig intelligens. Selskapene som produserer års- og kvartalsrapporter, vil ta i bruk kunstig intelligens. Revisorene må delta i dette paradigmeskiftet og radikalt transformere revisjonsarbeidet. Fokuset i denne artikkelen er ikke effektivisering av revisjonsarbeidet, men mer bruk av ressurser for å styrke revisjonskvaliteten i en stadig mer kompleks verden.

Nye vekstmuligheter

Kunstig intelligens kan brukes til både å styrke revisjonskvaliteten og effektivisere det transaksjonsrelaterte revisjonsarbeidet. For den sistnevnte effektiviseringen oppfatter jeg at potensialet i stor grad allerede er realisert, eller kan realiseres i løpet av kort tid. Det store potensialet for økt revisjonskvalitet er knyttet til fremtidsinformasjon og usikre estimater, og relatert risikoanalyse og misligheter. Her berører vi en sentral svakhet i dagens finansielle informasjon, men også revisjonen av denne informasjonen. Forbedringer her kan gjøre kapitalmarkedene bedre i stand til å allokere kapitalen optimalt i samfunnet.

Menneskelig intelligens + kunstig intelligens

Kunstig intelligens overgår allerede menneskelig intelligens på spesifikke områder, f.eks. i sjakk med kunstig intelligens-programmer som DeepMinds AlphaZero. Selv om det her kan være ulike synspunkter, er det nok fortsatt et stykke frem til at kunstig intelligens generelt overgår menneskelig intelligens, og det er enda lenger frem til super-intelligens. Realiteten er derfor at vi snakker om et samarbeid mellom kunstig og menneskelig intelligens.

Mangfold i menneskelig intelligens

Menneskelig intelligens bygd på kognitivt mangfold styrker problemløsningsevnen betraktelig. Kognitivt mangfold er forskjellig fra biologisk og sosialt mangfold, og dreier seg typisk om tverrfaglighet og relevant erfaringsmessig variasjon. En måte å realisere verdien av menneskelig kognitivt mangfold på er å samarbeide i grupper, og organisere arbeidet langs linjene i for eksempel Delphi-metoden (tenke hver for seg – dialog i grupper – tilbake til å tenke hver for seg) for å unngå uheldige sosiale mekanismer.

Mangfold i kunstig intelligens

Kunstig intelligens har ofte de samme utfordringene som menneskelig intelligens. Vi får ikke alltid et riktig svar, eller det rett og slett er uenigheter. Mangfold i både menneskelig og kunstig intelligens kan redusere problemet. Med mangfold i kunstig intelligens mener jeg bruk av flere forskjellige kunstige intelligenser eller algoritmer – ofte omtalt som hybrid kunstig intelligens.

IBM utviklet i 2011 Watson for å konkurrere mot de beste ekspertene i Jeopardy. Watson måtte forstå spørsmålene beskrevet i naturlig språk, og kunne dekke en lang rekke temaer som historie, vitenskap, geografi og lignende. Den var ikke koblet til internett, men til store kunnskapsdatabaser, og flere tusen prosessorer bearbeidet spørsmålene. Tusener av forskjellige algoritmer behandlet spørsmålet i parallell, og når mange av algoritmene kom til samme svar, var det høy sannsynlighet for at svaret var riktig. Watson er en enkel og god illustrasjon på mangfold i kunstig intelligens.

2. Integrasjon av kunstig intelligens i revisjonsarbeidet

Det store potensialet for økt revisjonskvalitet gjennom bruk av kunstig intelligens er knyttet til fremtidsinformasjon og usikre estimater, og relatert risikoanalyse og misligheter.

I det følgende skraper jeg i overflaten på noen av de vanskelige spørsmålene. Det som har inspirert meg er boken Artificial Intelligence – A Moderne Approach (4. utgave – 2022 – Pearson Education Limited av Berkeley professor Stuart Russell og Google-direktør Peter Norvig.

Nedenfor følger et lite og enkelt utvalg av eksempler hvor jeg forsøker å belyse både selskapenes og revisors bruk av kunstig intelligens, og i samarbeid med menneskelig intelligens.

Revisor blir aktuar

Revisjonen skal gi betryggende sikkerhet for at årsregnskapet er riktig. En annen måte å si det på er at revisjonen skal sikre at årsregnskapet er riktig og uten vesentlige feil med 90–95 % sannsynlighet. Det kan bety at alle relevante informasjonselementer i årsregnskapet er uten vesentlige feil. Elementene kan være ulike elementer i resultatoppstillingen, balanseoppstillingen, kontantstrømoppstillingen og noteopplysningene.

Dersom det eksempelvis er ti slike informasjonselementer, og hver og en er riktig med 95 % sannsynlighet, er den kombinerte sannsynligheten for at alle elementene er uten vesentlige feil, om lag 60 % (forutsatt uavhengighet mellom elementene). Dette er kun en enkel illustrasjon, og i virkeligheten vil det ofte være langt mer kompliserte beregninger.

Analysen er sensitiv for vurdering av risikoen for feil i hvert informasjonselement og dernest for antall vesentlige informasjonselementer. Denne typen analyse krever dyp innsikt i hvert informasjonselement, som igjen er nært knyttet til innsikt i selskapets virksomhet og bransjen. For denne typen sannsynlighetsanalyser kan kunstig intelligens være til stor hjelp, og ikke minst ulike former for simuleringsanalyser. Dialog mellom selskapet og revisor om slike analyser vil være kritisk. Her kan også revisors plikt til profesjonell skepsis innarbeides.

Revisors analyse av revisjonsbevis med Bayes

Med Bayes er utgangspunktet en «start sannsynlighet» eller «prior», oppdatert informasjon og en relatert trolighetsfunksjon (likhetstrekk med sannsynlighetsfunksjon), som i kombinasjon gir en «oppdatert sannsynlighet» eller «posterior». I revisjon kan eksempelvis iboende risiko brukes som en «prior» og revisjonsbevisene som oppdatert informasjon og en trolighetsfunksjon, som i kombinasjon gir revisjonssikkerhet som sluttresultat. Har vi flere revisjonsbevis, som åpenbart er tilfelle i praksis, kan analysen gjentas. En inspirerende bok i denne sammenheng er «Audit Risk and Audit Evidence – The Bayesian Appoach to Statistical Auditing» (1992 – Academic Press) av Anthony Steele ( Ernst & Young Professor, University of Warwick Coventy, UK).

Et forenklet eksempel med en nedskrivningsverdsettelse:

Selskapet har de to foregående årene gjennomført verdsettelser uten at nedskrivning har vært nødvendig. Selskapets resultater har imidlertid i de to foregående årene vært langt dårligere enn forutsatt i verdsettelsen. Selskapet opprettholder imidlertid sin tro på virksomheten og foretar ingen nedskrivning. Revisor ønsker å gjøre en analyse for å vurdere om dette skyldes tilfeldigheter, eller om fremtidige kontantstrømmer bør nedjusteres, og at en nedskrivning eventuelt bør gjennomføres i regnskapet.

Basert på revisjonen kan vi oppsummere våre vurderinger:

  • Sannsynligheten for at selskapets verdsettelse er riktig («prior») anslås til 90 %, og tilsvarende risiko for feil 10 %

  • Dersom selskapets verdsettelse er riktig, er det 25 % sannsynlig at selskapet opplever to år med dårlige resultater slik det faktisk har skjedd, og tilsvarende 75 % sannsynlighet for gode resultater

  • Dersom selskapets verdsettelse er feil, er det 60 % sannsynlighet for dårlige resultater slik det har skjedd, og tilsvarende 40 % sannsynlighet for gode resultater

Bayes’ formel:

(0.90 x 0.25) / ((0.95 x 0.25) + (0.10 x 0.6)) = 0.225/0.285 = 0.789 dvs. 0.79

Det er 79 % sannsynlighet for at regnskapet er riktig, og det er vel i laveste laget – vi må nok se etter andre revisjonsbevis som forhåpentligvis kan underbygge selskapets vurdering eller eventuelle ytterligere motbevise det, og derfor gjenta beregningen ytterligere ganger.

Dette er kun en enkel illustrasjon, og kun med ett av revisjonsbevisene. Med kunstig intelligens kan denne typen analyser gjennomføres relativt effektivt. Men de subjektive sannsynlighetene som er grunnlag for analysen, må diskuteres internt i revisjonsteamet, og i dialog med selskapet.

Revisjon av flere forventningsrette usikre estimater – kodeordet er entropi

En illustrasjon er basert på modeller med flere ulike tidsrekke- og regresjonsanalyser, f.eks. for å lage en kontantstrømprognose. Vi kan tenke oss at vi av ulike grunner velger å utarbeide flere ulike og uavhengige tidsrekke- og regresjonsanalyser, og for hver og en av dem har vi brukt de beste statistiske teknikkene for å lage et best forventningsrett estimat. Det er ikke prognoseusikkerheten vi er ute etter, men spredningen i forventningen mellom de ulike modellene. Prognoseusikkerheten kan, om vi forutsetter normalfordeling, måles i varians, mens spredningen mellom ulike forventninger kan uttrykkes eller omtales som entropi. Noen enkle mål som sier noe om entropi, er såkalt «Akaike Information Criterion» (AIC) eller «Bayesion Information Criterion» (BIC). Denne typen statiske mål hjelper oss å velge mellom modeller som henholdsvis stemmer godt overens med reelle mønstre i datagrunnlaget, og samtidig ikke med så mange variabler og så stor kompleksitet at de også er overens med støy i datagrunnlaget. Likevel, vi ender sjelden opp med en modell, og derfor vil det fortsatt være et intervall av forventningsrette estimater. Kunstig intelligens er velegnet for å gjøre slike, og enda mer sofistikerte statistiske analyser. De ulike tidsrekke- og regresjonsanalysene kan beskrives som et statisk mangfold, og dersom utført av kunstig intelligensalgoritmer, som mangfold i kunstig intelligens.

Revisjon av scenarioer utviklet med kunstig og menneskelig intelligens

Med usikre estimater og verdsettelser vil det i mange tilfeller være behov for å utvikle langsiktige scenarioer. I praksis har det vist seg at det for mange selskaper er for ressurskrevende å utvikle fullgode scenarioer basert på langsiktige megatrender og analogier til historiske fenomener.

Oftest mangler vi representative og pålitelige data for tidsrekker over flere hundre eller tusen år, og vi er derfor henvist til å studere mer kvalitativ historisk informasjon. I en del tilfeller har vi imidlertid tilgjengelig langsiktige historiske tidsserier for økonomisk vekst, inflasjon, renter, aksjepriser og råvarepriser. Slike langsiktige historiske data og megatrender må imidlertid analyseres nærmere for å vurdere deres representativitet for fremtiden. For noen fenomener er analyse av analogier mer relevant. Historiske analogier kan være et grunnlag for å utvikle scenarioer, og kanskje spesielt for teknologiske og geopolitiske utviklingstrekk. Analogier fra litteratur og vitenskapelige fiksjoner kan være nyttig for kreativ utvikling av scenarioer. I scenarioutvikling må vi generelt være forsiktige med lineær ekstrapolering inn i fremtiden.

Selskapene og revisorene kan bruke kunstig intelligens for å utvikle scenarioer, og revisors oppgave blir å sammenligne sine egne med selskapets scenarioer. Igjen snakker vi om å forstå ulike forventningsrette eller de mest plausible scenarioene. Her er vi inne på et område hvor det vil være stor interaksjon mellom ulike kunstig intelligensalgoritmer, mellom tverrfaglige grupper av mennesker, og mellom kunstig intelligens og menneskelig intelligens.

Kunstig intelligens har noen åpenbare fortrinn i analyse av langsiktige historiske data og megatrender eller analogier. De fleste av oss har vanskeligheter med å trekke opp linjene i verdenshistorien de siste hundre eller tusen årene, og enda vanskeligere blir det om vi skal skaffe oss oversikt over økonomisk historie, teknologiens historie, geopolitisk historie, kulturhistorie og mye mer. Kunstig intelligens kan skaffe seg oversikt over flere hundre tusen sider i løpet av noen sekunder, og gjøre analyser stort sett like raskt. Likevel må vi forvente at ulike kunstig intelligensalgoritmer vil komme opp med forskjellig svar, og at den menneskelig intelligens må bidra.

Revisjon av langt mer sofistikerte verdsettelsesmodeller

Dagens verdsettelsesmodeller har ofte en enkel struktur med 1–2 eksplisitte prognoseperioder og deretter en terminalverdi. Ofte med relativt enkle konvergeringer over tid mot et normalisert fremtidsbilde. Ofte med et lite eksplisitt bilde av usikkerhet, og dermed primært med kun en intuitiv antakelse om forventningsverdiene. Makroøkonomene bruker i enkelte sammenhenger såkalte dynamiske stokastiske generelle likevektsmodeller (DSGE). Dynamisk betyr flere eller mange perioder. Stokastisk betyr at usikkerhet er formulert som sekvenser av sannsynlighetsfordelinger. Generell likevekt betyr konsistens med økonomiske modeller og likevekt. Verdsettelse basert på stokastisk dynamisk programmering og real-opsjoner nærmer seg makroøkonomenes tenkning. Beslutningstrær er ofte en praktisk måte å gjøre slike verdsettelser på, men selv det kan bli relativt komplisert fordi trærne blir store.

En nyttig analogi for slike sofistikerte verdsettelser er sjakk, og vi vet at sjakk i praksis ikke kan løses som en matematisk optimalisering med Nash likevekt. Dimensjonene i utfallsrommet er rett og slett større enn antall atomer i verden, og dermed kan selv ikke fremtidens kvantedatamaskiner løse regnestykket. Det betyr at både stokastisk dynamisk programmering og real-opsjonsmodeller bygger på forenklinger. Det betyr også at de to modellene ofte vil gi ulike svar. Vi kan også tenke oss flere varianter av de to modellene, og dermed kan vi få mange svar. Menneskelig intelligens kan gi verdifulle bidrag gjennom innsikt i økonomiske modeller og stokastiske spesifiseringer.

Både selskapet og revisor kan bruke mange ulike modeller, og kunstig intelligens kan brukes til å gjennomføre disse beregningene. Både selskapet og revisor kan også bruke kunstig intelligens til å analysere konsistens og avvik mellom de ulike modellene. Det vil imidlertid være en rekke strategiske variabler som det er vanskelig å kvantifisere, f.eks. modellere og kvantifisere alle egenskapene i et selskap som Jim Collins beskriver i boken Good to Great (2001, HarperCollins). Her berører vi samspillet mellom menneskelig intelligens og kunstig intelligens – både i selskapet og hos revisor.

3. Avslutning

Denne artikkelen er selvfølgelig ikke en fullstendig strategisk analyse av revisjonsbransjen og mulighetene og truslene som følger av kunstig intelligens. Det beste jeg kan håpe, er at det kan være en inspirasjon til videre strategisk tenkning.

Kunstig intelligens er minst like fascinerende som menneskelig intelligens. Fundamentet for kunstig intelligens berører alt fra filosofi til matematikk, økonomi, nevrovitenskap, psykologi, datavitenskap, kontrollteori, kybernetikk, lingvistikk og språk. Det stimulerer til individuell tverrfaglighet og kollektiv tverrfaglighet.