logo

Skatteetaten

Bruk av datadrevne modeller i Skatteetaten

Skatteetaten har over flere år utviklet og testet statistiske modeller for å effektivisere og forbedre innkreving av skatter, utvelgelse til kontroll og saksbehandling. Resultatene er positive og viser at modellene har gitt forbedringer i måten Skatteetaten løser oppgaven på og gitt økt proveny.

Utviklingen innenfor digitalisering, innsamling, lagring, søking, deling, utveksling og visualisering av data har medført at flere nye kilder blir tilgjengelig for analyse. Gjennom dette vil Skatteetaten og andre større organisasjoner være i en bedre posisjon til å utnytte det stadig økende tilfanget av data til å ta bedre beslutninger.

Økt digitalisering har medført at levering av meldinger på papir til Skatteetaten har blitt nesten helt borte de siste årene og innenfor flere områder ikke lenger er mulig. Forventningene til tekniske løsninger og hvilke tjenester Skatteetaten kan tilby, vil øke fremover. Skatteetaten ønsker å møte disse forventningene og har en ambisjon om at vi i perioden frem mot 2025 gjennomfører omfattende fornyelser i våre tjenesteleveranser til borgere og næringsliv. Etaten har en aktiv dialog med sentrale aktører i næringslivet og deres organisasjoner, rådgivere, system- og tjenesteleverandører, samt tredje­parter som banker/finansinstitusjoner og andre myndigheter.

Datadrevne modeller og scoring

Fremover vil Skatteetaten få en rekke nye kilder og større datamengder. Dette vil i mange tilfeller kreve avanserte analyseteknikker for å trekke ut meningsfull informasjon, finne mønstre og kunne forutsi fremtidige hendelser (predikere). I disse prediksjonsmodellene lages det en score som representerer en sannsynlighet for at en hendelse inntreffer. Scoring har tradisjonelt blitt brukt innenfor bank, forsikring og innkreving av skyldig beløp. I de senere årene har metoden fått fotfeste innenfor varehandel og telekommunikasjon for å tilby kundene ulike produkter basert på deres preferanser. Datadrevne modeller i Skatteetaten har så langt blitt brukt til å predikere og score innenfor utvelgelse til kontroll, innkreving og mang­lende innlevering av melding. Innenfor kontroll vil alle saker med høy score vurderes av saksbehandler. Innenfor innkreving og manglende meldingsinnlevering er det utviklet ulike betjenings­strategier basert på score for å effektivisere arbeidsprosessene.

Dagens modeller i Skatteetaten

Hvert år håndterer Skatteetaten skattemelding for 4,4 millioner lønnstakere og pensjonister. Når disse mottar skattemeldingen, er de fleste relevante poster forhåndsutfylt med opplysninger fra tredjepart som banker, arbeidsgivere og andre. Flertallet av skattytere har ingen endringer til den forhåndsutfylte skattemeldingen. Når skatte­meldingen er levert, kontrollerer Skatteetaten for å finne skattytere som gjør feil. Blant alle skattemeldinger er det en relativt liten andel med feil, og det er utfordrende å velge ut til kontroll de få skattyterne som gjør feil. Derfor har vi laget en prediktiv modell som scorer alle meldingene som sendes inn og grupperer skattytere etter sannsynlighet for feil på fradragsposter. Modellen gjør at Skatteetaten i mindre grad kontrollerer skattemeldinger uten feil. Dette øker skatteprovenyet og forhindrer unødvendige henvendelser til skattytere.

Hvem betaler restskatten?

Tilsvarende har vi utviklet en modell innenfor innkreving av restskatt som scorer restskattytere etter sannsynlighet for at de betaler skyldig restskatt. Basert på dette kan vi differensiere innkrevingsarbeidet mot de ulike restskattyterne og oppnå økt og tidligere innbetaling av restskatt gjennom mer målrettet virkemiddelbruk, større grad av likebehandling av like saker og en mer effektiv ressursbruk.

Effektiviserer arbeidet med mva-meldingen

Skatteetaten har utviklet flere modeller innenfor merverdiavgift. Vi mottar hvert år over 1,6 millioner mva-meldinger. En rekke virksomheter leverer i dag melding etter at fristen har forfalt, og etter at etaten har foretatt en skjønnsfastsettelse. Det betyr at mye tid går med til unødig skjønnsarbeid. Skatteetaten har gjennomført en pilotstudie hvor vi har benyttet prediktive modeller som forutsier hvilke virksomheter som leverer mva-melding, og hvilke virksomheter som ikke gjør det. Andelen skjønnede virksomheter har gått ned med 16 prosent sammenlignet med perioden før piloten. Samtidig har arbeidsbyrden for saksbehandlerne blitt jevnere og arbeidet med å avklare hvilke virksomheter som bør slettes fra Merverdiavgifts­registeret, har blitt mer effektivt.

Bedrer treffprosenten på feil i mva-meldinger

Feil i mva-meldingen kan skyldes at næringsdrivende bevisst overrapporterer kostnader, underrapporterer inntekter, ubevisst misforstår regelverk eller på annen måte feilfører i sitt avgiftsregnskap. Meldingskontroll er en kontroll hvor virksomhetens regnskap og bilag blir sammenlignet med mva-melding som er sendt inn.Skatteetaten har en rekke regler og filtre i saksbehandlingssystemet for å vurdere meldinger til kontroll. Filtrene som tradisjonelt er brukt, gir utslag på langt flere meldinger enn det er hensiktsmessig å kontrollere. Flere filtre kan ha utslag på samme melding. Det høye volumet av meldinger sammen med korte frister for saksbehandling gjør mva-meldingskontroll til et egnet område for utforsking av utvelg­elsesmetoder ved hjelp av prediksjon.

I en pilotstudie har vi testet en statistisk modell for å risikoscore alle mva-meldinger som kommer inn. Saksbehandler får tildelt saker med høy score og vil, basert på score og andre opplysninger, vurdere hvilke mva-meldinger som skal kontrolleres. Resultatene så langt er positive, og viser at modellen i gjennomsnitt gir åtte prosentpoeng bedre treffprosent og rundt 5000 kroner høyere beløpsmessige endringer, enn tradisjonell tilnærming.

Datadrevne modeller i Skatteetaten har så langt blitt brukt til å predikere og score innenfor utvelgelse til kontroll, innkreving og manglende innlevering av melding.

Ønsker å finne dem som har behov for veiledning

I 2016 lanserte Skatteetaten en ny melding for næringsdrivende med enkle forhold som har fått navnet næringsrapport skatt. Denne løsningen er ment for nærings­drivende med enkle forhold, og er først og fremst for de som driver egen bedrift og rapporterer til Skatteetaten selv. Skatteetaten skal sammen med et forskningsmiljø se på muligheten for å brukertilpasse informasjon i løsningen basert på sannsynlighet for at bruker har behov for informasjon/veiledning i forbindelse med utfylling og levering.

Skatteetaten vil fremover se på hvordan vi kan utvikle ulike modeller som kan gjøre oss mer effektive innenfor veiledning og i det forebyggende arbeidet. Dette kan gjøre oss bedre i stand til å brukertilpasse veiledning, informasjon og tjenester til skatt­yterne.