Harvey AI bringer ­teknologien bak ChatGPT til advokatbransjen

17-20

Teknologi og digitalisering

I denne spalten vil Lars Erlend Leganger og noen av hans kollegaer skrive om aktuelle temaer innen teknologi/digitalisering som direkte eller indirekte også vil påvirke revisors hverdag. Lars Erlend er AI-ekspert og direktør i PwC. Han har en PhD i teoretisk fysikk fra NTNU.

OpenAI lanserte ChatGPT i november 2022, noe som førte til økt interesse for praktisk anvendelse av generativ AI. Den OpenAI-støttede legaltech-startupen Harvey AI tilpasser GPT til juridiske anvendelser. Harvey AI kan gjøre juridisk research og lage sammendrag, kontraktutkast og juridiske notater, og blir nå implementert i store advokatfirmaer og selskaper som PwC.

PhD
Lars Erlend Leganger

Direktør i PwC

Statsautorisert Revisor
Øystein Tungen

Manager i Advokatfirmaet PwC

Dette kan endre arbeidsmetodikk og roller for nyutdannede jurister, med mer fokus på kvalitetssikring og etterprøving av AI-genererte resultater. Et viktig spørsmål er hvordan man sikrer konfidensialitet og tillit til AI-verktøy. Løsninger som Harvey AI bruker databrannmurer mellom AI-modeller for å hindre lekkasje av informasjon. Dette kan også gi store firmaer en fordel, da de har mer interne data tilgjengelig for å tilpasse og forbedre sine AI-verktøy.

Generativ AI puster mennesket i ryggen

Generativ AI er en type kunstig intelligens som har evnen til å skape nytt innhold ved å lære fra store datasett. Den bruker avanserte maskinlæringsalgoritmer og nevrale nettverk for å generere resultater basert på mønstre og sammenhenger i treningsdataene. En av de mest kjente arkitekturene for generativ AI er GPT (Generative Pre-trained Transformer) utviklet av OpenAI, der Microsoft er hovedaksjonær. Ved hjelp av et bredt spekter av skriftlige data, som internettartikler, bøker, nyheter og nettsider, har GPT-modellene lært å generere forskjellige former for tekst, ofte med menneskelig presisjon.*For mer om forretningsmessige muligheter og etiske utfordringer, se https://www.revregn.no/journal/2022/6/m-703/Chatboter_%E2%80%93_p%C3%A5_godt_og_ondt og https://www.revregn.no/journal/2023/3/m-1558/Generativ_AI_skaper_milliardbutikk_av_data

Hvor ble det av alle AI-produktene?

Den første GPT-modellen ble introdusert for eksperter og forskere i 2018.* https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf I 2021 kom Microsoft-eide GitHub med den første spektakulære produktifiseringen av GPT-teknologi: GitHub Copilot er basert på GPT, men spesialtilpasset for å forstå og generere kode i forskjellige programmeringsspråk. Ved å analysere og forstå kodekonteksten, skrevet av en menneskelig utvikler, foreslår Copilot relevant og fullstendig kode for oppgaven som skal løses – alt fra å fullføre linjene utvikleren har begynt å skrive, til å generere hele blokker med kode basert på en løs beskrivelse av hva utvikleren ønsker å få til.

Et sannsynlig scenario er at verktøy som Harvey vil gjøre at også nyutdannede i større grad vil jobbe mer som kvalitetssikrere. I en fjernere fremtid hvor AI-verktøyene er enda mer treffsikre, må kanskje både junior- og senior-jurister konkurrere direkte mot AI-verktøyene om kundenes gunst.

Etter et år i pilottesting med over én million brukere hevdet GitHub å kunne måle 55 % økning i utvikler-produktivitet ved bruk av Copilot, og at 74 % av brukerne opplevde at de fikk en mer meningsfull arbeidsdag når Copilot i stor grad kunne ta seg av de repetitive og kjedelige delene av arbeidet.* https://github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/ I et intervju i oktober 2022 uttrykte Nat Friedman, daværende CEO i GitHub, overraskelse over at ikke andre hadde fulgt etter: Når potensialet beviselig var så stort, hvorfor hadde det ikke kommet Copilot-aktige AI-produkter tilpasset andre bransjer og aktiviteter?* https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-the-democratization-of-ai/

OpenAI investerer i legaltech

Friedman behøvde ikke vente lenge på flere AI-produkter. I november 2022 lanserte OpenAI ChatGPT, en allsidig og generell chatbot-produktifisering av GPT-modellene. ChatGPT har ført til enorm interesse i – og forhåpninger til – praktisk anvendelse av generativ AI, og i skrivende stund foregår det billedlig talt et gullrush der både etablerte aktører og startups lanserer produkter der GPT og andre AI-modeller spisses inn mot bransjespesifikke oppgaver. Samtidig med lanseringen av ChatGPT ble det kjent at OpenAI Startup Fund hadde gjort en investering på fem millioner USD i legaltech-startupen Harvey AI, hvis forretningside er nettopp å bygge AI-produkter som tilpasser GPT til anvendelser både innen jus generelt og for spesifikke selskaper og anvendelsesområder spesielt.* https://techcrunch.com/2022/11/23/harvey-which-uses-ai-to-answer-legal-questions-lands-cash-from-openai/

Harvey har flere funksjonsområder og ligner i dag i brukergrensesnitt på ChatGPT som mange kjenner til: I tillegg til å svare på direkte spørsmål kan Harvey AI skrive sammendrag, lage kontraktutkast, og juridiske notater basert på sin kunnskapsbase kombinert med informasjon som brukeren gir. Responsen lot ikke vente på seg: I februar 2023 begynte utrullingen av Harvey-verktøyet i Allen & Overy, et av de de største og mest prestisjefylte advokatfirmaene i verden, og i mars lanserte PwC og Harvey AI en avtale om ett års eksklusiv tilgang for PwC blant «Big4»-selskapene.* https://www.pwc.com/gx/en/news-room/press-releases/2023/pwc-announces-strategic-alliance-with-harvey-positioning-pwcs-legal-business-solutions-at-the-forefront-of-legal-generative-ai.html (Big4 er samlebetegnelsen på de største revisjons- og rådgivningsselskapene: Deloitte, EY, KPMG og PwC.) I sum betyr de to Harvey AI-avtalene at nær 10 000 jurister globalt snart vil få tilgang på Harvey AI som støtteverktøy. Det store spørsmålet nå er hvor stor gevinsten målt i produktivitet og meningsfulle arbeidsdager vil bli – vil vi måle økninger i produktivitet og meningsfullhet på samme nivå som for GitHub Copilot, eller er det vesensforskjeller mellom programmering og jus som gjør gevinstrealiseringspotensialet for sistnevnte annerledes?

Ny hverdag for nyutdannede

Et sentralt spørsmål er hvordan verktøy som ChatGPT og Harvey AI vil endre arbeidsmetodikken i advokatfirmaer, konsulenthus, og revisjonsselskap. Som nyansatt rett fra studiene vil en ofte gå gjennom noen år med arbeidsoppgaver som i stor grad består av å innhente kilder og produsere råmateriale og førsteutkast, som seniorer med mer erfaring så gjennomgår eller kvalitetssikrer. Hva skjer dersom testingen viser at Harvey og andre AI-verktøy kan gjøre vel så godt «førstelinjearbeid» som en nyutdannet jurist eller revisor?

Et sannsynlig scenario er at verktøy som Harvey vil gjøre at også nyutdannede i større grad vil jobbe mer som kvalitetssikrere – ved å undersøke og ettergå kilder AI-en foreslår for et juridisk spørsmål, å tilpasse AI-genererte førsteutkast til de spesifikke detaljene og nyansene som AI-en ikke nødvendigvis klarer å fange opp, og å kjenne til AI-verktøyets lærings-tidshorisont og hvilken utvikling som eventuelt har vært på fagfeltet som AI-en ikke kjenner til. Rollen til de erfarne vil fortsatt være å (ytterligere) kvalitetssikre arbeidet før leveranse. Dette er et relativt ikke-disruptivt scenario der AI-verktøy først og fremst vil føre til at «aspirantperioden» for nyutdannede blir kortere, og at de får en raskere utvikling mot samme type arbeidsoppgaver som sine mer erfarne kolleger. Forsøker en å skue lenger frem i krystallkulen, kan en også se mer disruptive scenarier der AI-verktøyene hever verdien av kvalitetssikring-kompetansen til erfarne seniorer på bekostning av nyutdannede juniorer – og i en fjernere fremtid, hvor AI-verktøyene er enda mer treffsikre, må kanskje både junior- og senior-jurister konkurrere direkte mot AI-verktøyene om kundenes gunst, se figur 1.

Figur 1: Den tradisjonelle arbeidsflyten i professional services er at junior-ressurser gjør research og lager førsteutkast, som senior-ressurser kvalitetssikrer og videreforedler til en sluttleveranse. Innføringen av AI-verktøy innebærer delvis automatisering av research- og førsteutkast-arbeidet. I første omgang kan dette føre til at også juniorer vil kunne bruke mer av arbeidstiden på kvalitetssikring og videreforedling hvor de får brukt kompetansen sin fullt ut. I en nær fremtid, etter hvert som AI-verktøyene lærer og forbedres, hvor det kreves mer og mer erfaring og kompetanse for å gjøre verdiskapende kvalitetssikring av AI-ens research og førsteutkast, kan dette innebære redusert etterspørsel etter junior-kompetanse og økt etterspørsel etter senior-kompetanse. I en fjernere fremtid, der AI-ens research og utkast til leveranse ligger nær nok det en menneskelig senior-ressurs ville jobbet seg frem til, kan en også se for seg at kunder for visse spørsmål helt vil velge bort menneskelige eksperter til fordel for AI-verktøy.

Databrannmurer gir konfidensialitet – og mer makt til de store

Å bruke og forbedre AI-verktøy med interne data og kundedata reiser noen viktige problemstillinger. For profesjonelle tjenesteytere er konfidensialitet og tillit til informasjon helt essensielt: Hvordan skal en da forholde seg til en AI-leverandør som databehandler? Kan en være sikker på at data som ett advokatfirma mater inn ikke brukes til å forbedre verktøyet også for andre advokatfirmaer som bruker samme verktøy? Eller at data og modellforbedringer utført for en av firmaets kunder ikke lekkes over til andre kunder i samme bransje? Harvey AI håndterer dette ved å lagvis bygge mer og mer fintilpassede modeller. Som felles grunnmur ligger GPT, videretrent på jus-data. På toppen av dette bygges firmaspesifikke modeller for hvert enkelt advokatfirma, der Harvey AI kan lære videre fra firmaets tidligere leveranser, malverk, og andre interne data. Videre kan det over dette laget igjen bygges spesialtilpassede modeller for enkelte domener, f.eks. internprising, og for spesifikke kunder av advokatfirmaet. Systemet er designet med «databrannmurer» mellom modellene slik at læring kun kan flyte oppover og ikke lekke mellom de forskjellige modellene i hvert finjusteringslag, se figur 2.

Figur 2: Med utgangspunkt i generelle modeller som GPT bygges gradvis mer og mer finjusterte og spesialtilpassede AI-verktøy lag for lag. Databrannmurer hindrer at data og/eller modell-læring lekker horisontalt mellom modellene i hvert lag: Grunnmodellen for firma A holdes adskilt fra grunnmodellen for firma B, osv. Tilsvarende isoleres eventuelle kundetilpassede modeller fra hverandre, så ikke konfidensielle data og/eller modellforbedringer fra en av firmaets kunder skal tilflyte en annen.

I tillegg til å sørge for nødvendig konfidensialitet, er databrannmur-baserte tilnærminger til finjustering og forbed­ring av AI-verktøy godt nytt for store globale firmaer som Allen & Overy og PwC: Jo større et firma er, jo mer interne data har det tilgjengelig, og jo større skalagevinster gir investeringer i å bygge bedre, fintilpassede AI-modeller. I en fremtid der AI-verktøy blir en kritisk del av professional services-verdikjeden, kan dette drastisk forrykke den digitale maktbalansen mellom store globale og små lokale aktører. Om dette er en mulighet eller en trussel kommer an på øyet som ser. I PwC er vi nå i gang med å samle praktisk erfaring med bruk av Harvey og annen AI; innen jus, og i andre tjenester. Hvor store AI-mulighetene og -truslene vil bli, vil tiden vise.

NB 1: Forfatterne er involvert i utprøvingen av Harvey AI i PwC.

NB 2: Det er ikke bare advokatbransjen som kan se frem til økt effektivitet fra GPT: Førsteutkastene til ingressen og tittelen til denne artikkelen er generert av ChatGPT-4.