Mapping family trees using artificial intelligence

Takket være 38 millioner danske kroner i støtte fra Novo Nordisk Foundation, utvikler nå det danske riksarkivet et nytt multigenerationsregister over danske familierelasjoner siden 1920.

--Advertisement--

Løsningen skal lese kirkebøkene ved hjelp av kunstig intelligens og registeret som derfra skapes vil kunne gi større innsikt i hvordan arvelige og familiære forhold påvirker blant annet sunnhet og det sosiale livsløp.

Ved hjelp av Det Centrale Personregister (CPR), som ble innført i 1968, skal opplysningene i kirkebøkene kobles sammen.

Siden CPR-nummeret ble innført i 1968, gir det begrensninger i hva som kan hentes ut av sikre data før denne tiden. Dette gjør at forskningsdelen på sosialt livsløp med utgangspunkt i arvelige sykdommer, kun kan spores et par generasjoner tilbake i tid.

Multigenerasjonsregisteret som nå skal lages ved hjelp av kunstig intelligens, vil imidlertid være i stand til å identifisere slektskap helt tilbake til 1920. Dette muliggjør sporing av enkelte arvelige sykdommer så langt tilbake som 100 år tilbake i tid.

“Det er fantastisk at Novo Nordisk Foundation, med sin store donasjon, gjør det mulig å åpne et nytt kapittel i vår helseforskning. Med det nye flergenerasjonsregisteret vil forskere kunne studere data og fenomener over flere generasjoner. Dette gir oss ny kunnskap og resultater som ikke har blitt sett før i helseforskning, og digitalisering vil også gjøre det lettere å bruke den nye kunnskapen og informasjonen i lang tid framover.»

Den danske kulturministeren Joy Mogensen

Samler familieforbindelser

Det nye multigenerasjonsregisteret vil koble informasjon om familieforbindelser for mennesker fra Det Centrale Personregister sammen med den mye eldre informasjonen fra kirkebøkene. Dermed kan familieforbindelser opprettes i registeret for alle dansker helt tilbake til 1920. Dette skal gjøres i samarbeid med forskere fra Senter for registerforskning ved Aarhus Universitet.

Hypotesen er at mange sosiale problemer og helseproblemer skal kunne forklares basert på av familieforhold, så det er viktig kunnskap å hente hvis forskere får muligheten til å studere fenomener i løpet av 3-5 generasjoner.

“Et multigenerasjonsregister vil utvilsomt kunne tilføre helt nye perspektiver og resultater til dansk forskning til fordel for oss alle. Ny kunnskap kan skapes til fordel for befolkningen, og samtidig vil den gi dansk forskning et betydelig konkurransefortrinn i internasjonal sammenheng. ”

Professor Henrik Toft Sørensen, styreleder i Koordinerende Organ for Registerforskning (KOR)

Analoge kilder digitaliseres med kunstig intelligens (AI)

Det skal nå utvikles algoritmer som kan tyde de håndskrevne kirkebøkene. Dette arbeidet skal gjøres av Københavns Universitets senter for AI. Arbeidet er ansett som svært vanskelig, materialet består av kirkebøker fra mer enn 2000 menigheter skrevet med forskjellig håndskrift over en periode på nesten 60 år.

Derfor må algoritmene «trenes» på blant annet allerede transkriberte kirkebøker.

“Vi gleder oss utrolig til å komme i gang – ikke minst med arbeidet med kunstig intelligens og historiske manuskripter som åpner for nye spennende muligheter for Riksarkivet og våre brukere. Multigenerasjonsregisteret er et godt eksempel på hvor viktig det er at Arkivverket bevarer data og dokumenter fra den offentlige forvaltningen slik at de kan brukes i nye sammenhenger til beste for det danske samfunnet. Sammen med våre unike, danske helsedata, vil flergenerasjonsregisteret være en forskningsressurs uten sidestykke, og jeg tror ikke vi kan forestille oss hvilken forskjell registeret vil gjøre for dansk forskning. ”

Den danske riksarkivaren Anne-sofie jensen