Kunstig intelligens gjør danske dødsattester søkbare

Det danske Rigsarkivet har nå gjort nær én million dødsattester fra perioden 1920 til 1943 søkbare gjennom et nytt digitalt register. Ved hjelp av kunstig intelligens og frivillige transkribenter er håndskrevne dødsattester blitt omgjort til strukturerte og søkbare data.

--Annonse--

Det nye datasettet heter «Det Historiske Dødsårsagsregister» (HDAR) og inneholder blant annet navn, fødselsdato, dødsdato, yrke, dødsårsak og eventuelle følgesykdommer. Materialet dekker hele Danmark og fyller et viktig hull mellom eldre arkivmateriale og det eksisterende digitale dødsårsaksregisteret som starter i 1943.

For slektsforskere betyr dette at det nå blir langt enklere å finne ut hva forfedre og slektninger døde av. Tidligere har dødsattestene ligget som skannede bilder i arkivene, men uten mulighet for effektivt personsøk. Nå kan man søke direkte på navn, fødselsdato og dødsdato og få treff i materialet.

Arbeidet er utført av Rigsarkivets avdeling for Data Science som en del av det større multigenerasjonsprosjektet i Danmark. AI-modellene er trent opp med over 100.000 transkriberte dødsattester som frivillige tidligere har tastet inn manuelt. Dette har gjort det mulig å lære systemene å tolke vanskelig håndskrift fra første halvdel av 1900-tallet.

Registeret kan også få stor betydning for forskning på folkehelse, arvelige sykdommer og samfunnsutvikling. Materialet dekker en periode der Danmark gjennomførte store helse- og sosialreformer, og forskere får nå mulighet til å analysere utviklingen på individnivå.

Datasettet er fritt tilgjengelig og kan lastes ned som CSV-fil fra Rigsarkivet. Samtidig fortsetter arbeidet med å forbedre kvaliteten gjennom frivillig korrekturlesing av AI-transkriberingene.

Les mer hos Rigsarkivet