Riksarkivet i Sverige automatiserer transkribering av håndskrift

Ved hjelp av Handwritten Text Recognition (HTR) automatiserer nå det svenske Riksarkivet tydingen av håndskrift. En demoversjon som lar brukeren søke i håndskrift er allerede klar til bruk.

--Annonse--

Det er ved hjelp av programvaren Transkribus at transkriberingen av håndskrift nå kan automatiseres. Transkribus er utviklet ved Universitetet i Innsbruck, med støtte fra EU. Programmet lar brukeren bygge opp håndskriftsmodeller som programmet siden bruker som utgangspunkt for å tolke øvrige håndskrevne dokumenter.

Les også: Dette programmet transkriberer håndskrevne dokumenter

Foreløpig er det kun en utvalgt del av håndskrevne dokumenter fra arkivet til det svenske Riksarkivet som nå er søkbare:

Resultatet av et søk etter ordet «Gøteborg» gir en treffliste som viser ordets kontekst og et bilde av originalkilden. Foto: Skjermdump fra demo-søket

På denne demosiden kan du selv gjøre søk i det foreløpig begrensede utvalget av håndskrevne kilder.

Resultat av prosjektarbeid

At en liten andel av Riksarkivets håndskrevne kilder nå er søkbare har sin bakgrunn i et prosjektet «Maskintolkning av handskrivna källmaterial».

Prosjektet strekker seg over perioden 2020 til 2021 og gjennomføres i samarbeid med READ-COOP SCE med finansiering fra Vinnova. Svenske Vinnova gir støtte til ulike prosjekt blant annet prosjekter som dette, hvor kunstig intelligens er en medvirkende faktor til resultatet.

Transkribus i seg selv krever mange tusen ord, ferdigtolket av et menneske, før det er i stand til å tolke håndskrift på egen hånd. Prosjektet baserer seg derfor på publikums transkribering av håndskrevne dokumenter, som en stor dugnad.

Når håndskriften blir tilgjengelig som dataskrift kan en stor mengde med håndskrevne dokumenter bli langt lettere tilgjengelig for forskning. Samtidig åpner prosjektet dørene for storskala tekstanalyse, som kan avdekke historisk informasjon som man enda ikke er klar over.

Siden håndskrift varierer, må det trenes opp en rekke håndskriftsmodeller. Etter hvert som stadig nye håndskriftsmodeller blir klare for Transkribus, vil en stadig økende del av håndskrevne kilder ved det svenske Riksarkivet kunne tilgjengeliggjøre for søk.

sok.riksarkivet.se/htr