The Swedish National Archives has published a demo version of a tool that interprets handwriting (HTR) and delivers it as digital and much more readable text. The demo version also allows users to upload their own texts to have them converted into digital text.
Transkriberings-verktøyet har fått navnet HTRFLOW og er trent til å gjenkjenne generisk håndskrift fra perioden 1650-1900.
Da Slekt1 testet HTRFLOW med et håndskrevet rettsdokument fra slutten av 1800-tallet, slet verktøyet med å komme med en god digital og forståelig skrift. Alle håndskrifter er nok ikke like enkle å lese av en generisk modell, men så er også modellen opplært i svensk og ikke norsk.
Dette forkludrer det nok litt ekstra, hvis man absolutt skal gjøre som Slekt1 å laste opp et norskspråklig dokument. Det som kom ut bar preg av å være forsøkt tvunget ut på svensk.
Ved å gå inn på denne lenken, kan du selv se og teste HTRFLOW.
Det svenske Riksarkivet har lenge jobbet med Transkribus for å lage ulike datasett, slik at modellen skal fungere på så mange ulike håndskrifter som mulig.
HTR (Handwritten Text Recognition) er en teknologi som konverterer håndskrevet tekst til digital tekst. Dette gjøres ved hjelp av algoritmer og maskinlæring som analyserer og gjenkjenner de håndskrevne karakterene.
HTR er spesielt nyttig for å digitalisere historiske dokumenter og manuskripter, noe som gjør det enklere å søke og analysere disse tekstene. Teknologien kan håndtere ulike stiler av håndskrift og er en viktig ressurs for arkiver, biblioteker, og forskere som jobber med store mengder håndskrevne dokumenter.







