HTRFLOWSå här ser HTRFLOW ut idag. Länk till demon hittar du längst ned i nyheten.
Riksarkivet har publicerat en demoversion av en ny funktion för texttydning, som ska visa hur handskrivna dokument kan omvandlas till digital, sökbar text. Den har en bit kvar till en användarvänlig upplevelse, men kan redan nu testas av den nyfikne.

Riksarkivet har under senare år deltagit i flera forskningsprojekt som undersöker hur så kallad HTR-teknik kan användas inom myndigheten.

HTR står för Handwritten Text Recognition och tekniken går ut på att med hjälp av AI tolka handskriven text. Riksarkivet har genom olika projekt skapat HTR-modeller i transkriberingsplattformen Transkribus med hjälp av kunniga deltagare från allmänheten, med målet att skapa texttolkningsmodeller för olika epoker. I nästa steg används modellerna för att tolka handskrifter och maskinellt generera en transkriberad, sökbar text.

Tolkar handskrifter från 1650 till 1900

HTRFLOW kallar Riksarkivet sin nya funktion, som bygger vidare på de tidigare projekten. Den beskrivs som en interaktiv steg-för-stegdemonstration, där demon, som vi länkar till längst ned i nyheten, är tränad att tolka handskrifter från cirka 1650–1900.

Uppenbart är att det ännu så länge återstår en hel del arbete med att göra tjänsten begriplig för gemene man. Men i nyheten som Riksarkivet publicerat på sin webbplats står att Riksarkivet förhoppningsvis i en snar framtid ska kunna erbjuda storskalig HTR-tolkning av arkivhandlingar. Exakt hur planerna ser ut för vidareutvecklingen av tjänsten framgår inte av nyheten, men fler spännande nyheter utlovas framöver.

Så testar du HTRFLOW

Redan nu kan den datatekniskt bevandrade testa HTRFLOW. Du som inte är det kan förstås också göra ett försök. Enklast är att leta upp en högupplöst bild på den handskrivna sida du vill ha hjälp med att tolka, ladda upp den i demons ”Fast track” och sedan klicka på ”Run”. Då kommer förhoppningsvis två filer att genereras, en txt-fil och en xml-fil för nedladdning. 

Här kan du testa HTRFLOW

Läs mer om Riksarkivets
tidigare transkriberingsprojekt:

Se de första resultaten av Riksarkivets transkriberingsprojekt (Rötter)

AI och medborgarforskning öppnar upp arkiven - Informationsfilm om Riksarkivets projekt "Maskintolkning av handskrivna källmaterial" (YouTube)

Annonser