Tillbaka

Olof Karsvall, Riksarkivet - om Artificiell Intelligens (AI) & verktyget Transcribus. Via Zoom

Torsdag 25 april 2024 Kl. 18:00 StorStockholms Släktforskarförening

Torsdag 25:e april kl. 18.00 - Olof Karsvall, forskningsledare på Riksarkivet, berättar om Riksarkivets projekt att med hjälp av Artificiell Intelligens (AI) och texttydningsverktyget Transcribus läsa in och automatiskt transkribera gammal handskrift.


För många av oss släktforskare är texttydningen en utmaning och även för duktiga texttolkare kan det vara tidsödande att ta sig igenom en lång och svårtydd handskrift. Syftet med datorprogrammet är att hjälpa forskare igenom längre handskrivna texter från historisk tid.


Idag finns miljontals med bilder på digitaliserade handskrivna arkivmaterial. Men det digitala materialet kommer sannolikt inte att främja ny forskning och kunskap om inte innehållet transkriberas. För att Transcribus ska kunna hjälpa till med texttydningen måste man först tala om för programmet hur skribentens bokstäver ser ut. Så många som möjligt. Man måste också ange information om skrivmönster och ofta använda former av ord och uttryck. På datorspråk kallas det maskininlärning och principen är att ju mer man talar om för programmet desto bättre blir det på att sedan automatiskt tyda texten.


Utvecklarna av Transcribus uppskattar att det behövs cirka 5000 transkriberade ord innan syste-met kan känna igen tryckt text. För att kunna transkribera handskrift krävs omkring 15 000 ord för att programmet ska kunna översätta texten automatiskt.


AI-modellen, som har en noggrannhetsgrad på 95 procent, har tränats med hjälp av data från 3,3 miljoner textrader och totalt 15,6 miljoner ord.


Det är många som bidragit till AI-modellen, som är resultatet av ett samarbete mellan Riksarkivet i både Sverige och Finland, som arbetat tillsammans med Stockholms stadsarkiv, Jämtlands läns fornskriftssällskap, medborgarforskare och forskare från Stockholms och Uppsala universitet.


Eftersom det finns ett värde i att även forskare på amatörnivå kan få hjälp med att transkribera äldre källdokument har programmet lagts ut gratis på nätet.


Digitalt via zoom. Alla är välkomna. Gratis.


Anmäl dig senast onsdag den 24:e april till info@sssf83.se


Länk till programmet skickas med e-post.

Föredrag Stockholm
NÄR
Torsdag 25 april kl. 18:00
VAR
Digitalt
KOSTNAD
Gratis för alla
FÖR VEM
Öppet för alla
KONTAKT
info@sssf83.se
HEMSIDA

Torsdag 25:e april kl. 18.00 - Olof Karsvall, forskningsledare på Riksarkivet, berättar om Riksarkivets projekt att med hjälp av Artificiell Intelligens (AI) och texttydningsverktyget Transcribus läsa in och automatiskt transkribera gammal handskrift.


För många av oss släktforskare är texttydningen en utmaning och även för duktiga texttolkare kan det vara tidsödande att ta sig igenom en lång och svårtydd handskrift. Syftet med datorprogrammet är att hjälpa forskare igenom längre handskrivna texter från historisk tid.


Idag finns miljontals med bilder på digitaliserade handskrivna arkivmaterial. Men det digitala materialet kommer sannolikt inte att främja ny forskning och kunskap om inte innehållet transkriberas. För att Transcribus ska kunna hjälpa till med texttydningen måste man först tala om för programmet hur skribentens bokstäver ser ut. Så många som möjligt. Man måste också ange information om skrivmönster och ofta använda former av ord och uttryck. På datorspråk kallas det maskininlärning och principen är att ju mer man talar om för programmet desto bättre blir det på att sedan automatiskt tyda texten.


Utvecklarna av Transcribus uppskattar att det behövs cirka 5000 transkriberade ord innan syste-met kan känna igen tryckt text. För att kunna transkribera handskrift krävs omkring 15 000 ord för att programmet ska kunna översätta texten automatiskt.


AI-modellen, som har en noggrannhetsgrad på 95 procent, har tränats med hjälp av data från 3,3 miljoner textrader och totalt 15,6 miljoner ord.


Det är många som bidragit till AI-modellen, som är resultatet av ett samarbete mellan Riksarkivet i både Sverige och Finland, som arbetat tillsammans med Stockholms stadsarkiv, Jämtlands läns fornskriftssällskap, medborgarforskare och forskare från Stockholms och Uppsala universitet.


Eftersom det finns ett värde i att även forskare på amatörnivå kan få hjälp med att transkribera äldre källdokument har programmet lagts ut gratis på nätet.


Digitalt via zoom. Alla är välkomna. Gratis.


Anmäl dig senast onsdag den 24:e april till info@sssf83.se


Länk till programmet skickas med e-post.

" startDate="2024-04-25" startTime="18:00" endDate="2024-04-25" endTime="18:00" timeZone="Europe/Stockholm" location=" Digitalt" organizer="StorStockholms Släktforskarförening|info@sssf83.se" options="'Apple','Google','Outlook.com','Yahoo','MicrosoftTeams','Microsoft365'" listStyle="overlay" customCss="https://www.rotter.se/media/com_ssfkal/css/atcb.css" buttonStyle="custom" trigger="click" hideCheckmark language="sv" >