ÖSTERSUND Nu kan datorer känna igen handskriven text i hundratals år gamla böcker och dokument.
Dessa omvandlas sedan till digitalt sökbara dokument, något som öppnar för en helt ny tillgänglighet till informationen.
Fornskriftssällskapet i Jämtland är först ut i landet med att ha börjat arbeta i systemet.
Transkribus heter programvaran som utvecklats av universitet i österrikiska Innsbruck. Det är en teknologi som kan tyda gammal handskriven text och snabbt renskriva den till ett sökbart dokumentformat. Boksidan från den ibland månghundraåriga originalkällan fotograferas först och sedan börjar datorns mjukvara arbeta. Den ofta snirkliga texten är svårtydd även för ett vant människoöga och läsningen och den tidigare manuella inknappningen har varit tidsödande. Men nu gör datorn arbetet på en bråkdel av tiden.
Först ut i Sverige att använda programvaran är Fornskriftssällskapet i Jämtlands län, som har ett tätt samarbete med Landsarkivet. För två år sedan inleddes kontakterna och i år kunde datorn i Innsbruck spotta ur sig de första skarpa dokumenten från Jämtlands som transkriberats, det var domböcker från 1600-talet som digitaliserades.
– Det är många universitet runt om i världen som har försökt lära datorer att läsa handskriven text, säger Maria Press, som är ordförande i föreningen Fornskriftssällskapet i Jämtlands län och landsarkivarie på Landsarkivet.
– Det har varit varierande framgångar. 2017 hörde jag tala om Transkribus och då åkte jag till ett möte i Oslo där det hölls en förevisning. Vi tyckte att det här absolut var något för oss och inledde ett samarbete. Traditionellt så sysslar fornskriftssällskapet med avskrifter av gamla förlagor, något som tar otroligt mycket tid. Därför så är den här nya tekniken något av en revolution för vår verksamhet, säger Maria Press.
Programvaran för textigenkänning innehåller element av artificiell intelligens. Den matas först med ett originaldokument och en korrekt avskrift. Maskinen lär sig då känna igen texten. Sedan rättas eventuella felläsningar av fornskriftssällskapets medlemmar, dessa rättningar finjusterar programvaran mot allt säkrare översättning.
– Vi har fått ett mycket bra resultat. Ungefär 90 procent blir korrekt översatt med vår modell över 1600-talsskrift, säger Maria Press.
– Det är helt otroligt, säger Per Rejving, som arbetat mycket med manuell avskrift av de gamla urkunderna.
– Nu sparar man ett helt steg i bearbetningen av texterna. Nu kan man börja med en korrekturläsning och det mest tidsödande steget är borttaget. Jag tror det handlar om en tiondel av tiden att behandla med den här moderna tekniken jämfört med traditionell behandling, säger Per Rejving.
– Den stora fördelen är att man i de digitala dokumenten kan söka på till exempel namn, orter, brott eller andra sökord för att få en ingång i materialet. Vi skulle sedan kunna publicera råkopior som är oredigerade och använda crowdsourcing för att färdigställa materialet, säger Maria Press.
Möjligheterna i framtiden för digitala system inom arkivforskningen är stora. I Transkribusprojektet känner inte mjukvaran igen orden utan fokuserar enbart på att översätta handskriven text till digitalt textformat. Men redan idag finns textrobotar med artificiell intelligens inom andra branscher som kan läsa dokument, förstå sammanhang och sätta ihop en slutprodukt utifrån den utvunna informationen.
– För släktforskning skulle man kunna hitta knytningar och släktsamband mellan flera olika dokument, säger Per Rejving.
621 visningar