Přednáška představuje komplexní úvod do problematiky automatického rozpoznávání historických rukopisů (Handwritten Text Recognition, HTR) a jeho aplikace při zpracování archivních fondů střední Evropy. Zaměřuje se na specifika českých, německých a latinských archivních písem z období raného novověku až do konce 2. světové války. V úvodní části přednáška analyzuje rozsah výzev, kterým čelí evropské archivy při zpracování milionů stran historických dokumentů, a představuje digitalizaci jako první krok k jejich zpřístupnění. Následuje historický exkurz do vývoje písem používaných v archivních materiálech střední Evropy. Jádro přednášky tvoří představení technologie HTR založené na deep learning (konvoluční neuronové sítě, rekurentní sítě LSTM, CTC algoritmus) a jejího vývoje od tradičního OCR. Detailně jsou představeny platformy pro HTR, včetně jejich funkcí, výhod a omezení.
Přednáška dále prezentuje konkrétní projekty a případové studie z České republiky i zahraničí, včetně regionálních HTR iniciativ. Praktická část zahrnuje popis workflow od digitalizace přes tvorbu ground truth dat až po publikaci výsledků.
Přednášející: Marcel Samek
Kredity: 3
Místo: budova B, učebna B16 (3. patro) – přednáška se koná pouze v prezenční formě
Rezervace
Přihlaste se, pokud zde již máte účet.

