Istituto di Ricerche sulla Popolazione e le Politiche Sociali

Matrices

MATRICES - Semantic Annotation over Heterogeneous Historical Documents

MATRICES ÃĻ un progetto interdisciplinare al quale partecipano due dipartimenti dell’Università Roma Tre e un istituto del CNR. Il Dipartimento di Ingegneria dell’Università Roma Tre contribuisce al progetto con le proprie competenze di ingegneria informatica, in particolare intelligenza artificiale e gestione dei dati; il Dipartimento di Studi Umanistici con le proprie competenze in paleografia, archivistica e storia urbana. L’Istituto di Ricerche sulla Popolazione e le Politiche Sociali del CNR contribuisce con competenze relative alla facilitazione dell’accesso all’informazione. Il progetto si avvale anche della collaborazione dell’Archivio di Stato di Roma, che fornirà il materiale archivistico su cui verrà definito lo studio di caso per la valutazione sperimentale delle soluzioni sviluppate nel progetto.

Goals
Il progetto MATRICES ha l’obiettivo specifico di sviluppare un workflow innovativo per la trascrizione e l’annotazione semantica di fonti archivistiche storiche digitalizzate, al fine di facilitare la consultazione su larga scala. Per trascrizione si intende il processo di estrazione del testo dalle immagini digitalizzate, in modo ad esempio, che risulti ricercabile e accessibile. Per annotazione semantica si intende l’identificazione automatica nel testo e nelle immagini di elementi semantici di interesse dell’utente, sotto forma principalmente di entità (come località, vie, edifici, istituzioni e persone) e specifiche relazioni (ad esempio il luogo di nascita di una persona). Trascrizione e annotazione semantica sono infatti alla base del processo di trasformazione e conservazione digitale di un archivio cartaceo e rappresentano il naturale passo successivo alla sua digitalizzazione.

 Keywords: Annotazione Semantica, Digitalizzazione, Machine Learning

Read More