Dans le cadre du séminaire Pratiques des Humanités digitales, Frédéric Kaplan (EPFL, DHLAB) et Lorenzo Tomasin (Unil, Lettres) présentent leurs recherches conjointes sur la reconnaissance automatique des écritures anciennes dans le projet Venice Time Machine.
La numérisation massive des archives les plus importantes est en train de rendre des millions d'images consultables. Pour chercher dans cet océan de données, il est nécessaire d'indexer le contenu de ces documents, de les rendre "cherchables", de les lier les uns avec les autres. La reconnaissance des écritures anciennes est un problème notoirement difficile mais sur lequel d'important progrès ont été réalisés ces dernières années. Nous présenterons l'approche développée au DHLAB dans le cadre du projet Venice Time Machine et les résultats obtenus lors du projet CROSS, mené en collaboration entre l'EPFL et l'UNIL.
Biographies
Prof. Frédéric Kaplan occupe la chaire de Digital Humanities à l'École Polytechnique Fédérale de Lausanne et dirige le Digital Humanities Lab (DHLAB). Dans ce cadre, il mène des projets combinant la numérisation d'archives, la modélisation et la conception muséographique. Il travaille en ce moment sur la Venice Time Machine, un projet international en collaboration avec l'Université Ca' Foscari ayant pour objectif de modéliser l'évolution et l'histoire de Venise sur une période de 1000 ans. Diplômé de l'École Nationale Supérieure des Télécommunications, il a effectué une thèse en intelligence artificielle à l'Université Paris 6 sur la modélisation des dynamiques langagières. Il a ensuite travaillé dix ans au Sony Computer Science Laboratory, puis six ans dans l'unité de recherche pédagogique de l'EPFL, au Rolex Learning Center. Frédéric Kaplan est l'auteur de nombreux livres, de plus d'une centaine de publications scientifiques. http://dhlab.epfl.ch
Lorenzo Tomasin (1975), ancien élève de l'Ecole Normale Supérieure de Pisa, est professeur ordinaire en Histoire de la langue italienne et Philologie romane à l'Unil depuis 2012 ; il a été auparavant professeur à l'Université Ca' Foscari de Venise (dont il a été vice-recteur) et à l'Université L. Bocconi de Milan. Son activité de recherche porte sur la mise en valeur des documents médiévaux non-littéraires dans la perspective de leur étude linguistique, et sur l'interface entre linguistique et philologie. Il a publié en édition critique plusieurs textes juridiques et commerciaux, en particulier concernant Venise et sa région. Il a édité une dizaine de volumes, parmi lesquels Il volgare e la legge. Storia linguistica del diritto veneziano (2001), Storia linguistica di Venezia (2010), Italiano. Storia di una parola (2011); il est également l'éditeur, avec G. Antonelli et M. Motolese, de l'ouvrage de référence le plus récent sur l'histoire de la langue italienne : Storia dell'italiano scritto, en trois volumes (2014).
Le séminaire "Pratiques des Humanités digitales"
Organisé dans le cadre du programme de spécialisation en Humanités digitales et ouvert à toute la communauté universitaire, ce séminaire de recherche bimensuel vise à illustrer la richesse et la diversité de ce qui se pratique dans ce domaine sur le campus lausannois. Chaque contribution dévoilera une facette de ce que représentent les Humanités digitales dans les pratiques d'enseignants et de chercheurs ancrés dans des disciplines de Lettres et SHS ou de sciences et technologies de l'information.