Présentation
La formation Textes et éditions numériques propose d'aborder les humanités numériques sous l'angle de l'étude des textes. Les participants pourront acquérir des compétences concernant l'encodage, le traitement des textes et les pratiques numériques d'édition, applicables à plusieurs domaines de recherche (philologie, linguistique, littérature, histoire, philosophie, etc.).
Après une introduction aux humanités numériques et aux éditions numériques, la plus grande partie de la formation sera consacrée à l'encodage. L'encodage est une pratique répandue dans plusieurs disciplines, qui consiste à étiqueter un texte : les étiquettes forment une couche d'information qui va s'ajouter au texte et qui peut être utilisée ensuite pour la visualisation et pour l'analyse. La Text Encoding Initiative (TEI) fournit actuellement un vocabulaire d'étiquettes standardisées utilisé par des centaines de projets. Pendant la formation, ce vocabulaire sera présenté et ses principes seront mis en pratique à travers des exercices. La possibilité de visualiser les données produites sous forme de textes et de cartes sera aussi brièvement abordée.
Une partie plus brève de la formation sera dédiée à la comparaison automatique des textes (collation) de manière théorique comme pratique.
À la fin de la formation, du temps sera réservé aux questions et au dialogue entre les participants et les formateurs sur les sujets traités. Le cas échéant, la réutilisation des méthodes et des outils acquis lors de cette formation dans les projets de recherches des participants sera aussi abordée.
À qui s'adresse cette formation ? Aux philologues, aux linguistes, aux historiens, aux philosophes, aux littéraires, aux passionné-e-s de la critique textuelle et génétique, aux amant-e-s des manuscrits, comme à tous ceux qui analysent les textes, lisent les sources, créent des éditions numériques, et enfin à tous les curieux et curieuses.
Prérequis : aucune compétence techniques est nécessaire pour participer à la formation ; une connaissance correcte de la langue anglaise est requise, la majorité des exercices étant accompagnés d’instructions en anglais.
Programme :
Jour 1
9h00-10h30
Présentation, logistique
Introduction aux humanités numériques et aux éditions numériques
11h00-12h30
TEI (1ère partie): encodage de base
14h00-15h30
TEI (2ème partie): métadonnées dans le teiHeader
16h00-17h30
TEI (3ème partie): entités nommées et cartographie numérique
Jour 2
9h00-10h30
TEI (4ème partie): TEI Guidelines, schémas et publication
XPATH
11h00-12h30
Jupyter notebook
Théorie et pratique de la collation automatique (1ère partie): concepts et traitements
14h00-15h30
Théorie et pratique de la collation automatique (2ème partie): formats et résultats
16h00-17h30
Questions et conclusions
Formateurs :
- Simon Gabay (Université de Neuchâtel)
- José Luis Losada Palenzuela (University of Wroclaw – Université de Genève)
- Elena Spadini (Université de Lausanne)
Les trois formateurs seront présent-e-s tout le temps pour aider les participants dans les exercices pratiques de tous les cours.