Traitement informatique des corpus textuels
- Formule: 2h, semestre d'automne ou annuel (selon plan d'étude)
- Enseignant: Aris Xanthos
- Prérequis: aucun
Objectif
La vocation de cet enseignement est de sensibiliser les étudiants aux enjeux du traitement informatique des corpus textuels, et de leur permettre d'acquérir les savoir-faire nécessaires à la constitution et à la manipulation de tels corpus. Destiné en particulier aux étudiants en IMM et linguistique (BA), ce cours est aussi offert à tous les étudiants de la Faculté des lettres désireux d'exploiter, avec l'aide d'outils informatiques, des données textuelles dans le cadre de leurs recherches.
Contenu
Acquisition et constitution de corpus textuels (planification, échantillonnage, représentativité, saisie et encodage); fonctions de recherche (recherche simple et booléenne, expressions régulières, concordances, collocations); annotation de corpus (niveaux d'annotation, outils informatiques, formats TEI, CHAT, etc.); traitements quantitatifs (décomptes de fréquences, tables de contingence, analyse des correspondances).
Public
BA propédeutique, BA 2ème partie, programme à options, DCII
Références
- Atkins, S., Clear, J., Ostler, N. (1992). Corpus Design Criteria. Literary and Linguistic Computing, 7(1), pp.1-16.
- Biber, D. (1993). Representativeness in Corpus Design. Literary and Linguistic Computing, 8(4), pp.243-257.
- Biber, D., Conrad, S. & Reppen, R. (1998). Corpus linguistics. Investigating language structure and use. Cambridge: Cambridge University Press.
- Crowdy, S. (1993). Spoken Corpus Design. Literary and Linguistic Computing, 8(4), pp.259-265.
- Edwards, J.A. (1992). Design principles in the transcription of spoken discourse. In J. Svartik (Ed.), Directions in Corpus Linguistics. Berlin: Mouton de Gruyter, pp.129-144.
- Habert, B. (2000). Des corpus représentatifs: de quoi, pour quoi, comment? In M. Bilger (Ed.), Linguistique sur corpus: études et réflexions. Perpignan: Presses universitaires de Perpignan, pp.11-58.
- Hockey, S. & Walker, D. (1993). Developing Effective Resource for Research on Texts: Collecting Texts, Tagging Texts, Cataloguing Texts, Using Texts, and Putting Texts in Context. Literary and Linguistic Computing, 8(4), pp.235-242.
- Leech, G. (1993). Corpus Annotation Schemes. Literary and Linguistic Computing, 8(4), pp.275-281.
- McEnery, T. & Wilson, A. (1996). Corpus Linguistics. Edinburgh: Edinburgh University Press.
- Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.


