Vous êtes ici: UNIL > Section d'informatique et méthodes mathématiques > Enseignement > Programme des cours > Traitement informatique des corpus textuels

Traitement informatique des corpus textuels

  • Formule: 2h, semestre d'automne ou annuel (selon plan d'étude)
  • Enseignant: Aris Xanthos
  • Prérequis: aucun

Objectif
La vocation de cet enseignement est de sensibiliser les étudiants aux enjeux du traitement informatique des corpus textuels, et de leur permettre d'acquérir les savoir-faire nécessaires à la constitution et à la manipulation de tels corpus. Destiné en particulier aux étudiants en IMM et linguistique (BA), ce cours est aussi offert à tous les étudiants de la Faculté des lettres désireux d'exploiter, avec l'aide d'outils informatiques, des données textuelles dans le cadre de leurs recherches.

Contenu
Acquisition et constitution de corpus textuels (planification, échantillonnage, représentativité, saisie et encodage); fonctions de recherche (recherche simple et booléenne, expressions régulières, concordances, collocations); annotation de corpus (niveaux d'annotation, outils informatiques, formats TEI, CHAT, etc.); traitements quantitatifs (décomptes de fréquences, tables de contingence, analyse des correspondances).

Public
BA propédeutique, BA 2ème partie, programme à options, DCII

Références
- Atkins, S., Clear, J., Ostler, N. (1992). Corpus Design Criteria. Literary and Linguistic Computing, 7(1), pp.1-16.
- Biber, D. (1993). Representativeness in Corpus Design. Literary and Linguistic Computing, 8(4), pp.243-257.
- Biber, D., Conrad, S. & Reppen, R. (1998). Corpus linguistics. Investigating language structure and use. Cambridge: Cambridge University Press.
- Crowdy, S. (1993). Spoken Corpus Design. Literary and Linguistic Computing, 8(4), pp.259-265.
- Edwards, J.A. (1992). Design principles in the transcription of spoken discourse. In J. Svartik (Ed.), Directions in Corpus Linguistics. Berlin: Mouton de Gruyter, pp.129-144.
- Habert, B. (2000). Des corpus représentatifs: de quoi, pour quoi, comment? In M. Bilger (Ed.), Linguistique sur corpus: études et réflexions. Perpignan: Presses universitaires de Perpignan, pp.11-58.
- Hockey, S. & Walker, D. (1993). Developing Effective Resource for Research on Texts: Collecting Texts, Tagging Texts, Cataloguing Texts, Using Texts, and Putting Texts in Context. Literary and Linguistic Computing, 8(4), pp.235-242.
- Leech, G. (1993). Corpus Annotation Schemes. Literary and Linguistic Computing, 8(4), pp.275-281.
- McEnery, T. & Wilson, A. (1996). Corpus Linguistics. Edinburgh: Edinburgh University Press.
- Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.

TOP ^


Recherche:
 dans ce site:
   
   
   
 Rechercher
Annuaires      Site map

Où et quand

Semestre d'automne ou annuel (selon plan d'étude)

Anthropole 4120

Lien Moodle

Automne

me 10-12 (groupe 1)

je 13-15 (groupe 2)

Printemps

me 10-12 (tous)


Anthropole - CH-1015 Lausanne  - Suisse  -  Tél. +41 21 692 29 10  -  Fax  +41 21 692 29 15