Modélisation de l'acquisition des langues
Vue d'ensemble | Collaborations | Publications | Liens
|
Vue d'ensemble
L'acquisition d'une langue première est un problème d'une formidable complexité. Au croisement de plusieurs disciplines, son étude est le lieu de vives controverses: quel est la part de l'inné et de l'acquis, quels sont les mécanismes et stratégies mis en oeuvre, reposent-ils sur des capacités cognitives générales ou spécifiquement dédiées à l'acquisition, diffèrent-ils en fonction des langues ou des individus, quelles sont les conditions nécessaires au déroulement de l'acquisition, que se passe-t-il si elles ne sont pas satisfaites, et ainsi de suite.
Dans une large mesure, l'étude de l'acquisition s'inscrit dans une tradition d'analyse des données. En particulier, de vastes collections de corpus dits "longitudinaux" sont disponibles, notamment dans le cadre du projet CHILDES (MacWhinney, 2000). Ces corpus sont typiquement constitués de transcriptions d'interactions entre des enfants et leurs parents, échantillonnées à plusieurs moments de leur acquisition de la langue. Ils constituent une source précieuse d'information sur le développement du langage comme sur les particularités du langage adressé aux enfants.
La section d'informatique et de méthodes mathématiques est active dans le domaine du traitement et de l'analyse de ces données. Ses recherches portent en particulier sur:
- l'élaboration d'indices statistiques permettant de quantifier des aspects du développement linguistique tel qu'il est représenté dans des corpus longitudinaux;
- la conception d'algorithmes visant à modéliser des mécanismes d'apprentissage hypothétiques et l'interprétation des résultats de leur application à des données d'acquisition.
Référence:
MacWhinney, Brian. (2000). The CHILDES Project: Tools for Analyzing Talk. Mahwah, NJ: Lawrence Erlbaum Associates.
Collaborations
- Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition, dirigé par le professeur Wolfgang Dressler, Académie autrichienne des sciences.
- Docteure Marianne Kilani-Schoch, Ecole de français langue étrangère, Université de Lausanne.
- Professeur Steven Gillis, Center for Dutch Language and Speech, Université d'Anvers.
Publications
- Xanthos, A., Gillis, S. (soumis pour publication), "Quantifying the development of morphological diversity", First Language.
- Xanthos, A., Laaha, S., Gillis, S., Stephany, U., Aksu-Koç, A., Christofidou, A., Gagarina, N., Hrzica, G., Ketrez, F.N., Kilani-Schoch, M., Korecky-Kröll, K., Kovačević, M., Laalo, K., Palmović, M., Pfeiler, B., Voeikova, M.D., Dressler, W.U. (à paraître), "On the role of morphological richness in the early development of noun and verb inflection", First Language.
- Xanthos A. (2007). "General results", in S. Laaha et S. Gillis (Eds), Typological perspectives on the acquisition of noun and verb morphology, Antwerp Papers in Linguistics, 112, pp.59-65. (PDF)
- Xanthos A. et Laaha S. (2007). "Method", in S. Laaha et S. Gillis (Eds), Typological perspectives on the acquisition of noun and verb morphology, Antwerp Papers in Linguistics, 112, pp.11-20. (PDF)
- Xanthos A. (2005). "Evaluation du savoir acquis en langue maternelle: un exemple en syntaxe", in M. Rispail (dir.), Langues maternelles : contacts, variations et enseignement, Le cas de la langue amazighe, Paris, L'Harmattan.
- Xanthos A. (2004). "Combining Utterance-Boundary and Predictability Approaches to Speech Segmentation", Proceedings of the Psycho-computational Models of Language Acquisition Workshop at COLING 2004, pp. 93-100. (PDF)
- Xanthos A. (2004), "An Incremental Implementation of the Utterance-Boundary Approach to Speech Segmentation", Proceedings of Computational Linguistics in the Netherlands 2003 (CLIN 2003), pp.171-180. (PDF)
Liens
Le projet CHILDES constitue la principale base de données publiquement accessible dans le domaine de l'acquisition. Outre de nombreux corpus longitudinaux dans diverses langues, le site du projet met à disposition du public une documentation détaillée sur le standard de codage des corpus (CHAT), ainsi que CLAN, un programme gratuit pour l'annotation et l'analyse des corpus encodés en format CHAT.


