Xanthos Aris

Xanthos Aris

Coordonnées Curriculum Recherches Enseignements Publications

Axes de recherche

Analyse de corpus d'acquisition
Encodage et analyse de corpus d'acquisition du français (dans le cadre du Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition, dirigé par le Prof. Wolfgang Dressler de l'Académie Autrichienne des Sciences (ÖAW) et impliquant une quarantaine de chercheurs en Europe et ailleurs). Participation à plusieurs projets dans ce cadre (notamment sur l'acquisition de l'adjectif et les phénomènes de "fine-tuning"). Développement d'une méthode visant à quantifier la diversité des formes flexionnelles présentes dans des corpus, d'une façon qui se prête à une comparaison translinguistique et neutralise, dans la mesure du possible, les effets de taille de l'échantillon (Xanthos et Laaha, 2007; Xanthos et Gillis, à paraître; Xanthos et al., à paraître).

Extraction automatique de connaissances linguistiques
Développement de méthodes pour l'extraction automatique de connaissances linguistiques, en particulier sur la base du principe de la longueur de description minimale (minimum description length, MDL). Analyse morphologique non-supervisée des langues du type "introflexionnel" comme l'arabe ou l'hébreu (Xanthos, 2008). Analyse phonologique non-supervisée (algorithme de Sukhotin, classification spectrale, HMM), cf. Goldsmith et Xanthos (2009).

Segmentation textuelle
Méthodes de segmentation (non-supervisée) du texte en mots, dans une perspective de modélisation de l'acquisition (Xanthos, 2004a, 2004b) et d'analyse des données textuelles (Bavaud et Xanthos, 2002). Développement d'une nouvelle méthode d'identification automatique des séparateurs basée sur le principe du MDL (Xanthos et Bavaud, soumis pour publication).

Interactivité et modularité en analyse des données textuelles
Réflexion sur les conditions d'une réelle interactivité et modularité dans le génie logiciel appliquée à l'analyse des données textuelles (ADT) - dans la perspective de rendre ces méthodes aussi accessibles que possible aux chercheurs de Lettres et sciences humaines et de favoriser ainsi l'innovation dans ce domaine. Développement d'une plateforme logicielle interactive et modulaire pour l'ADT multilingue

 

Collaborations et réseaux

Intrafacultaires

Ecole de français langue étrangère (EFLE)
Etude des premières phases de l'acquisition de la morphologie dans un corpus français de 2 enfants entre 18 mois et 3 ans
Contact : Dr. Marianne Kilani-Schoch
Suisse

Section d'IMM
Recherche et développement de méthodes en statistique et informatique textuelle, en particulier dans le domaine des méthodes de segmentation.
Contact : Prof. François Bavaud
Suisse

Interuniversitaires

Université de Chicago
Projet Linguistica
Projet open-source en linguistique computationnelle, dont l'objectif est de construire automatiquement une analyse morphologique d'une langue inconnue sur la base d'un échantillon de texte brut, en utilisant les outils de la théorie de l'information pour représenter explicitement la structure linguistique
http://linguistica.uchicago.edu
Contact : Prof. John Goldsmith
U.S.A.

Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition
Projet international sur les premières étapes de l'acquisition de la morphologie dans une perspective interlinguistique et typologique
http://www.oeaw.ac.at/ling/kimo/index_prepro.html
Contact : Prof. W.U.Dressler, Dr. Sabine Laaha
Autriche

Université d'Anvers, CNTS - Centrum voor Nederlandse Taal en Spraak
Collaboration au développement d'un outil informatique pour l'estimation robuste de la diversité flexionnelle sur la base de transcriptions en format CHAT (Coded Human Analysis of Transcripts)
http://www.cnts.ua.ac.be
Contact : Prof. S. Gillis
Belgique


Retour

TOP ^

Suivez nous:        
Partagez: