Aller à: contenu | haut | bas | recherche
 
 
Vous êtes iciUNIL > Section des sciences du langage et de l'information > Collaborateurs > Xanthos Aris

Xanthos Aris

Xanthos Aris

Coordonnées Curriculum Recherches Enseignements Publications

Axes de recherche

Analyse de corpus d'acquisition
Encodage et analyse de corpus d'acquisition du français (dans le cadre du Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition, dirigé par le Prof. Wolfgang Dressler de l'Académie Autrichienne des Sciences (ÖAW) et impliquant une quarantaine de chercheurs en Europe et ailleurs). Participation à plusieurs projets dans ce cadre (notamment sur l'acquisition de l'adjectif et les phénomènes de "fine-tuning"). Développement d'une méthode visant à quantifier la diversité des formes flexionnelles présentes dans des corpus, d'une façon qui se prête à une comparaison translinguistique et neutralise, dans la mesure du possible, les effets de taille de l'échantillon (Xanthos et Laaha, 2007; Xanthos et Gillis, à paraître; Xanthos et al., à paraître).

Extraction automatique de connaissances linguistiques
Développement de méthodes pour l'extraction automatique de connaissances linguistiques, en particulier sur la base du principe de la longueur de description minimale (minimum description length, MDL). Analyse morphologique non-supervisée des langues du type "introflexionnel" comme l'arabe ou l'hébreu (Xanthos, 2008). Analyse phonologique non-supervisée (algorithme de Sukhotin, classification spectrale, HMM), cf. Goldsmith et Xanthos (2009).

Segmentation textuelle
Méthodes de segmentation (non-supervisée) du texte en mots, dans une perspective de modélisation de l'acquisition (Xanthos, 2004a, 2004b) et d'analyse des données textuelles (Bavaud et Xanthos, 2002). Développement d'une nouvelle méthode d'identification automatique des séparateurs basée sur le principe du MDL (Xanthos et Bavaud, soumis pour publication).

Linguistique descriptive
Approches structurales de la description des langues. Perspectives fonctionnalistes et formalistes. Utilisation de méthodes statistiques pour l'apprentissage automatique de connaissances linguistiques

Théorie de l'Information
Fondements et développements ultérieurs. Applications au traitement des langues naturelles. Théorie de la complexité et description linguistique

Modèles connexionnistes
Application de diverses architectures connexionnistes au traitement du langage

Interactivité et modularité en analyse des données textuelles
Réflexion sur les conditions d'une réelle interactivité et modularité dans le génie logiciel appliquée à l'analyse des données textuelles (ADT) - dans la perspective de rendre ces méthodes aussi accessibles que possible aux chercheurs de Lettres et sciences humaines et de favoriser ainsi l'innovation dans ce domaine. Développement d'une plateforme logicielle interactive et modulaire pour l'ADT multilingue

Psycholinguistique computationnelle
Modélisation statistique et neurocomputationnelle de l'acquisition

 

Collaborations

Intrafacultaires

Ecole de français langue étrangère (EFLE)
Etude des premières phases de l'acquisition de la morphologie dans un corpus français de 2 enfants entre 18 mois et 3 ans
Suisse
Contact : Dr. Marianne Kilani-Schoch

Section d'IMM
Recherche et développement de méthodes en statistique et informatique textuelle, en particulier dans le domaine des méthodes de segmentation.
Suisse
Contact : Prof. François Bavaud

Interuniversitaires

Université de Chicago
Projet Linguistica
Projet open-source en linguistique computationnelle, dont l'objectif est de construire automatiquement une analyse morphologique d'une langue inconnue sur la base d'un échantillon de texte brut, en utilisant les outils de la théorie de l'information pour représenter explicitement la structure linguistique
U.S.A.
Contact : Prof. John Goldsmith

Crosslinguistic Project on Pre- and Protomorphology in Language Acquisition
Projet international sur les premières étapes de l'acquisition de la morphologie dans une perspective interlinguistique et typologique
Autriche
Contact : Prof. W.U.Dressler, Dr. Sabine Laaha

Université d'Anvers, CNTS - Centrum voor Nederlandse Taal en Spraak
Collaboration au développement d'un outil informatique pour l'estimation robuste de la diversité flexionnelle sur la base de transcriptions en format CHAT (Coded Human Analysis of Transcripts)
Belgique
Contact : Prof. S. Gillis


Retour

TOP ^

Recherche:
 Go
 
rss/atom
youtube facebook twitter instagram 
CH-1015 Lausanne  - Suisse  -  Tél. +41 21 692 29 73  -  Fax +41 21 692 29 15
Swiss University