Adresse physique
Adresse postale
Centres d'intérêt
La Linguistique de corpus et le Traitement automatique des langues (TALN), et plus particulièrement:
-
Traitement de la langue
- collecte, traitement, et analyse de corpus
- écrit non-standard
- langage en interaction
- traduction, didactique des langues, données multilingues, travail sur des langues variées
-
Conception et mise en œuvre de méthodologies et développement d'outils
- pour la recherche en linguistique de corpus
- pour la recherche d'information
- pour la didactique des langues (corpus pour l'enseignement)
- pour l'aide à la lecture, à la rédaction et au dialogue en langue seconde
- pour la traduction
Compétences
- Compétences métier
- Méthodologie en linguistique de corpus
- Éthique de la recherche et droit des données
- Analyse automatique de données textuelles et orales
- Conception d'outils pour les utilisateurs finaux (linguistes, enseignants et apprenants en langue, traducteurs...)
- Statistiques pour les corpus
- Informatique métier
- Logiciels de linguistique de corpus: TXM, CWB (CQL), Grew, SPPAS; logiciels de traitement du son et de la vidéo
- Outils d'annotation automatique et manuelle: Stanza, spaCy, Talismane, TreeTagger
- XML (TEI, TMX), CoNLL, CHAT, TextGrid
- Bibliothèques d'expérimentation psycholinguistique en ligne: jsPsych, Ibex
- Informatique générale
- Programmation: Perl, PHP, Python, JavaScript, Java, Shell
- Génie logiciel: architectures 3 tiers, MVC, SOA/REST
- Opérationnel: serveur Linux (Ubuntu, Debian), Proxmox, Web (Apache/Nginx/Tomcat, MariaDB/SQLite), NextCloud
- Bases de données relationnelles: MariaDB, SQL
- Git: Compte GitLab, Contributions KODA CNRS
Diplômes
2009 | ![]() |
PhD |
Doctorat en Informatique (Grenoble-1)
Qualification sections CNU 7 (Sciences du langage) et 27 (Informatique) |
2004 | ![]() |
M2R | Master Information, Cognition, Apprentissage (ICA), spécialité Sciences Cognitives (INPG) |
2003 | ![]() |
M2P | DESS Double Compétence Informatique et Sciences sociales (DCISS) (Grenoble-2) |
2002 | ![]() |
M1 | Maîtrise Sciences du Langage, spécialité Industrie de la Langue (Grenoble-3) |
2001 | ![]() |
L3 | Licence Sciences du Langage, mention Traitement automatique des langues (Nantes) |
2000 | ![]() |
L2 | DEUG Lettres modernes (Nantes) |
Parcours professionnel
2016 2017 |
![]() ![]() ![]() |
Corpus complexes, dont Corpus de français préclassique et classique |
2014 2016 |
![]() ![]() |
Corpus de français préclassique et classique
Ingénieur de recherche, ICAR, ENS de Lyon
|
2013 |
![]() |
Base de données optimisée pour l'exploration de grands corpus
Ingénieur de recherche, LIDILEM
|
2012 2013 |
![]() ![]() |
Enseignement et recherche en informatique |
2012 |
![]() |
Corpus pour l'enseignement et l'aide à la rédaction
Ingénieur de recherche, LIDILEM
Adaptation de la plateforme ScienQuest pour l'enseignement et l'aide à la rédaction en langues étrangères.
|
2011 2012 |
![]() ![]() |
Mémoires de traduction et sites Web
Extension, opérationalisation et valorisation de plateformes linguistiques de gestion de mémoires de traduction et d'accès au Web multilingue.
|
2011 |
![]() ![]() |
Plateforme d'exploitation pour corpus en 5 langues
Ingénieur de recherche, LIDILEM et université de Cologne
Intégration de 5 grands corpus (200M+ mots) en allemand, anglais, français, espagnol et russe à la plateforme ScienQuest, et intégration de la plateforme avec un outil de lexicométrie.
|
2009 2010 |
![]() ![]() |
Analyse de textes pour la recherche d'information multilingue
Développement et opérationalisation de composant linguiciels d'annotation lexico-sémantique pour la recherche d'information interlingue.
|
2008 2009 |
![]() |
Exploitation de corpus arborés par des utilisateurs linguistes
Ingénieur d'études, LIDILEM
Prédoc.
|
2005 2008 |
![]() ![]() ![]() |
Assistance au dialogue en langue seconde
Sous la direction de Christian Boitet et Hervé Blanchon.
|
2004 |
![]() |
Tchat multilingue
Étude du tchat. Collecte de corpus, développement d'un tchat multilingue.
|
2003 |
![]() |
Génération de devis multilingues
Stagiaire, Hyper Horizon
Développement d'une application web d'édition de devis multilingues.
|
2003 |
![]() |
Assembleur et graphes algorithmiques
Désassemblage et présentation des blocs de code sous forme de graphes.
|
2002 |
![]() ![]() |
Projet ANR Prises de notes en langue étrangère
Vacataire, LIDILEM et université de Provence
Interface web pour l'étude d'un corpus multilingue par des linguistes.
|
2001 |
![]() |
Synthèse vocale des nombres
Stage de M1. Analyse de la prosodie des nombres pour les serveurs vocaux.
|
Activités académiques
- Membre du Conseil de laboratoire du Laboratoire de Linguistique Formelle
- Membre du CoPil du Consortium CORpus, Langues et Interactions, et du Centre-K CLARIN CMC
- Formateur régulier en linguistique de corpus, éthique de la recherche, RGPD, sécurité informatique