Adresse physique
Adresse postale
Achille Falaise
Docteur en informatique
Ingénieur d'Études CNRS
Centres d'intérêt
Le Traitement automatique des langues (TALN), et plus particulièrement:
-
Traitement de la langue écrite (création, analyse et exploitation de corpus):
- écrit médié par la machine (tchat, sites Web)
- écrit ancien (français classique et pré-classique, latin classique)
- écrit multilingue (corpus parallèles, traduction automatique, langues européennes et asiatiques)
- transcriptions de dialogues oraux
-
Environnements et outils de TALN pour les humains:
- pour la recherche en linguistique de corpus
- pour la recherche d'information
- pour la didactique des langues (corpus pour l'enseignement)
- pour l'aide à la lecture, à la rédaction et au dialogue en langue seconde
- pour la traduction
- Linguistique de corpus, en synchronie et en diachronie
Compétences
- Métier
- Analyse automatique de textes multilingues (tokenisation, lemmatisation, analyse syntaxique, sémantique...): Stanza, spaCy, Talismane, TreeTagger
- Conception, amélioration et exploitation de ressources par des utilisateurs finaux (linguistes, apprenants, traducteurs...): devéloppement Web
- Dev
- Python, PHP, HTML/CSS/JavaScript (JQuery, AlpineJS), Java/Kotlin, Perl, Shell/Bash
- Architecture: 3 tiers, MVC, SOA/REST
- Git: Compte GitLab, Contributions KODA CNRS
- Data
- XML (TEI, TMX), CoNLL/CoNLL-U, JSON, YAML, Unicode
- SQL, CQL
- Ops
- Serveur Linux (Ubuntu, Debian), Proxmox, Web (Apache/Nginx/Tomcat, MariaDB/SQLite), NextCloud
Diplômes
2009 | PhD | Doctorat en Informatique (Grenoble-1) | |
2004 | M2R | Master Information, Cognition, Apprentissage (ICA), spécialité Sciences Cognitives (INPG) | |
2003 | M2P | DESS Informatique Double Compétence (IDC/DCISS) (Grenoble-2) | |
2002 | M1 | Maîtrise Sciences du Langage, spécialité Industrie de la Langue (Grenoble-3) | |
2001 | L3 | Licence Sciences du Langage, mention Traitement automatique des langues (Nantes) | |
2000 | L2 | DEUG Lettres modernes (Nantes) |
Parcours professionnel
2016-2017 |
Corpus complexes, dont Corpus de français préclassique et classique |
|
2014-2016 |
Corpus de français préclassique et classique
Ingénieur de recherche, ICAR, ENS de Lyon
|
|
2013 |
Base de données optimisée pour l'exploration de grands corpus
Ingénieur de recherche, LIDILEM
|
|
2012-2013 |
Enseignement et recherche en informatique |
|
2012 |
Corpus pour l'enseignement et l'aide à la rédaction
Ingénieur de recherche, LIDILEM
Adaptation de la plateforme ScienQuest pour l'enseignement et l'aide à la rédaction en langues étrangères.
|
|
2011-2012 |
Mémoires de traduction et sites Web
Extension, opérationalisation et valorisation de plateformes linguistiques de gestion de mémoires de traduction et d'accès au Web multilingue.
|
|
2011 |
Plateforme d'exploitation pour corpus en 5 langues
Ingénieur de recherche, LIDILEM et université de Cologne
Intégration de 5 grands corpus (200M+ mots) en allemand, anglais, français, espagnol et russe à la plateforme ScienQuest, et intégration de la plateforme avec un outil de lexicométrie.
|
|
2009-2010 |
Analyse de textes pour la recherche d'information multilingue
Développement et opérationalisation de composant linguiciels d'annotation lexico-sémantique pour la recherche d'information interlingue.
|
|
2008-2009 |
Exploitation de corpus arborés par des utilisateurs linguistes
Ingénieur d'études, LIDILEM
Prédoc.
|
|
2005-2008 |
Assistance au dialogue en langue seconde
Sous la direction de Christian Boitet et Hervé Blanchon.
|
|
2004 |
Tchat multilingue
Étude du tchat. Collecte de corpus, développement d'un tchat multilingue.
|
|
2003 |
Génération de devis multilingues
Stagiaire, Hyper Horizon
Développement d'une application web d'édition de devis multilingues.
|
|
2003 |
Assembleur et graphes algorithmiques
Désassemblage et présentation des blocs de code sous forme de graphes.
|
|
2002 |
Projet ANR Prises de notes en langue étrangère
Vacataire, LIDILEM et université de Provence
Interface web pour l'étude d'un corpus multilingue par des linguistes.
|
|
2001 |
Synthèse vocale des nombres
Stage de M1. Analyse de la prosodie des nombres pour les serveurs vocaux.
|
Activités académiques
- Membre actif du Consortium CORpus, Langues et Interactions.
- Formateur linguistique de corpus, éthique de la recherche, RGPD, sécurité informatique