Adresse physique

Bureau 536 (5ème étage)
Bâtiment Olympe de Gouges
8 rue Albert Einstein
75013 Paris

Adresse postale

Case Postale 7031
5 rue Thomas Mann
F-75205 Paris Cedex 13

Email

achille.falaise@cnrs.fr

Achille Falaise

Docteur en informatique
Ingénieur d'Études CNRS
Laboratoire de Linguistique Formelle

 

Centres d'intérêt

Le Traitement automatique des langues (TALN), et plus particulièrement:
  • Traitement de la langue écrite (création, analyse et exploitation de corpus):
    • écrit médié par la machine (tchat, sites Web)
    • écrit ancien (français classique et pré-classique, latin classique)
    • écrit multilingue (corpus parallèles, traduction automatique, langues européennes et asiatiques)
    • transcriptions de dialogues oraux
  • Environnements et outils de TALN pour les humains:
    • pour la recherche en linguistique de corpus
    • pour la recherche d'information
    • pour la didactique des langues (corpus pour l'enseignement)
    • pour l'aide à la lecture, à la rédaction et au dialogue en langue seconde
    • pour la traduction
  • Linguistique de corpus, en synchronie et en diachronie

Compétences

Métier
Analyse automatique de textes multilingues (tokenisation, lemmatisation, analyse syntaxique, sémantique...): Stanza, spaCy, Talismane, TreeTagger
Conception, amélioration et exploitation de ressources par des utilisateurs finaux (linguistes, apprenants, traducteurs...): devéloppement Web
Dev
Python, PHP, HTML/CSS/JavaScript (JQuery, AlpineJS), Java/Kotlin, Perl, Shell/Bash
Architecture: 3 tiers, MVC, SOA/REST
Git: Compte GitLab, Contributions KODA CNRS
Data
XML (TEI, TMX), CoNLL/CoNLL-U, JSON, YAML, Unicode
SQL, CQL
Ops
Serveur Linux (Ubuntu, Debian), Proxmox, Web (Apache/Nginx/Tomcat, MariaDB/SQLite), NextCloud

Diplômes

2009 PhD Doctorat en Informatique (Grenoble-1)
2004 M2R Master Information, Cognition, Apprentissage (ICA), spécialité Sciences Cognitives (INPG)
2003 M2P DESS Informatique Double Compétence (IDC/DCISS) (Grenoble-2)
2002 M1 Maîtrise Sciences du Langage, spécialité Industrie de la Langue (Grenoble-3)
2001 L3 Licence Sciences du Langage, mention Traitement automatique des langues (Nantes)
2000 L2 DEUG Lettres modernes (Nantes)

Parcours professionnel

2016-2017

Corpus complexes, dont Corpus de français préclassique et classique

Ingénieur de recherche, ICAR, CNRS, labex ASLAN
2014-2016

Corpus de français préclassique et classique

Ingénieur de recherche, ICAR, ENS de Lyon
2013

Base de données optimisée pour l'exploration de grands corpus

Ingénieur de recherche, LIDILEM
2012-2013

Enseignement et recherche en informatique

2012

Corpus pour l'enseignement et l'aide à la rédaction

Ingénieur de recherche, LIDILEM
Adaptation de la plateforme ScienQuest pour l'enseignement et l'aide à la rédaction en langues étrangères.
2011-2012

Mémoires de traduction et sites Web

Ingénieur de recherche, LIG-GETALP et Floralis
Extension, opérationalisation et valorisation de plateformes linguistiques de gestion de mémoires de traduction et d'accès au Web multilingue.
2011

Plateforme d'exploitation pour corpus en 5 langues

Ingénieur de recherche, LIDILEM et université de Cologne
Intégration de 5 grands corpus (200M+ mots) en allemand, anglais, français, espagnol et russe à la plateforme ScienQuest, et intégration de la plateforme avec un outil de lexicométrie.
2009-2010

Analyse de textes pour la recherche d'information multilingue

Ingénieur de recherche, LIG-GETALP et Grenoble-1
Développement et opérationalisation de composant linguiciels d'annotation lexico-sémantique pour la recherche d'information interlingue.
2008-2009

Exploitation de corpus arborés par des utilisateurs linguistes

Ingénieur d'études, LIDILEM
Prédoc.
2005-2008

Assistance au dialogue en langue seconde

Thèse de doctorat, LIG-GETALP, Grenoble-1 et Prosodie SA
Sous la direction de Christian Boitet et Hervé Blanchon.
2004

Tchat multilingue

Stagiaire, CLIPS-GETA
Étude du tchat. Collecte de corpus, développement d'un tchat multilingue.
2003

Génération de devis multilingues

Stagiaire, Hyper Horizon
Développement d'une application web d'édition de devis multilingues.
2003

Assembleur et graphes algorithmiques

Stagiaire, CEA-LETI
Désassemblage et présentation des blocs de code sous forme de graphes.
2002

Projet ANR Prises de notes en langue étrangère

Interface web pour l'étude d'un corpus multilingue par des linguistes.
2001

Synthèse vocale des nombres

Stagiaire, CLIPS-GEOD
Stage de M1. Analyse de la prosodie des nombres pour les serveurs vocaux.

Langues

  • Français (langue maternelle)
  • Anglais (~B2)
  • Allemand (~A2)
  • Japonais (~A1)
  • Latin

Activités académiques