CV
Enseignement
Ressources
Publications
Adresse physique
Bureau 536 (5ème étage)
Bâtiment Olympe de Gouges
8 rue Albert Einstein
75013 Paris
Adresse postale
Case Postale 7031
5 rue Thomas Mann
F-75205 Paris Cedex 13
Email
achille.falaise@cnrs.fr
Achille
Falaise
Docteur en informatique
Ingénieur d'Études
CNRS
Laboratoire de Linguistique Formelle
logiciels
ScienQuest
(2009-2025)
Plateforme de consultation de corpus arborés
MultiTag
(2021)
Service permettant de comparer les sorties de plusieurs analyseurs syntaxiques.
Tokeniser Presto
(2018-2022)
Tokeniser développé dans le cadre du projet Presto pour le traitement des tokens multi-mots et des mots multi-tokens.
Corpus Cleaner
(2023)
Service de normalisation (essentiellement typographique) de corpus.
ressources
Corpus de tchat
(2004)
Corpus du français tchaté
démos
SegDoc
(2012)
Segmentation de documents XML
Tradoh
(2012)
Métamoteur de traduction
iMAG
(2012)
Service de traduction de sites Web
SurviTra
(2009)
Livre de phrases anglais/français/hindi
Dicorpus
(2016-2022)
Dictionnaire sur corpus pour le FLE
Scripts & astuces
RAID pour Ubuntu Server
Installation d'Ubuntu Server 20.04, 22.04 et 24.04 avec prise en charge du RAID
Installation de TXM
Installation de TXM sur Ubuntu 18.04 LTS
Installation d'Iramuteq
Installation d'Iramuteq sur Ubuntu 18.04
Dire à Talismane d'ignorer les balises XML
Dire à Talismane d'ignorer les balises XML.
Conversion tableurs cli
Conversion MS Excel <-> Calc <-> CSV en ligne de commande.
Youtube recommended remover
Script GreaseMonkey