CV
Cours
Ressources
Publications
Adresse physique
Bureau 536 (5ème étage)
Bâtiment Olympe de Gouges
8 rue Albert Einstein
75013 Paris
Adresse postale
Case Postale 7031
5 rue Thomas Mann
F-75205 Paris Cedex 13
Email
achille.falaise@cnrs.fr
Achille
Falaise
Docteur en informatique
Ingénieur d'Études
CNRS
Laboratoire de Linguistique Formelle
logiciels
ScienQuest
Plateforme corporale
MultiTag
Service permettant de comparer les sorties de plusieurs analyseurs syntaxiques.
Tokeniser Presto
Tokeniser développé dans le cadre du projet Presto pour le traitement des tokens multi-mots et des mots multi-tokens.
Corpus Cleaner
Service de normalisation (essentiellement typographique) de corpus.
ressources
Corpus de tchat
Corpus du français tchaté
démos
SegDoc
Segmentation de documents XML
Tradoh
Métamoteur de traduction
iMAG
Service de traduction de sites Web
SurviTra
Livre de phrases anglais/français/hindi
Dicorpus
Dictionnaire sur corpus pour le FLE
Scripts & astuces
RAID pour Ubuntu Server
Installation d'Ubuntu Server 20.04, 22.04 et 24.04 avec prise en charge du RAID
Installation de TXM
Installation de TXM sur Ubuntu 18.04 LTS
Installation d'Iramuteq
Installation d'Iramuteq sur Ubuntu 18.04
Dire à Talismane d'ignorer les balises XML
Dire à Talismane d'ignorer les balises XML.
Conversion tableurs cli
Conversion MS Excel <-> Calc <-> CSV en ligne de commande.
Youtube recommended remover
Script GreaseMonkey