Atelier Approches numériques des langues non standardisées, Neuchâtel, 2023-09-12
Données
Outils
À télécharger
- DownThemAll
- Sublime Text
- LibreOffice
- TXM (optionnel) (IHRIM, ENS Lyon)
En ligne
- Échantillons des 3 corpus ci-dessous, pour les gens qui n'ont pas envie de télécharger 1Go
- Outil de formatage (LLF - CNRS - Univ Paris Cité)
- Parsing avec TreeTagger (AnaText, LIDILEM - Univ Grenoble)
- Parsing avec Spacy (LLF - CNRS - Univ Paris Cité)
Pense-bête
DownThemAll
Paramétrage
- Clic->Préférences
- Onglet General − When a file exists => Overwrite
- Onglet Network − Concurrent downloads => 1
Sublime Text
Regex pour l'extraction: