Projet CORAL
CORAL : Corpus à l’ère du numérique : enjeux éthiques, pérennisation, mutualisation, valorisation
- Appel UPV 2017
- Participants : Praxiling, Dipralang, Crises
- Durée : 18 mois
- Objectif : Soutenir des actions de pérennisation, mutualisation, exploitation et diffusion des données langagières produites par les laboratoires participants.
- Principales actions menées : (i) Journée d’étude « Corpus oraux et écrits : éthique et pratiques croisées », (ii) Journée de formation « Outils d’exploitation de corpus sur des données multimodales ».
Projet NENUFAR
Nenufar : Nouvelle Édition Numérique de Fac-similés de Référence → Petit Larousse Illustré
- Soutiens : Consortium CAHIER, Consortium CORLI, DGLFLF
- Objectifs : reconstituer l’évolution de dictionnaires français de la première moitié du XXe siècle, en premier lieu le Petit Larousse.
- Numérisation et OCR des millésimes-clés : 1906, 1924, 1936 et 1948 (éditions avant et après refontes),
- Comparaison des textes permettant une détection fine des changements ou des erreurs d’OCR,
- Datation des changements par consultation des éditions intermédiaires
- Intégration dans une base de données unique de toutes les éditions et première analyse des champs,
- Balisage du texte selon les standards TEI,
- Développement de l’interface d’interrogation et publication web.
Projet ANR TALAD
TALAD : Analyse et traitement automatique de discours
- Appel ANR : DEFI 8, axe 2 « Révolution numérique », sous-axe « Création et partage des savoirs » PRCE,
- Participants : AGORA Cergy / ERTIM INALCO Paris / LI Tours / PRAXILING Montpellier / Société RETICULAR Paris,
- Durée : 4 ans, à compter du 1er octobre 2017.
- Objectifs : fournir à l’AD de nouvelles techniques d’analyse avancées inspirées des technologies développées en TAL,
- Objets d’étude : chaînes de référence, entités nommées, nomination.
- Contribution de Praxiling :
- (i) construction d’une organisation formelle des concepts relatifs à la nomination sous forme d’une ontologie,
- (ii) annotation de corpus à l’aide de l’ontologie.