Partenaires



Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Equipes de recherche > STRUCTURE TRANSVERSALE : Linguistique outillée

Projets en cours

15 septembre 2017

Projet CORAL

CORAL : Corpus à l’ère du numérique : enjeux éthiques, pérennisation, mutualisation, valorisation

  • Appel UPV 2017
    • Participants : Praxiling, Dipralang, Crises
    • Durée : 18 mois
  • Objectif : Soutenir des actions de pérennisation, mutualisation, exploitation et diffusion des données langagières produites par les laboratoires participants.
  • Principales actions menées : (i) Journée d’étude « Corpus oraux et écrits : éthique et pratiques croisées », (ii) Journée de formation « Outils d’exploitation de corpus sur des données multimodales ».

Projet NENUFAR

Nenufar : Nouvelle Édition Numérique de Fac-similés de Référence → Petit Larousse Illustré

  • Soutiens : Consortium CAHIER, Consortium CORLI, DGLFLF
  • Objectifs : reconstituer l’évolution de dictionnaires français de la première moitié du XXe siècle, en premier lieu le Petit Larousse.
    • Numérisation et OCR des millésimes-clés : 1906, 1924, 1936 et 1948 (éditions avant et après refontes),
    • Comparaison des textes permettant une détection fine des changements ou des erreurs d’OCR,
    • Datation des changements par consultation des éditions intermédiaires
    • Intégration dans une base de données unique de toutes les éditions et première analyse des champs,
    • Balisage du texte selon les standards TEI,
    • Développement de l’interface d’interrogation et publication web.

Projet ANR TALAD

TALAD : Analyse et traitement automatique de discours

  • Appel ANR : DEFI 8, axe 2 « Révolution numérique », sous-axe « Création et partage des savoirs » PRCE,
    • Participants : AGORA Cergy / ERTIM INALCO Paris / LI Tours / PRAXILING Montpellier / Société RETICULAR Paris,
    • Durée : 4 ans, à compter du 1er octobre 2017.
  • Objectifs : fournir à l’AD de nouvelles techniques d’analyse avancées inspirées des technologies développées en TAL,
  • Objets d’étude : chaînes de référence, entités nommées, nomination.
  • Contribution de Praxiling :
    • (i) construction d’une organisation formelle des concepts relatifs à la nomination sous forme d’une ontologie,
    • (ii) annotation de corpus à l’aide de l’ontologie.