Partenaires



Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Equipes de recherche > STRUCTURE TRANSVERSALE : Linguistique outillée

Activités

15 septembre 2017

Les travaux conduits dans le cadre de la structure transversale poursuivent plusieurs finalités coordonnées :

  • Recenser les ressources linguistiques disponibles et en cours de constitution ;
  • Aider à la finalisation de corpus déjà constitués mais qui ne sont pas encore mis en forme d’une façon qui soit conforme aux standards internationaux (TEI et autres formats XML adaptés…) ou qui ne sont pas décrits par des métadonnées assez standardisées, afin d’en permettre la diffusion et la réutilisation au sein de la communauté ;
  • Mener une réflexion sur les questions d’éthique avant l’acquisition de corpus sensibles (quels types de données choisir, comment anonymiser ces données…) ;
  • Proposer des solutions pour rendre ces corpus interopérables ;
  • Accompagner les membres du laboratoire, et en particulier les doctorants, dans l’appropriation des méthodologies, des outils informatiques et des bonnes pratiques (questions techniques, normes d’encodage, questions d’éthique…) ;
  • Créer une plateforme consacrée à la présentation, la diffusion et l’exploitation en ligne des ressources existantes, avec différents modes d’accès, en tenant compte de l’aspect sensible des données ;
  • Participer aux activités des infrastructures nationales et européennes pour les sciences humaines et sociales ;
  • Valoriser les ressources numériques du laboratoire et participer à la structuration d’une communauté autour des liens entre l’analyse de discours, la linguistique de corpus, les sciences de la parole et le TAL, sur le plan national et international ;
  • Promouvoir les travaux du laboratoire auprès du secteur industriel et des institutions publiques, pour répondre à des besoins exprimés dans le monde social et économique ;
  • Diffuser plus largement et vulgariser les travaux du laboratoire auprès du grand public ;
  • Sur le plan pédagogique : (i) proposer des ressources et des outils informatiques pour l’enseignement de la linguistique et des humanités numériques dans les cursus de l’ITIC ; (ii) créer des supports pédagogiques destinés à former des « nouveaux » linguistes amenés à concilier l’affinité avec les données, les connaissances linguistiques à large spectre, les savoir-faire techniques toujours plus complexes).