La force vive du LLL sont ses corpus langagiers :
Nom du corpus | Auteur.e.s | Date de création | Langue | Format des données | Quantification (Nombre de ressources, heures, mots | Description succinte de la ressource | Accessibilité | |
---|---|---|---|---|---|---|---|---|
Le français à Abidjan (ABJ97) | Katja Ploog | 1997 | "français" | audio, vidéo, annotations xml | 23h | interactions de pairs, narrations, entretiens | Corpus écologique, entièrement transcrit en phonétique. Corpus analogique post-digitalisé avec un alignement forcé. | https://pangloss.cnrs.fr/corpus_Abidjan clos, métadonnnées publiques |
SEME | Gwenaëlle Fabre | 2009-2014 | sèmè | audio, segmentation Elan, transcription Toolbox, traduction française | 9h (hors respeaking) | 50 ressources (textes techniques, contes et chants) | Le sèmè est généralement considéré comme l’unique langue kru du Burkina Faso. Objet d’étude prioritaire du programme pluridisciplinaire RADICEL-K (Recherche Aide Développement : Interactions Culture Environnement Langues dans le Kénédougou – Burkina Faso) | en cours, prochainement disponible |
ANCOR-CENTRE | Emmanuel Schang | 2014 | français | annotations GLOZZ | 488 000 mots | Ressource inégalée pour les anaphores et les coréférences en français oral. | https://www.ortolang.fr/ANCOR clos | |
Santiago du Chili | Katja Ploog | 2006 | espagnol | audio, annotations xml et elan (transcription partielle) | environ 15h | Corpus d'entretiens de recherche recueillis pour l'étude de la moblité socio-langagière en contexte urbain | bientôt sur CoCoon, clos | |
CEM (Circulation d'étudiants migrants) | Katja Ploog | 2012-2018 | français | audio, annotations xml pour TXM (transcription intégrale) | 50 ressources | environ 700.000 mots | Corpus longitudinal avec des sujets avant/pendant/après un parcours de mobilité | en réflexion avec les co-auteures |
Interactions en classe de mathématiques | Katja Ploog | 2013- | français, maths | vidéo, audio, annotations riches sous ELAN sur certaines séquences | 13 séances de classe complètes (2017-2023) | (multi-)captations d'interactions écologiques | en cours, dépôt en attente, mais diffusion des ressources non envisagée |
ESLO (portrait sonore d’une ville 1960-2010) :
https://cocoon.huma-num.fr/exist/crdo/meta/cocoon-5569b8dc-b40f-3ccd-95d1-86d20a1a836c
https://www.ortolang.fr/market/corpora/eslo
CO2 (sur la coréférence) :
https://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html
ESLO-MD (micro-diachronie) :
http://eslo.huma-num.fr/index.php/pagelarecherche/projets-de-l-equipe-et-sous-corpus/eslo-md
https://www.ortolang.fr/market/corpora/eslo-md
ESLO-FLEU (enseignement universitaire et linguistique) :
http://eslo.huma-num.fr/index.php/pagelarecherche/projets-de-l-equipe-et-sous-corpus/eslo-fleu
https://www.ortolang.fr/market/corpora/eslo-fleu
MODAL (modalité à l’oral) :
https://www.ortolang.fr/market/corpora/modal
ODIL (syntaxe) :
https://www.ortolang.fr/market/corpora/odil
Parole émergée (interactions médico-sociales) :
https://cocoon.huma-num.fr/exist/crdo/meta/cocoon-27cbf3df-9c8f-3b14-8ff5-0a428e9ffa79