Les corpus

La force vive du LLL sont ses corpus langagiers :

Nom du corpusAuteur.e.sDate de créationLangueFormat des donnéesQuantification (Nombre de ressources, heures, motsDescription succinte de la ressourceAccessibilité
Le français à Abidjan (ABJ97)Katja Ploog1997"français"audio, vidéo, annotations xml23hinteractions de pairs, narrations, entretiensCorpus écologique, entièrement transcrit en phonétique. Corpus analogique post-digitalisé avec un alignement forcé.https://pangloss.cnrs.fr/corpus_Abidjan clos, métadonnnées publiques
SEMEGwenaëlle Fabre2009-2014sèmèaudio, segmentation Elan, transcription Toolbox, traduction française9h (hors respeaking)50 ressources (textes techniques, contes et chants)Le sèmè est généralement considéré comme l’unique langue kru du Burkina Faso. Objet d’étude prioritaire du programme pluridisciplinaire RADICEL-K (Recherche Aide Développement : Interactions Culture Environnement Langues dans le Kénédougou – Burkina Faso)en cours, prochainement disponible
ANCOR-CENTREEmmanuel Schang2014françaisannotations GLOZZ488 000 motsRessource inégalée pour les anaphores et les coréférences en français oral.https://www.ortolang.fr/ANCOR clos
Santiago du ChiliKatja Ploog2006espagnolaudio, annotations xml et elan (transcription partielle)environ 15hCorpus d'entretiens de recherche recueillis pour l'étude de la moblité socio-langagière en contexte urbainbientôt sur CoCoon, clos
CEM (Circulation d'étudiants migrants)Katja Ploog2012-2018françaisaudio, annotations xml pour TXM (transcription intégrale)50 ressourcesenviron 700.000 motsCorpus longitudinal avec des sujets avant/pendant/après un parcours de mobilitéen réflexion avec les co-auteures
Interactions en classe de mathématiquesKatja Ploog2013-français, mathsvidéo, audio, annotations riches sous ELAN sur certaines séquences13 séances de classe complètes (2017-2023)(multi-)captations d'interactions écologiquesen cours, dépôt en attente, mais diffusion des ressources non envisagée

ESLO (portrait sonore d’une ville 1960-2010) :

http://eslo.huma-num.fr/

https://cocoon.huma-num.fr/exist/crdo/meta/cocoon-5569b8dc-b40f-3ccd-95d1-86d20a1a836c

https://www.ortolang.fr/market/corpora/eslo

CO2 (sur la coréférence) :

https://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html

ESLO-MD (micro-diachronie) :

http://eslo.huma-num.fr/index.php/pagelarecherche/projets-de-l-equipe-et-sous-corpus/eslo-md

https://www.ortolang.fr/market/corpora/eslo-md

ESLO-FLEU (enseignement universitaire et linguistique) :

http://eslo.huma-num.fr/index.php/pagelarecherche/projets-de-l-equipe-et-sous-corpus/eslo-fleu

https://www.ortolang.fr/market/corpora/eslo-fleu

MODAL (modalité à l’oral) :

https://modal.msh-vdl.fr/

https://www.ortolang.fr/market/corpora/modal

ODIL (syntaxe) :

https://www.ortolang.fr/market/corpora/odil

Parole émergée (interactions médico-sociales) :

https://cocoon.huma-num.fr/exist/crdo/meta/cocoon-27cbf3df-9c8f-3b14-8ff5-0a428e9ffa79