DATATHON

31 mai 2021 par Flora [TheChamp-Sharing]
Datathon de la parole, 8-10 novembre 2021 : dépôt, archivage et diffusion de documentation linguistique sur langues rares

Retour sur ces journées : https://lacito.hypotheses.org/3073

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT) et la plate-forme Collection de Corpus Oraux Numériques (Cocoon) organisent à Orléans un atelier « datathon de la parole » de quatre demi-journées du lundi 8 novembre à midi au mercredi 10 novembre à midi. L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études. L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant.e.s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles). L’atelier fournira un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication électronique des données.

Au fil des quatre demi-journées, les travaux pratiques (sur des jeux de données de participant.e.s) alterneront avec des présentations générales (programme à venir) visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications. Les thématiques abordées couvriront les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

Date limite d’envoi des dossiers : 2 juillet 2021
Réponses le 16 juillet.

Merci d’envoyer à alexis.michaud@cnrs.fr un projet (1 page) qui comporte :
– langues concernées (on donnera la priorité aux langues peu documentées de tous les continents)
– description succincte du projet scientifique dans le cadre duquel les données ont été collectées
– description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction)
– perspectives d’enrichissement futur

Laboratoires organisateurs : LLL et LACITO.

Au plaisir de vous rencontrer nombreux à Orléans
Les organisateurs
(Flora Badin, Emmanuel Schang, Séverine Guillaume, Michel Jacobson, Alexis Michaud)

PROGRAMME :

lundi 8 novembre 13h – 17h30. Tour de table des intervenants (rôles, motivations…) et des participants (présentation des corpus et de actions envisagées). Présentation fonctionnelle de la plateforme Cocoon et explications sur le mode opératoire pour les dépôts.

mardi 9 novembre 9h – 12h. Travail sur les données des participants (dépôt, description) par groupes de 3 avec un accompagnant/intervenant pour aider en donnant des conseils et en répondant aux questions.
mardi 9 novembre 13h30 – 16h00 Poursuite du travail de dépôt
mardi 9 novembre 16h – 17h30 Présentation de la démarche de la BnF sur les dons/dépôts de fonds d’archives orales. Exemples de cas. Questions/réponses

mercredi 10 novembre 9h – 13h. Retour sur les difficultés rencontrées la veille. Réflexions sur l’organisation possible de dépôts en lots. Discussion générale.

A lire aussi