13 November 2023

DATATHON #2

[TheChamp-Sharing]
Datathon de la parole, 13-14 novembre 2023 : dépôt, archivage et diffusion des corpus oraux (linguistique, socio-linguistique, histoire orale)

Retrouvez nous sur : https://bnf.hypotheses.org/32248

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT),  la plate-forme Collection de Corpus Oraux Numériques (Cocoon) et la Bibliothèque nationale de France organisent à Paris dans les espaces du DataLab de la Bibliothèque nationale de France un second atelier « Datathon de la parole » de quatre demi-journées, du lundi 13 novembre au mardi 14 novembre 2023. Il fait suite à un premier datathon de la parole qui s’est déroulé en novembre 2021 à Orléans.

L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) de l’Infrastructure de Recherche Huma-Num et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études.

L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant·e·s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles).

Datathon de la parole à Orléans, novembre 2021 : séance de travaux pratiques. Photo : Emmanuel Schang (licence : CC BY-NC-SA 3.0 fr)

Objectifs

L’atelier se propose de fournir un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication des données. Cet atelier sera encadré de présentations générales par les animateurs et le BnF DataLab, visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications ; fouille de données.

Les thématiques abordées couvrent les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

Inscription

Informations souhaitées par le comité d’organisation du datathon de la parole
  • Nature des données orales (parlées), langues concernées (on donnera une priorité aux langues peu documentées de tous les continents) ;
  • Description succincte du projet scientifique dans le cadre duquel les données ont été collectées ;
  • Description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction) ;
  • Perspectives d’enrichissement futur.

Date limite d’inscription et de dépôt du dossier : 15 juillet 2023, en remplissant le formulaire suivant https://framaforms.org/datathon-de-la-parole-2023-1686730891

Nombre maximum de participants : 15

Les participants dont les dossiers auront été retenus seront contactés fin juillet par les animateurs.

Programme

Lundi 13 novembre

Lundi matin – accueil, présentation des journées du datathon de la parole par les animateurs, projets des participants
  • 9h30 – Accueil
  • 10h-10h20 – Présentation du BnF DataLab : accompagner les chercheurs sur les collections numériques de la BnF – Louise-Anne Charles (BnF)
  • 10h20-10h40 – La gestion des corpus oraux à la BnF : conserver, décrire et transmettre – Fabrice Menneteau (BnF), Audrey Viault (BnF)
  • 10h40- 11h – Présentation de la plateforme Cocoon – Michel Jacobson (Huma-Num), Flora Badin (LLL)
  • 11h-11h15 – Présentation de l’équipe des animateurs
  • 11h15- 12h30 – Présentations de leurs projets par les participants

[Déjeuner à la BnF]

Lundi après-midi – ateliers de travail en groupes
  • 14h-17h – Travail de leurs documents par les participants, avec les animateurs

[Dîner libre ou avec les groupes de travail]

Mardi 14 novembre

Mardi matin – ateliers de travail en groupes
  • 10h-12h30 – Travail de leurs documents par les participants, avec les animateurs

[Déjeuner à la BnF]

Mardi après-midi – restitution, projets et discussion
  • 14h30-15h – Les bénéfices de la publication des données pour la recherche : un message optimiste de science ouverte – Alexis Michaud (LACITO)
  • 15h-16h30 – Restitution des ateliers et discussion
  • 16h30-17h15 – Etre accompagné.e par le BnF DataLab : services, fonctionnement et appels à projets – Louise-Anne Charles (BnF)

Lieu

Bibliothèque nationale de France – Site Tolbiac/François Mitterrand, Quai François Mauriac, Paris. Métro ligne 14 : Bibliothèque François Mitterrand, ou métro ligne 6 : Quai de la Gare.

Ressources

Organisateurs

Flora Badin (LLL), Emmanuel Schang (LLL), Séverine Guillaume (LACITO), Michel Jacobson (Huma-Num), Audrey Viault (BnF), Fabrice Menneteau (BnF), Louise-Anne Charles (BnF-Datalab), Alexis Michaud (LACITO), Balthazar Do Nascimento (LACITO).

13 Nov 202314 Nov 2023
Bibliothèque nationale de France – Site Tolbiac/François Mitterrand, Quai François Mauriac, Paris. Métro ligne 14 : Bibliothèque François Mitterrand, ou métro ligne 6 : Quai de la Gare.

Prochains évènements

Retour à l'agenda