BidouiLLLage Elan #2

Nous relancons un bidouiLLLage sur le logiciel ELAN.

Au programme :

10h-12h : Atelier faux débutants animé par Biagio Ursi  – salle 151
13h30-15h30 : Atelier traitement des corpus complexes et multisources animé par Louis Maritaud – salle 157
15h30-17h : Conférence invitée – Louis Maritaud – salle 150
« Les apports de l’annotation sur ELAN dans des perspectives mixtes : l’exemple de l’analyse du discours rapporté dans des réunions pluriprofessionnelles en psychiatrie »

Inscription obligatoire par mail : k atja.ploog@univ-orleans.fr pour permettre un accueil optimal, merci de nous formuler succinctement vos attentes.

Merci à Adeline Vioux de la MSH – VdL qui nous a dessiné le visuel de l’affiche

DATATHON #2

Retrouvez nous sur : https://bnf.hypotheses.org/32248

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT),  la plate-forme Collection de Corpus Oraux Numériques (Cocoon) et la Bibliothèque nationale de France organisent à Paris dans les espaces du DataLab de la Bibliothèque nationale de France un second atelier « Datathon de la parole » de quatre demi-journées, du lundi 13 novembre au mardi 14 novembre 2023. Il fait suite à un premier datathon de la parole qui s’est déroulé en novembre 2021 à Orléans.

L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) de l’Infrastructure de Recherche Huma-Num et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études.

L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant·e·s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles).

Datathon de la parole à Orléans, novembre 2021 : séance de travaux pratiques. Photo : Emmanuel Schang (licence : CC BY-NC-SA 3.0 fr)

Objectifs

L’atelier se propose de fournir un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication des données. Cet atelier sera encadré de présentations générales par les animateurs et le BnF DataLab, visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications ; fouille de données.

Les thématiques abordées couvrent les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

Inscription

Informations souhaitées par le comité d’organisation du datathon de la parole
  • Nature des données orales (parlées), langues concernées (on donnera une priorité aux langues peu documentées de tous les continents) ;
  • Description succincte du projet scientifique dans le cadre duquel les données ont été collectées ;
  • Description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction) ;
  • Perspectives d’enrichissement futur.

Date limite d’inscription et de dépôt du dossier : 15 juillet 2023, en remplissant le formulaire suivant https://framaforms.org/datathon-de-la-parole-2023-1686730891

Nombre maximum de participants : 15

Les participants dont les dossiers auront été retenus seront contactés fin juillet par les animateurs.

Programme

Lundi 13 novembre

Lundi matin – accueil, présentation des journées du datathon de la parole par les animateurs, projets des participants
  • 9h30 – Accueil
  • 10h-10h20 – Présentation du BnF DataLab : accompagner les chercheurs sur les collections numériques de la BnF – Louise-Anne Charles (BnF)
  • 10h20-10h40 – La gestion des corpus oraux à la BnF : conserver, décrire et transmettre – Fabrice Menneteau (BnF), Audrey Viault (BnF)
  • 10h40- 11h – Présentation de la plateforme Cocoon – Michel Jacobson (Huma-Num), Flora Badin (LLL)
  • 11h-11h15 – Présentation de l’équipe des animateurs
  • 11h15- 12h30 – Présentations de leurs projets par les participants

[Déjeuner à la BnF]

Lundi après-midi – ateliers de travail en groupes
  • 14h-17h – Travail de leurs documents par les participants, avec les animateurs

[Dîner libre ou avec les groupes de travail]

Mardi 14 novembre

Mardi matin – ateliers de travail en groupes
  • 10h-12h30 – Travail de leurs documents par les participants, avec les animateurs

[Déjeuner à la BnF]

Mardi après-midi – restitution, projets et discussion
  • 14h30-15h – Les bénéfices de la publication des données pour la recherche : un message optimiste de science ouverte – Alexis Michaud (LACITO)
  • 15h-16h30 – Restitution des ateliers et discussion
  • 16h30-17h15 – Etre accompagné.e par le BnF DataLab : services, fonctionnement et appels à projets – Louise-Anne Charles (BnF)

Lieu

Bibliothèque nationale de France – Site Tolbiac/François Mitterrand, Quai François Mauriac, Paris. Métro ligne 14 : Bibliothèque François Mitterrand, ou métro ligne 6 : Quai de la Gare.

Ressources

Organisateurs

Flora Badin (LLL), Emmanuel Schang (LLL), Séverine Guillaume (LACITO), Michel Jacobson (Huma-Num), Audrey Viault (BnF), Fabrice Menneteau (BnF), Louise-Anne Charles (BnF-Datalab), Alexis Michaud (LACITO), Balthazar Do Nascimento (LACITO).

BidouiLLLages ELAN

Programme de la journée

9h-10h30 Atelier grands débutants : présentation des fonctions, tour d’horizon, installation et premiers pas Animé par B. Ursi et K. Ploog – salle 157
11h-12h30 Atelier échange de pratiques : création des schémas d’annotation, requêtes, formats, interopérabilités… Animé par F. Badin et A.-L. Minard – salle 157
13h30-15h Atelier gestion des ressources : synchronisation de multicaptations, alignement, traitements pour la diffusion, désidentification, céation d’extraits
Animé par L. Maritaud – salle 157

15h30-17h Conférence invitée :
salle 250

« Les apports de l’annotation sur ELAN dans des perspectives mixtes : l’exemple de
l’analyse du discours rapporté dans des réunions pluriprofessionnelles en psychiatrie« 
La manipulation de données audiovisuelles dans la recherche en SHS implique de nombreux traitements consécutifs. De la conception du corpus en tant qu’objet défini aux analyses, en passant par les annotations/transcriptions, le travail est partie guidé par des aspects techniques, liés aux méthodes de captation, aux conventions de transcription, et au choix des logiciels de traitement. Titulaire d’un doctorat en sciences du langage intitulé «La compétence d’interaction des soignants en psychiatrie : analyse comparative
de séquences de discours représenté dans des conversations entre pairs», Louis Maritaud est actuellement ingénieur d’études au laboratoire ICAR (ENS Lyon) en charge des traitements audiovisuels des corpus. Son expérience avec ELAN repose sur le traitement intégral de 15h d’enregistrements vidéo de réunions pluriprofessionnelles en psychiatrie, en vue de l’étude des séquences de discours rapporté. Louis Maritaud donne à voir, dans cette communication, le cheminement méthodologique de la conception des données quantitatives via les annotations sur le logiciel ELAN, la remise en perspective ces annotations pour les analyses qualitatives, En conclusion, il présentera les résultats concernant les formes et fonctions des discours rapportés et présentera quelques perspectives relatives aux asymétries de participation des soignants selon leur fonctions.
►ELAN : https://archive.mpi.nl/tla/elan
►Louis Maritaud : http://www.icar.cnrs.fr/membre/lmaritaud

Inscription obligatoire via le formulaire : https://framaforms.org/bidouillages-elan-1680245023

Support de communication réalisé par Adeline Vioux de la MSH Val de Loire : Formation-bidouillage-elan_V230331

Vulnérabilités en interaction : atelier d’analyse de données

Nous accueillons pour la seconde année en délégation CNRS Maud Verdier de PRAXILING (université montpellier). Une collaboration très fructueuse s’est amorcée, tout d’abord entre Maud, Caroline Cance et Ktja Ploog. Travaillant toutes les trois sur des corpus interactionnels recueillis
auprès de publics vulnérables, la thématique de la vulnérabilité – et de ses émergences langagières en particulier – s’est vite imposée. Au fil de l’année, nos réunions de travail se sont étoffées en véritables séances d’analyse de données, auxquelles ont participé d’autres membres du LLL.

Deux événements ouverts au public ont été organisés, et notamment une journée d’étude fin juin, qui a permis d’inviter, d’une part, des chercheuses extérieures spécialisées dans les interactions et/ou le soin et, d’autre part, des collègues d’autres disciplines et laboratoires de notre entourage (hervé breton – Ethique Education Santé, tours ; stéphanie mauclair – Centre Pothier, orléans) pour ainsi approfondir nos questionnements dans une perspective SHS plus large.

Fortes de cette expérience stimulante, nous allons reconduire cette année les ateliers d’analyse de données par une formule mensuelle, le lundi matin. voici les créneaux à venir :

18/10 – 10-12h

22/11 – 10-12h

13/12 – 10-12h

les séances sont publiques en présentiel en salle 248 et à distance sur inscription (par retour de mail)

Vulnérabilités en interaction : atelier d’analyse de données

Nous accueillons pour la seconde année en délégation CNRS Maud Verdier de PRAXILING (université montpellier). Une collaboration très fructueuse s’est amorcée, tout d’abord entre Maud, Caroline Cance et Ktja Ploog. Travaillant toutes les trois sur des corpus interactionnels recueillis
auprès de publics vulnérables, la thématique de la vulnérabilité – et de ses émergences langagières en particulier – s’est vite imposée. Au fil de l’année, nos réunions de travail se sont étoffées en véritables séances d’analyse de données, auxquelles ont participé d’autres membres du LLL.

Deux événements ouverts au public ont été organisés, et notamment une journée d’étude fin juin, qui a permis d’inviter, d’une part, des chercheuses extérieures spécialisées dans les interactions et/ou le soin et, d’autre part, des collègues d’autres disciplines et laboratoires de notre entourage (hervé breton – Ethique Education Santé, tours ; stéphanie mauclair – Centre Pothier, orléans) pour ainsi approfondir nos questionnements dans une perspective SHS plus large.

Fortes de cette expérience stimulante, nous allons reconduire cette année les ateliers d’analyse de données par une formule mensuelle, le lundi matin. voici les créneaux à venir :

18/10 – 10-12h

29/11 – 10-12h

13/12 – 10-12h

les séances sont publiques en présentiel en salle 248 et à distance sur inscription (par retour de mail)

Vulnérabilités en interaction : atelier d’analyse de données

Nous accueillons pour la seconde année en délégation CNRS Maud Verdier de PRAXILING (université montpellier). Une collaboration très fructueuse s’est amorcée, tout d’abord entre Maud, Caroline Cance et Ktja Ploog. Travaillant toutes les trois sur des corpus interactionnels recueillis
auprès de publics vulnérables, la thématique de la vulnérabilité – et de ses émergences langagières en particulier – s’est vite imposée. Au fil de l’année, nos réunions de travail se sont étoffées en véritables séances d’analyse de données, auxquelles ont participé d’autres membres du LLL.

Deux événements ouverts au public ont été organisés, et notamment une journée d’étude fin juin, qui a permis d’inviter, d’une part, des chercheuses extérieures spécialisées dans les interactions et/ou le soin et, d’autre part, des collègues d’autres disciplines et laboratoires de notre entourage (hervé breton – Ethique Education Santé, tours ; stéphanie mauclair – Centre Pothier, orléans) pour ainsi approfondir nos questionnements dans une perspective SHS plus large.

Fortes de cette expérience stimulante, nous allons reconduire cette année les ateliers d’analyse de données par une formule mensuelle, le lundi matin. voici les créneaux à venir :

18/10 – 10-12h

22/11 – 10-12h

13/12 – 10-12h

les séances sont publiques en présentiel en salle 248 et à distance sur inscription (par retour de mail).

le 18 octobre, nous reprendrons et approfondirons les échanges autour de l’extrait de Maud (la place de l’aidant/e dans l’ESAT théâtre). En complément, layal Kanaan-Caillol proposera un extrait autour des formats de reformulation dans l’interaction de soin infirmière/usager.

Tuto@Mate : Structuration et analyse de corpus avec TXM

TXM est un logiciel de textométrie. Du lexique au sous-corpus en passant par le concordancier et les coocurrences, TXM est un outil pionnier dans le domaine de la statistique textuelle et la recherche d’information sur corpus textuels. Il permet l’enrichissement des données par un dispositif d’annotation semi-automatique. Son utilisation a évolué avec le développement de nouvelles fonctionnalités par l’équipe de développeurs pour l’exploitation de corpus oraux transcrits (navigation dans la transcription et écoute du signal synchronisé). Un point phare de la bonne utilisation de ce logiciel est la préparation du corpus avant l’importation dans l’outil, pour optimiser leur enrichissement et leur exploitation. Jouer avec le XML en entrée, utiliser les extensions comme Treetagger et mediaPlayer pour enfin y trouver un environnement ergonomique pour l’annotation de phénomènes/patrons font partie des originalités à connaitre. Au coeur des analyses, le concordancier et son système de requêtes permettent d’explorer le corpus en profondeur en un coup de baguette magique.

Gratuit, openSource et multiplateforme, TXM deviendra vite votre allié pour vos recherches sur corpus.

DATATHON

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain » (GDR LIFT) et la plate-forme Collection de Corpus Oraux Numériques (Cocoon) organisent à Orléans un atelier « datathon de la parole » de quatre demi-journées du lundi 8 novembre à midi au mercredi 10 novembre à midi. L’événement s’inscrit également dans le cadre des activités soutenues par le consortium « Corpus, Langues et Interactions » (CORLI) et par l’Institut des Langues Rares (ILARA) de l’École Pratique des Hautes Études. L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant.e.s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles). L’atelier fournira un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication électronique des données.

Au fil des quatre demi-journées, les travaux pratiques (sur des jeux de données de participant.e.s) alterneront avec des présentations générales (programme à venir) visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications. Les thématiques abordées couvriront les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

PROGRAMME :

lundi 8 novembre 13h – 17h30. Tour de table des intervenants (rôles, motivations…) et des participants (présentation des corpus et de actions envisagées). Présentation fonctionnelle de la plateforme Cocoon et explications sur le mode opératoire pour les dépôts.

mardi 9 novembre 9h – 12h. Travail sur les données des participants (dépôt, description) par groupes de 3 avec un accompagnant/intervenant pour aider en donnant des conseils et en répondant aux questions.
REPAS
mardi 9 novembre 13h30 – 16h00 Poursuite du travail de dépôt
mardi 9 novembre 16h – 17h30 Présentation de la démarche de la BnF sur les dons/dépôts de fonds d’archives orales. Exemples de cas. Questions/réponses
DINER

mercredi 10 novembre 9h – 13h. Retour sur les difficultés rencontrées la veille. Réflexions sur l’organisation possible de dépôts en lots. Discussion générale.