Accéder directement au contenu

Flora Badin

IE CNRS Data Scientist
37%
Libre accès
35
Documents
Affiliations actuelles
  • 243264
Identifiants chercheurs
Contact

Présentation

Research profil My research focuses on automatic language processing. The field of oral corpora is largely approached in my laboratory. I manage the structuring and processing of digital corpora as well as the extraction of information. I am involved in the valorization of research and am interested in the storage and archiving of digital datas. I work on annotated corpora and with softwares associated. Scientific responsibilities I’m in charge of Information Systems Security I’m the sustainable development correspondent I manage the QuECJ group of the Corli consortium I’m the CNRS training correspondent I teach at the University of Orleans in the Master's degree program in Language Sciences Training 2009 : MASTER Advanced Linguistics Applied to Information and Communication Sciences and Technologies at the University of Orleans 2007 : LICENSE Mathematics and Computer Science Applied to Language Sciences at the University of Orléans Research activities 07-2013: Engineer in software engineering at LLL-CNRS, Orleans 04-2012 - 06-2013 : R&D studies engineer in NLP at INIST-CNRS, Vandoeuvre-lès-Nancy 01-2011 - 03-2012 : Linguistics Resource Officer at INIST-CNRS, Vandoeuvre-lès-Nancy 09-2009 - 12-2010 : Development Engineer at LIMSI-CNRS, Orsay, France 04-2009 - 07-2009 : Internship in NLP at Lingway, Nantes
THÉMATIQUES Structuration et traitement de corpus numériques (corpus écrits, corpus oral transcrits) en français et autres langues du monde dont les créoles ; Valorisation de la recherche (collaboration interlaboratoire et tutelles) ; Stockage et archivage des données numériques Impact environnemental du numérique DOMAINES DE COMPETENCES Expert en Traitement Automatique des Langues Traitements informatisés de corpus : modélisation, balisage (TEI, XML) et structuration de contenus (web sémantique) ; Gestion de sites internet (CMS Drupal, Joomla, Wordpress) ; Formation des utilisateurs aux logiciels de traitement de données linguistiques en masse (TXM, Elan) ; Informatique générale : Langages de programmations : Python, Java, Javascript FORMATION 2009 : MASTER Linguistique Avancée Appliquée aux Sciences et Technologies de l’Information et de la Communication à l'université d'Orléans 2007 : LICENCE Mathématiques et Informatique Appliquées aux Sciences du Langage à l'université d'Orléans Enseignement et autres responsabilités: Correspondante formation CNRS Chargée de la Sécurité du Système d'Information Correspondante developpement durable (membre du GDS EcoInfo) Enseignante en exploration de corpus pour les master SDL, LTMI et TCM de l'Université d'Orléans (jusqu'en 2022) Correspondante communication CNRS Représentante des ITA et BIATSS au conseil du laboratoire

Publications

Liaisons variables et pataquès dans un corpus de chansons de tradition orale

Gasparde Coutanson , Flora Badin
Langue française, 2023, La liaison entre oral et écrit, 219 (3), pp.49-64
Article dans une revue hal-04255250v1

Les données orales en linguistique : questions éthiques et cadre juridique

Flora Badin , Caroline Cance , Céline Dugua , Layal Kanaan-Caillol , Anne-Lyse Minard
Sonorités, inPress
Article dans une revue hal-03313869v1
Image document

Figures et construction du soin dans le parcours de soin pluridisciplinaire

Katja Ploog , Caroline Cance , Flora Badin , Camille Noûs
Études de linguistique appliquée : revue de didactologie des langues-cultures et de lexiculturologie, A paraître, Perspectives D'interventions En Linguistique Appliquée : Quelles Réponses Face Aux Besoins Sociétaux
Article dans une revue halshs-03147171v1

French partial interrogatives: a microdiachronic corpus study of variation and new perspectives in a refined pragmatics framework

Gabriel Thiberge , Flora Badin , Loïc Liégeois
Faits de langues, 2021, 51 (2), pp.179-202. ⟨10.1163/19589514-05102010⟩
Article dans une revue halshs-03265843v1
Image document

Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d'une exploitation textométrique : le cas des interrogatives partielles dans ESLO

Flora Badin , Loïc Liégeois , Gabriel Thiberge , Christophe Parisse
Corpus, 2021, 22, ⟨10.4000/corpus.5752⟩
Article dans une revue halshs-03133017v1
Image document

La liaison dans un corpus de hits francophones (1956–2017)

Gasparde Coutanson , Flora Badin
Journal of French Language Studies, 2021, 31 (2), pp.131-147. ⟨10.1017/S0959269521000016⟩
Article dans une revue hal-03381443v1

Quecj : un outil pour soutenir les pratiques éthiques autour des corpus linguistiques (consortium Corli 2)

Flora Badin , Céline Dugua , Aude Julien Da cruz lima , Anne-Lyse Minard , Katja Ploog
Rencontres Huma-Num 2023. Conférence : Problématiques juridiques et éthiques des données numériques, IR* Huma-Num, Jun 2023, Ecully, France
Communication dans un congrès hal-04144287v1

CORLI : Un corpus ouvert du français -ou comment travailler à rassembler les briques existantes ?

Parisse Christophe , Céline Poudat , Flora Badin , Christophe Benzitoun , Sascha Diwersy
Journées de Linguistique de Corpus, Jul 2023, Grenoble, France
Communication dans un congrès hal-04255174v1
Image document

Rendre un grand corpus oral accessible pour la didactique du FLE : le projet ESLO-FLEU

Marie Skrovec , Chloé Sarah Tahar , Flora Badin , Britta Thörle
11es Journées internationales de Linguistique de Corpus, Jul 2023, Grenoble, France. pp.319-325
Communication dans un congrès halshs-04478301v1

ESLO for FFL in a university context: selection, annotation and accessibility of the ESLO-FLEU sub-corpus

Marie Skrovec , Chloé Sarah Tahar , Flora Badin
Spoken language corpora as a teaching-learning resource for French as a foreign language, Jun 2023, Orléans, France
Communication dans un congrès halshs-04478387v1
Image document

La liaison dans un module d'ESLO-FLEU : mise en œuvre pour un cours de phonologie du français

Britta Gemmeke , Céline Dugua , Flora Badin
11èmes Journées Linguistique de Corpus, Jul 2023, Grenoble, France
Communication dans un congrès halshs-04475012v1
Image document

L’usage des liaisons lors de lectures partagées – Une étude exploratoire à partir du module « Livres pour enfants » d’ESLO

Céline Dugua , Flora Badin , Barbara Fallon , Olivier Baude
8e Congrès Mondial de Linguistique Française (CMLF 2022), Jul 2022, Orleans, France. pp.09006, ⟨10.1051/shsconf/202213809006⟩
Communication dans un congrès hal-04106450v1

Ravioli : un corpus oral annoté en valeurs injonctives

Flora Badin , Fanny Krimou , Gilles Cloiseau , Lotfi Abouda , François Nemo
AFLS 2020, Jun 2021, Bruxelles, France
Communication dans un congrès halshs-03521076v1
Image document

DOING@DEFT : utilisation de lexiques pour une classification efficace de cas cliniques

Nicolas Hiot , Anne-Lyse Minard , Flora Badin
Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.41-53
Communication dans un congrès hal-03265924v1

CORLI: The French Knowledge-Centre

Efstathia Soroli , Céline Poudat , Flora Badin , Antonio Balvet , Elisabeth Delais-Roussarie
Conférence Internationale Annuelle de CLARIN - Common Language Resources and Technology Infrastructure, Oct 2020, Barcelona, Spain
Communication dans un congrès hal-04377972v1
Image document

Chunk Different Kind of Spoken Discourse: Challenges for Machine Learning

Iris Eshkol-Taravella , Mariame Maarouf , Flora Badin , Marie Skrovec , Isabelle Tellier
Language Resources and Evaluation Conference, May 2020, Marseille, France. pp.5164-5168
Communication dans un congrès hal-03482181v1

Réflexions autour de l’objet de soin dans le parcours de soin pluridisciplinaire

Katja Ploog , Caroline Cance , Flora Badin
Professionnel·le·s et Recherche en Linguistique Appliquée : défis méthodologiques, enjeux sociétaux et perspectives d’intervention, Jun 2019, Lyon, France
Communication dans un congrès hal-02343060v1

Des liaisons et des corpus : apports d’une étude sur le changement linguistique en temps réel

Céline Dugua , Jennifer Ganaye , Flora Badin , Olivier Baude
10èmes journées de linguistique de corpus, Nov 2019, Grenoble, France
Communication dans un congrès halshs-03405061v1

From POS to period segmentation : toward an automatic data processing for spoken corpora

Flora Badin , Iris Eshkol-Taravella , François Delafontaine , Loïc Grobol , Natalia Kalashnikova
Unit segmentation in Spoken Interaction Segcor Workshop, Jun 2019, Orléans, France
Communication dans un congrès hal-04071897v1
Image document

Chunker différents types de discours oraux : défis pour l’apprentissage automatique

Iris Eshkol-Taravella , Mariame Maarouf , Marie Skrovec , Flora Badin
26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.195-204
Communication dans un congrès hal-02567769v1
Image document

Constitution d'un corpus oral de l'arabe tunisien : une ressource essentielle pour l'étiquetage morphosyntaxique

Yossra Ben Ahmed , Flora Badin , Linda Hriba
TALAf 2018 : Traitement automatique des langues africaines (écrit et parole), Sep 2018, Grenoble, France
Communication dans un congrès halshs-03520893v1

Compiler un grand corpus oral pour la textométrie : retour d’expérience en vue de favoriser le développement de nouvelles fonctionnalités logicielles

Loïc Liégeois , Flora Badin
50 ans de linguistique sur corpus oraux : Apports à l'étude de la variation, Nov 2018, Orléans, France
Communication dans un congrès hal-01962463v1

Annoter un corpus oral multicouche en chunks : l’approche de la linguistique outillée

Flora Badin , Iris Eshkol-Taravella , Marie Skrovec
50 ans de linguistique sur corpus oraux Apports à l'étude de la variation, Laboratoire Ligérien de Linguistique UMR 7270, Nov 2018, Orléans, France
Communication dans un congrès hal-04071789v1
Image document

Un corpus oral transcrit de kriol

Jean-Louis Rougé , Emmanuel Schang , Ana R Luis , Flora Badin , Eugène Tavares
TALAf 2018 : Traitement Automatique des Langues Africaines., Sep 2018, Grenoble, France
Communication dans un congrès halshs-02072946v1

Compiler un grand corpus oral pour la textométrie : retour d'expérience en vue de favoriser le développement de nouvelles fonctionnalités logicielles

Loïc Liégeois , Flora Badin
50 ans de linguistique sur corpus oraux : Apports à ltextquoterightétude de la variation, 2018, Orléans, France
Communication dans un congrès halshs-01967486v1

La liaison dans l’environnement langagier des enfants : Vers une annotation commune ?

Céline Dugua , Olivier Baude , Flora Badin , Marie-Hélène Côté , Jennifer Ganaye
FLORAL 2017 : Accessibilité, représentations et analyses des données, Mar 2017, Orléans, France
Communication dans un congrès hal-01962479v1

SegCor : vers une segmentation multiniveaux pour le français parlé

Biagio Ursi , François Delafontaine , Carole Etienne , Flora Badin , Heike Baldauf-Quilliatre
Colloque Syntaxe et discours III – Types d’unités et procédures de segmentation, Florence Lefeuvre; Marie-José Béguelin; Gilles Corminboeuf, Jun 2017, Paris, France
Communication dans un congrès hal-01773625v1

Modéliser le processus d’écriture d’un scripteur de haut niveau. Repérage automatique des opérations de réécriture à l’aide du logiciel MEDITE : intérêt et limites.

Jacqueline Lafont-Terranova , Flora Badin , Guillaume Chevrot , Didier Colin , Elodie Comte
Journée d’étude, APR ECRISA, Sep 2017, Tours, France
Communication dans un congrès halshs-03622664v1
Image document

Automatiser l'analyse prosodique des corpus oraux

Flora Badin , Emmanuel Schang , François Nemo , Camille Leroux
Colloque FLORAL 2017 – Accessibilité, représentations et analyses des données, Mar 2017, Orléans, France
Communication dans un congrès halshs-03521006v1

Le projet SegCor : Quelles unités pour la segmentation d’un corpus d’interactions en français et en allemand ?

Biagio Ursi , Heike Baldauf-Quilliatre , Nathalie Rossi-Gensane , Véronique Traverso , Carole Etienne
Colloque FLORAL – Accessibilité, représentations et analyses des données, Mar 2017, Orléans, France
Communication dans un congrès hal-01773621v1

Cocoon une plateforme pour la conservation et la diffusion de ressources orales en sciences humaines et sociales

Michel Jacobson , Flora Badin , Séverine Guillaume
8es Journées Internationales de Linguistique de Corpus, Sep 2015, Orléans, France
Communication dans un congrès halshs-01319600v1

Sign language corpora for analysis, processing and evaluation

Annelies Braffort , Laurence Bolot , Emilie Chetelat , Annick Choisier , G Delorme
International Conference on Language Resources and Evaluation, Jan 2010, Valetta, Malta
Communication dans un congrès hal-01634115v1

ÉCRIRE EN SIXIÈME UN TEXTE EXPLICATIF EN SCIENCES

Patricia Schneeberger , Maryse Rebière , Martine Jaubert , Denise Orange-Ravachol , Yann Lhoste
Résultats de la recherche ÉCRICOL. Peter Lang «Editions scientifiques internationales »., A paraître
Chapitre d'ouvrage halshs-03520882v1