Accéder directement au contenu

Laurent Romary

Directeur de recherche Inria ; Directeur de la culture et de l'information scientifiques ; Président du comité TC 37 de l'ISO (langue et terminologie) ; Membre de l'agence de maintenance ISO/TC 37/SC 2/MA 1 de l'ISO 639 (codes des langues)
100%
Libre accès
12
Documents
Identifiants chercheurs

Présentation

Président du [comité technique 37 de l'ISO](https://www.iso.org/fr/committee/48104.html) (langue et terminologie) depuis 2015 Membre de l'agence de maintenance ISO/TC 37/SC 2/MA 1 de l'ISO 639 (codes des langues) Infrastructure européenne DARIAH, directeur général (2014-2018)
Chairman of [ISO technical committee 37](https://www.iso.org/committee/48104.html) (language et terminology) since 2015 Member of [ISO/TC 37/SC 2/MA 1](https://www.iso.org/iso-639-language-code#:~:text=Maintenance%20Agency&text=The%20maintenance%20and%20publication%20of,the%20LCA%20for%20Set%201.), the maintenance agency for ISO 639 (language codes) DARIAH EU infrastructure, president of the Board of Directors (2014-2018)

Publications

bsagot
pedro-ortiz-suarez
Image document

BERTrade: Using Contextual Embeddings to Parse Old French

Loïc Grobol , Mathilde Regnault , Pedro Ortiz Suarez , Benoît Sagot , Laurent Romary
13th Language Resources and Evaluation Conference, European Language Resources Association, Jun 2022, Marseille, France
Communication dans un congrès hal-03736840v1
Image document

Towards a Cleaner Document-Oriented Multilingual Crawled Corpus

Julien Abadji , Pedro Ortiz Suarez , Laurent Romary , Benoît Sagot
Thirteenth Language Resources and Evaluation Conference - LREC 2022, Jun 2022, Marseille, France
Communication dans un congrès hal-03536361v1
Image document

Gallic(orpor)a : Extraction, annotation et diffusion de l’information textuelle et visuelle en diachronie longue

Benoît Sagot , Laurent Romary , Rachel Bawden , Pedro Javier Ortiz Suárez , Kelly Christensen
DataLab de la BnF : Restitution des travaux 2022, DataLab de la BnF, Dec 2022, Paris, France
Communication dans un congrès hal-03930542v1
Image document

Expanding the content model of annotationBlock

Alexandre Bartz , Juliette Janes , Laurent Romary , Philippe Gambette , Rachel Bawden
Next Gen TEI, 2021 - TEI Conference and Members’ Meeting, Oct 2021, Virtual, United States
Communication dans un congrès hal-03380805v1
Image document

Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus

Julien Abadji , Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
CMLC 2021 - 9th Workshop on Challenges in the Management of Large Corpora, Jul 2021, Limerick / Virtual, Ireland. ⟨10.14618/ids-pub-10468⟩
Communication dans un congrès hal-03301590v1
Image document

A Monolingual Approach to Contextualized Word Embeddings for Mid-Resource Languages

Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.156⟩
Communication dans un congrès hal-02863875v2
Image document

Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoan Dupont , Laurent Romary
JEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.54-65
Communication dans un congrès hal-02784755v3
Image document

CamemBERT: a Tasty French Language Model

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoann Dupont , Laurent Romary
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.645⟩
Communication dans un congrès hal-02889805v1
Image document

Establishing a New State-of-the-Art for French Named Entity Recognition

Pedro Javier Ortiz Suárez , Yoann Dupont , Benjamin Muller , Laurent Romary , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02617950v2
Image document

Preparing the Dictionnaire Universel for Automatic Enrichment

Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
10th International Conference on Historical Lexicography and Lexicology (ICHLL), Jun 2019, Leeuwarden, Netherlands
Communication dans un congrès hal-02131598v1
Image document

Asynchronous Pipeline for Processing Huge Corpora on Medium to Low Resource Infrastructures

Pedro Javier Ortiz Suárez , Benoît Sagot , Laurent Romary
7th Workshop on the Challenges in the Management of Large Corpora (CMLC-7), Jul 2019, Cardiff, United Kingdom. ⟨10.14618/IDS-PUB-9021⟩
Communication dans un congrès hal-02148693v1