Accéder directement au contenu

Laurent Romary

Directeur de recherche Inria ; Directeur de la culture et de l'information scientifiques ; Président du comité TC 37 de l'ISO (langue et terminologie) ; Membre de l'agence de maintenance ISO/TC 37/SC 2/MA 1 de l'ISO 639 (codes des langues)
100%
Libre accès
6
Documents
Identifiants chercheurs

Présentation

Président du [comité technique 37 de l'ISO](https://www.iso.org/fr/committee/48104.html) (langue et terminologie) depuis 2015 Membre de l'agence de maintenance ISO/TC 37/SC 2/MA 1 de l'ISO 639 (codes des langues) Infrastructure européenne DARIAH, directeur général (2014-2018)
Chairman of [ISO technical committee 37](https://www.iso.org/committee/48104.html) (language et terminology) since 2015 Member of [ISO/TC 37/SC 2/MA 1](https://www.iso.org/iso-639-language-code#:~:text=Maintenance%20Agency&text=The%20maintenance%20and%20publication%20of,the%20LCA%20for%20Set%201.), the maintenance agency for ISO 639 (language codes) DARIAH EU infrastructure, president of the Board of Directors (2014-2018)

Publications

50388
pedro-ortiz-suarez
Image document

Towards a Cleaner Document-Oriented Multilingual Crawled Corpus

Julien Abadji , Pedro Ortiz Suarez , Laurent Romary , Benoît Sagot
Thirteenth Language Resources and Evaluation Conference - LREC 2022, Jun 2022, Marseille, France
Communication dans un congrès hal-03536361v1
Image document

Ungoliant: An Optimized Pipeline for the Generation of a Very Large-Scale Multilingual Web Corpus

Julien Abadji , Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
CMLC 2021 - 9th Workshop on Challenges in the Management of Large Corpora, Jul 2021, Limerick / Virtual, Ireland. ⟨10.14618/ids-pub-10468⟩
Communication dans un congrès hal-03301590v1
Image document

Establishing a New State-of-the-Art for French Named Entity Recognition

Pedro Javier Ortiz Suárez , Yoann Dupont , Benjamin Muller , Laurent Romary , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02617950v2
Image document

A Monolingual Approach to Contextualized Word Embeddings for Mid-Resource Languages

Pedro Javier Ortiz Suárez , Laurent Romary , Benoît Sagot
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.156⟩
Communication dans un congrès hal-02863875v2
Image document

Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoan Dupont , Laurent Romary
JEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.54-65
Communication dans un congrès hal-02784755v3
Image document

CamemBERT: a Tasty French Language Model

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoann Dupont , Laurent Romary
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.645⟩
Communication dans un congrès hal-02889805v1