Accéder directement au contenu

Pedro Ortiz Suarez

Chercheur à l'équipe de Speech and Language Technology à DFKI GmbH Berlin.
5
Documents
Affiliations actuelles
  • 1143775
  • 258630
Identifiants chercheurs
Contact
Site web
  • https://portizs.eu
  • https://portizs.eu

Présentation

I'm a researcher at the [Speech and Language Technology Team](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) at [DFKI GmbH](https://www.dfki.de/en/web) Berlin. I am interested in [large corpora](https://oscar-corpus.com) for training language models, specially for under resourced languages and historical languages. I am interested in tasks such as Name Entity Recognition (NER), Dependency Parsing and Part-of-Speech tagging, Machine Translation and Document structuration.
Je suis chercheur à l'[équipe de Speech and Language Technology](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) à [DFKI GmbH](https://www.dfki.de/en/web) Berlin. Je m'intéresse aux grands corpus pour l'entraînement de modèles de langue, en particulier pour les langues peu-dotées et les langues historiques. Je suis intéressé par des tâches telles que la reconnaissance d'entités nommées (NER), l'analyse syntaxique, l'étiquetage morpho-syntaxique, la traduction automatique et la structuration de documents.

Domaines de recherche


Publications

yoann-dupont
Image document

Establishing a New State-of-the-Art for French Named Entity Recognition

Pedro Javier Ortiz Suárez , Yoann Dupont , Benjamin Muller , Laurent Romary , Benoît Sagot
LREC 2020 - 12th Language Resources and Evaluation Conference, May 2020, Marseille, France
Communication dans un congrès hal-02617950v2
Image document

SinNer@Clef-Hipe2020 : Sinful adaptation of SotA models for Named Entity Recognition in French and German

Pedro Javier Ortiz Suárez , Yoann Dupont , Gaël Lejeune , Tian Tian
CLEF 2020 Working Notes. Working Notes of CLEF 2020 - Conference and Labs of the Evaluation Forum, Sep 2020, Thessaloniki / Virtual, Greece
Communication dans un congrès hal-02984746v1
Image document

CamemBERT: a Tasty French Language Model

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoann Dupont , Laurent Romary
ACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.645⟩
Communication dans un congrès hal-02889805v1
Image document

Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainement

Louis Martin , Benjamin Muller , Pedro Javier Ortiz Suárez , Yoan Dupont , Laurent Romary
JEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.54-65
Communication dans un congrès hal-02784755v3