Accéder directement au contenu

Pedro Ortiz Suarez

Chercheur à l'équipe de Speech and Language Technology à DFKI GmbH Berlin.
1
Documents
Affiliations actuelles
  • 1143775
  • 258630
Identifiants chercheurs
Contact
Site web
  • https://portizs.eu
  • https://portizs.eu

Présentation

I'm a researcher at the [Speech and Language Technology Team](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) at [DFKI GmbH](https://www.dfki.de/en/web) Berlin. I am interested in [large corpora](https://oscar-corpus.com) for training language models, specially for under resourced languages and historical languages. I am interested in tasks such as Name Entity Recognition (NER), Dependency Parsing and Part-of-Speech tagging, Machine Translation and Document structuration.
Je suis chercheur à l'[équipe de Speech and Language Technology](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) à [DFKI GmbH](https://www.dfki.de/en/web) Berlin. Je m'intéresse aux grands corpus pour l'entraînement de modèles de langue, en particulier pour les langues peu-dotées et les langues historiques. Je suis intéressé par des tâches telles que la reconnaissance d'entités nommées (NER), l'analyse syntaxique, l'étiquetage morpho-syntaxique, la traduction automatique et la structuration de documents.

Domaines de recherche


Publications

murielle-fabre
Image document

French Contextualized Word-Embeddings with a sip of CaBeRnet: a New French Balanced Reference Corpus

Murielle Fabre , Pedro Javier Ortiz Suárez , Benoît Sagot , Éric Villemonte de La Clergerie
CMLC-8 - 8th Workshop on the Challenges in the Management of Large Corpora, May 2020, Marseille, France
Communication dans un congrès hal-02678358v1