- 4
Pedro Ortiz Suarez
Chercheur à l'équipe de Speech and Language Technology à DFKI GmbH Berlin.
4
Documents
Affiliations actuelles
- 1143775
- 258630
Identifiants chercheurs
- pedro-ortiz-suarez
- 0000-0003-0343-8852
- Arxiv : ortizsuarez_p_1
- IdRef : 264210743
- VIAF : 59166596794217591423
Site web
- https://portizs.eu
- https://portizs.eu
Présentation
I'm a researcher at the [Speech and Language Technology Team](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) at [DFKI GmbH](https://www.dfki.de/en/web) Berlin.
I am interested in [large corpora](https://oscar-corpus.com) for training language models, specially for under resourced languages and historical languages. I am interested in tasks such as Name Entity Recognition (NER), Dependency Parsing and Part-of-Speech tagging, Machine Translation and Document structuration.
Je suis chercheur à l'[équipe de Speech and Language Technology](https://www.dfki.de/en/web/research/research-departments/speech-and-language-technology) à [DFKI GmbH](https://www.dfki.de/en/web) Berlin.
Je m'intéresse aux grands corpus pour l'entraînement de modèles de langue, en particulier pour les langues peu-dotées et les langues historiques. Je suis intéressé par des tâches telles que la reconnaissance d'entités nommées (NER), l'analyse syntaxique, l'étiquetage morpho-syntaxique, la traduction automatique et la structuration de documents.
Domaines de recherche
Publications
- 1
- 1
- 1
- 1
- 1
- 1
- 4
- 4
- 3
- 3
- 3
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 4
- 3
- 4
- 4
- 4
- 3
|
Building a User-Generated Content North-African Arabizi Treebank: Tackling HellACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.107⟩
Communication dans un congrès
hal-02889804v1
|
|
Les modèles de langue contextuels Camembert pour le français : impact de la taille et de l'hétérogénéité des données d'entrainementJEP-TALN-RECITAL 2020 - 33ème Journées d’Études sur la Parole, 27ème Conférence sur le Traitement Automatique des Langues Naturelles, 22ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2020, Nancy / Virtuel, France. pp.54-65
Communication dans un congrès
hal-02784755v3
|
|
CamemBERT: a Tasty French Language ModelACL 2020 - 58th Annual Meeting of the Association for Computational Linguistics, Jul 2020, Seattle / Virtual, United States. ⟨10.18653/v1/2020.acl-main.645⟩
Communication dans un congrès
hal-02889805v1
|
CamemBERT: a Tasty French Language Model2019
Pré-publication, Document de travail
hal-02445946v1
|