Jorge Garcia Flores
14
Documents
Présentation
I am a [CNRS](http://www.cnrs.fr) research engineer working for the [LIPN](https://lipn.univ-paris13.fr) lab at [Paris University 13](https://www.univ-paris13.fr/). I work on Natural Language Processing (NLP) methods and applications for digital humanities, robotics and literature at the Knowledge Representations and Natural Language (RCLN) research team.
As an engineer, I lead software development projects on information extraction, semantic annotation, and linguistic data visualization. I maintain as well the GPU cluster of my research team, dedicated to the development of Deep Learning based NLP methods.
As a researcher, I work in two directions: first, the automatic generation of short stories, whether for a very concrete goal, like the production of a robot experience stories where a service robot becomes capable of summarizing his recent activity in natural language, whether for more artificial intelligence related purposes, like the development of methods and resources for the automatic generation of literary short stories. And secondly, I work on semantic mining method of biographical web search results based on reinforcement learning: the goal being to assist sociological studies on highly qualified migrations with NLP.
Je suis ingénieur de recherche [CNRS](http://www.cnrs.fr/) au sein de l'équipe Représentation de Connaissances et Langage Naturel (RCLN) du [Laboratoire d'Informatique de Paris Nord](http://lipn.univ-paris13.fr) (LIPN) à l'Université Paris 13. Mes travaux concernent essentiellement le Traitement Automatique des Langues (TAL) et ses applications aux humanités numériques, à la robotique et à la littérature.
En tant qu'ingénieur, j'encadre des ingénieurs développeurs, des doctorants et des stagiaires en informatique autour de la conception et l'implémentation de systèmes de TAL comme l'extraction d'information, l'annotation sémantique et la visualisation de données linguistiques. Je suis également responsable du cluster GPU de mon équipe de recherche. Ce cluster, dédié principalement à la mise en place d'expériences basées sur des méthodes d'apprentissage profond (*Deep Learning*), fournit également une plate-forme pour l'expérimentation et le déploiement pour toutes sortes de système TAL.
En tant que chercheur, je m'investis actuellement dans deux thématiques : d'une part, la génération de récits narratifs, soit pour des applications bien concrètes, comme la production de récits d'expériences pour un robot de service (capable de faire une synthèse en langage naturel de son activité récente), soit pour le développement de ressources et méthodes plus proches de l'intelligence artificielle, comme la génération de récits littéraires courts. D'autre part, je m'intéresse à la fouille sémantique du web pour les humanités numériques : je coordonne un projet en cours où nous réalisons où nous réalisons une cartographie des migrations latino-américaines hautement qualifiées à partir des traces biographiques trouvées par une méthode d'apprentissage par renforcement des résultats d'un moteur de recherche.
Publications
|
Robot Experience Stories: first person generation of robotic task narratives in SitLogJournal of Intelligent and Fuzzy Systems, 2018, Intelligent and Fuzzy Systems applied to Language & Knowledge Engineering, 34 (5), pp.3291-3300. ⟨10.3233/JIFS-169511⟩
Article dans une revue
hal-03408974v1
|
Blog annotation: from corpus analysis to automatic tag suggestionResearch in Computing Science, 2016, Special Issue: Advances in Opinion Mining, Social Network Analysis, and Authorship Attribution, 110, pp.95-106
Article dans une revue
hal-01495833v1
|
|
Saucissonnage of Long Sequences into a Multi-encoder for Neural Text Summarization with TransformersExtraction et Gestion des Connaissances (EGC), Montpellier, France,, Jan 2021, Montpellier, France
Communication dans un congrès
hal-04090684v1
|
|
Towards Identifying for Evidence of Drain Brain from Web Search Results using Reinforcement LearningLatinX in AI Research Workshop at the 33rd Conference on Neural Information Processing Systems (NeurIPS 2019), Vancouver, Canada., Dec 2019, Vancouver, Canada
Communication dans un congrès
hal-02505993v1
|
Controlling the drift of semantic indexing systems10th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (KEOD 2018), Sep 2018, Sevilla, Spain. pp.199-206, ⟨10.5220/0006926501990206⟩
Communication dans un congrès
hal-02080678v1
|
|
Mesurer la qualité des systèmes de catégories de blogs28es Journées francophones d'Ingénierie des Connaissances IC 2017, Jul 2017, Caen, France. pp.217-222
Communication dans un congrès
hal-01570293v1
|
|
|
Author Identification Using Latent Dirichlet Allocation18th International Conference on Computational Linguistics and Intelligent Text Processing, CICLing 2017, Apr 2017, Budapest (Hungary)., Hungary. pp.303-312, ⟨10.1007/978-3-319-77116-8_22⟩
Communication dans un congrès
hal-03907314v1
|
Blog annotation: from corpus analysis to automatic tag suggestion17th International Conference on Intelligent Text Processing and Computational Linguistics, Apr 2016, Konya, Turkey
Communication dans un congrès
halshs-01869917v1
|
|
A French weblog corpus for new insights on blog post tagging8th International Conference on Corpus Linguistics , Mar 2016, Malaga, Spain
Communication dans un congrès
hal-01358274v1
|
|
Blog annotation: from corpus analysis to automatic tag suggestion17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLING 2016), Pascale Fung; Tomas Mikolov; Simone Teufel; Piek Vossen, Apr 2016, Konya, Turkey
Communication dans un congrès
hal-01358328v1
|
|
|
LIPN: Introducing a new Geographical Context Similarity Measure and a Statistical Similarity Measure based on the Bhattacharyya coefficientSemEval 2014, Aug 2014, Dublin, Ireland. pp.400-405
Communication dans un congrès
hal-01068277v1
|
|
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based FeaturesSecond Joint Conference on Lexical and Computational Semantics, Jun 2013, Atlanta, United States. pp.63
Communication dans un congrès
hal-00825054v1
|
ChêneTALPlateforme d’expérimentation sur des outils de traitement automatique des langues et d’intelligence artificielleJournée plateformes USPN, Feb 2022, Bobigny, France
Poster de conférence
hal-03772101v1
|
|
Recommandations sur l'analyse automatique de documents : acquisition, gestion, exploration[Rapport de recherche] Comité pour la science ouverte. 2019, 12 p
Rapport
hal-03586079v1
|