Accéder directement au contenu

Olivier Teste

6
Documents

Présentation

Mes recherches se situent dans le domaine des systèmes d'informations, et concernent principalement les systèmes de gestion non conventionnelle des données (**Data Management Systems**), et l'apprentissage machine (**Machine Learning**) dans les données massives. L'objet de mes recherches est la donnée numérisée (**Data**) issues de différents systèmes de production et d'acquisition, et les traitements associés visant à intégrer, modéliser et analyser ces données numérisées. Les problématiques étudiées couvrent une large part de la chaîne de traitement des données, allant des processus d'intégration (**Data Matching**) et de modélisation des données (**Data Modeling**) jusqu'à l'analyse des données. Mes recherches portent en particulier sur les masses de données volumineuses, de structuration disparate (structurées à non-structurées), possiblement largement distribuées, pouvant être constituées de contenus atomiques, textuels ou de formes élaborées (espaces multidimensionnels, graphes, séries-temporelles, pixels). Les collections de données sur les quelles mes travaux sont appliqués sont : des données industrielles (aéronautique, assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), des données issues du Web (sites, réseaux sociaux, plateformes collaboratives) et les données ouvertes pouvant être liées sémantiquement (Open Data, Ontologies, Linked Data). Ces masses de données sont exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, la détection d'anomalies, l'aide au diagnostics... Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage machine (**Machine Learning**) et des réseaux de neurones artificiels (**Deep Learning**). Ces algorithmes permettent de détecter et de prédire des phénomènes complexes cachés au sein des masses de données, afin de construire des systèmes d'intelligence artificielle.

Publications

"jerome-darmont"
Image document

Dimensional Data KNN-Based Imputation

Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste
26th European Conference on Advances in Databases and Information Systems (ADBIS 2022), Sep 2022, Turin, Italy. pp.315-329, ⟨10.1007/978-3-031-15740-0_23⟩
Communication dans un congrès hal-03795165v1
Image document

Automatic Machine Learning-based OLAP Measure Detection for Tabular Data

Yuzhao Yang , Fatma Abdelhedi , Jérôme Darmont , Franck Ravat , Olivier Teste
24th International Conference on Big Data Analytics and Knowledge Discovery (DaWaK 2022), Aug 2022, Vienna, Austria. pp.173-188, ⟨10.1007/978-3-031-12670-3_15⟩
Communication dans un congrès hal-03668454v1
Image document

An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses

Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste
25th International Database Engineering & Applications Symposium (IDEAS 2021), Jul 2021, Montreal, Canada. pp.232-241, ⟨10.1145/3472163.3472268⟩
Communication dans un congrès hal-03265061v1
Image document

Internal Data Imputation in Data Warehouse Dimensions

Yuzhao Yang , Fatma Abdelhedi , Jérôme Darmont , Franck Ravat , Olivier Teste
32nd International Conference on Database and Expert Systems Applications (DEXA 2021), Sep 2021, Linz, Austria. pp.237-244, ⟨10.1007/978-3-030-86472-9_22⟩
Communication dans un congrès hal-03265060v1
Image document

Automatic Integration Issues of Tabular Data for On-Line Analysis Processing

Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste
16e journées EDA Business Intelligence & Big Data (EDA 2020), Aug 2020, Lyon, France. pp.5-18
Communication dans un congrès hal-02889486v2