CV Accueil - Archive ouverte HAL

Présentation

Mes recherches se situent dans le domaine des systèmes d'informations, et concernent principalement les systèmes de gestion non conventionnelle des données (**Data Management Systems**), et l'apprentissage machine (**Machine Learning**) dans les données massives. L'objet de mes recherches est la donnée numérisée (**Data**) issues de différents systèmes de production et d'acquisition, et les traitements associés visant à intégrer, modéliser et analyser ces données numérisées. Les problématiques étudiées couvrent une large part de la chaîne de traitement des données, allant des processus d'intégration (**Data Matching**) et de modélisation des données (**Data Modeling**) jusqu'à l'analyse des données. Mes recherches portent en particulier sur les masses de données volumineuses, de structuration disparate (structurées à non-structurées), possiblement largement distribuées, pouvant être constituées de contenus atomiques, textuels ou de formes élaborées (espaces multidimensionnels, graphes, séries-temporelles, pixels). Les collections de données sur les quelles mes travaux sont appliqués sont : des données industrielles (aéronautique, assurance, énergie, biologie, santé), des benchmarks scientifiques (OAEI, SSB, TPC-H...), des données issues du Web (sites, réseaux sociaux, plateformes collaboratives) et les données ouvertes pouvant être liées sémantiquement (Open Data, Ontologies, Linked Data). Ces masses de données sont exploitables pour aider aux processus de décision dans des domaines d'application variés tels que la maintenance prédictive, la détection d'anomalies, l'aide au diagnostics... Mes recherches s'inscrivent dans le cadre de la science des données, et traitent des algorithmes d'apprentissage machine (**Machine Learning**) et des réseaux de neurones artificiels (**Deep Learning**). Ces algorithmes permettent de détecter et de prédire des phénomènes complexes cachés au sein des masses de données, afin de construire des systèmes d'intelligence artificielle.

	Dimensional Data KNN-Based Imputation Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste 26th European Conference on Advances in Databases and Information Systems (ADBIS 2022), Sep 2022, Turin, Italy. pp.315-329, ⟨10.1007/978-3-031-15740-0_23⟩ Communication dans un congrès hal-03795165v1
	Automatic Machine Learning-based OLAP Measure Detection for Tabular Data Yuzhao Yang , Fatma Abdelhedi , Jérôme Darmont , Franck Ravat , Olivier Teste 24th International Conference on Big Data Analytics and Knowledge Discovery (DaWaK 2022), Aug 2022, Vienna, Austria. pp.173-188, ⟨10.1007/978-3-031-12670-3_15⟩ Communication dans un congrès hal-03668454v1
	An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste 25th International Database Engineering & Applications Symposium (IDEAS 2021), Jul 2021, Montreal, Canada. pp.232-241, ⟨10.1145/3472163.3472268⟩ Communication dans un congrès hal-03265061v1
	Internal Data Imputation in Data Warehouse Dimensions Yuzhao Yang , Fatma Abdelhedi , Jérôme Darmont , Franck Ravat , Olivier Teste 32nd International Conference on Database and Expert Systems Applications (DEXA 2021), Sep 2021, Linz, Austria. pp.237-244, ⟨10.1007/978-3-030-86472-9_22⟩ Communication dans un congrès hal-03265060v1
	Automatic Integration Issues of Tabular Data for On-Line Analysis Processing Yuzhao Yang , Jérôme Darmont , Franck Ravat , Olivier Teste 16e journées EDA Business Intelligence & Big Data (EDA 2020), Aug 2020, Lyon, France. pp.5-18 Communication dans un congrès hal-02889486v2

Olivier Teste

Présentation

Publications

Dimensional Data KNN-Based Imputation

Automatic Machine Learning-based OLAP Measure Detection for Tabular Data

An Automatic Schema-Instance Approach for Merging Multidimensional Data Warehouses

Internal Data Imputation in Data Warehouse Dimensions

Automatic Integration Issues of Tabular Data for On-Line Analysis Processing

ADOC, Variété des données SHS