Titre : | Fouille de données pour la formalisation et l'optimisation de la conception physique des entrepôts de données relationnels | Type de document : | texte manuscrit | Auteurs : | Benameur Ziani, Auteur ; Youcef Ouinten, Directeur de thèse | Editeur : | Laghouat : Université Amar Telidji - Département d'informatique | Année de publication : | 2016 | Importance : | 175 p. | Format : | 30 cm. | Accompagnement : | 1 disque optique numérique (CD-ROM) | Langues : | Français | Catégories : | THESES :10 informatique
| Mots-clés : | Entrepots de données conception physique schéma en étoile sélection d'indes fragmentation verticale modele de cout motifs fréquents maximaux classification | Résumé : | La conception physique des entrepót de donntes consiste non seulement a la sptciti cation detaillee des données et de leurs types, mais surtodt a la selection des techniqus d'optimisation ((index, fragments etc) approprites susceptibles d'amelioer les perfor mances du systeme en minimisant les temps nécessaire a l'evaluation des requtes Cependant, le choix d'une solution optimisée est une tiche tres difficile nositant non seulement du temps et de l'effort, mais aussi beaucoup d'expertise. Nous pouvona dire que la principale difficulte pour la conception physique réside dans l'énorme espace de recherche des solutions possibles a considérer. Ceci souleve une question importante a savoir comment choisir des structures physiques appropriées pour une charge de re Auop snb Dans cette these, nous nous concentrons sur la recommandation automatique de deux types de structures physiques les index de jointures binaires et les fragments verticaux dans le contexte des entrepots de données relationnels modélisés par un schéma en étoile Plus précisément, nous étudions l'applicabilité de solutions guidées par la fouille de données Nous considérons que les problèmes étudiés peuvent étre formalisés et résolus avec des techniques de la fouille de données Tout d'abord, nous considérons la sélection d'index comme un probleme typique d'er traction des motifs fréquents. Les index sont construits avec des combinaisons d'attributs, vus en tant qu'items Les requltes de la charge de travail, vues comme des transactions, sont décrites par les attributs qu'elles référencent. Le fondement de notre approche est la notion de motifs tréquents maximaux Cette technique permet de découvrir les éven- tuelles corrélations entre les attributs. En évitant la génération des index redondants l'approche proposée conduit a une solution qui exprime l'ensemble des index pertinents de manière plus succincte. La minimisation du nombre d'index pertinents est une direc- tion intéréssante pour minimiser par la mème voie l'espace de stockage requis. D'autre part, les travaux existants ont souvent considére le cout de la charge de travail comme le facterur cle pour recommander une configuration d'index, mime si la configu- ration choisie pourrait etre trés couteuse en terme d'espace de stockage. Contrairement a cette démarche de résolution, nous suggerons de considérer un ensemble de solutions op timisées et nous proposons une métrique d'évaluation permettant d'ameliorer la qualite de la configuration retenue en guidant la prise en considération de certaines configura tions intéressantes que l'on peut négliger Dans la deuxieme partie du travail, nous abordons le probleme de la fragmentation ver- ticale Nous montrons qu'il est simple et etficace d'esploiter les proprietes intéressantes des reprisentations condensées des motifs fréquents afin de fragmenter une table. Nous ser un schema de fragmentation pertinent.la fragmentation verticale dans le contexte des entrepots de données relationnels. Notre motivation est d'aborder un problème encore peu étudie dans la littérature. Inspire par le fait que les requétes dans une charge de travail présente souvent de fortes dépendances, nous proposons une approche basée sur la classification automatique pour fragmenter la table des faits d'un entrepôt de données. La classification envisagée permet de mieux connaltre les références réelles des attributs et offre ainsi un éclairage intéres- sant pouvant aider au processus de la fragmentation. Des modèles de coûts théoriques ont ete egalement proposés pour estimer la pertinence des schémas de fragmentation recommandes | note de thèses : | Thèse de doctorat en informatique |
Fouille de données pour la formalisation et l'optimisation de la conception physique des entrepôts de données relationnels [texte manuscrit] / Benameur Ziani, Auteur ; Youcef Ouinten, Directeur de thèse . - Laghouat : Université Amar Telidji - Département d'informatique, 2016 . - 175 p. ; 30 cm. + 1 disque optique numérique (CD-ROM). Langues : Français Catégories : | THESES :10 informatique
| Mots-clés : | Entrepots de données conception physique schéma en étoile sélection d'indes fragmentation verticale modele de cout motifs fréquents maximaux classification | Résumé : | La conception physique des entrepót de donntes consiste non seulement a la sptciti cation detaillee des données et de leurs types, mais surtodt a la selection des techniqus d'optimisation ((index, fragments etc) approprites susceptibles d'amelioer les perfor mances du systeme en minimisant les temps nécessaire a l'evaluation des requtes Cependant, le choix d'une solution optimisée est une tiche tres difficile nositant non seulement du temps et de l'effort, mais aussi beaucoup d'expertise. Nous pouvona dire que la principale difficulte pour la conception physique réside dans l'énorme espace de recherche des solutions possibles a considérer. Ceci souleve une question importante a savoir comment choisir des structures physiques appropriées pour une charge de re Auop snb Dans cette these, nous nous concentrons sur la recommandation automatique de deux types de structures physiques les index de jointures binaires et les fragments verticaux dans le contexte des entrepots de données relationnels modélisés par un schéma en étoile Plus précisément, nous étudions l'applicabilité de solutions guidées par la fouille de données Nous considérons que les problèmes étudiés peuvent étre formalisés et résolus avec des techniques de la fouille de données Tout d'abord, nous considérons la sélection d'index comme un probleme typique d'er traction des motifs fréquents. Les index sont construits avec des combinaisons d'attributs, vus en tant qu'items Les requltes de la charge de travail, vues comme des transactions, sont décrites par les attributs qu'elles référencent. Le fondement de notre approche est la notion de motifs tréquents maximaux Cette technique permet de découvrir les éven- tuelles corrélations entre les attributs. En évitant la génération des index redondants l'approche proposée conduit a une solution qui exprime l'ensemble des index pertinents de manière plus succincte. La minimisation du nombre d'index pertinents est une direc- tion intéréssante pour minimiser par la mème voie l'espace de stockage requis. D'autre part, les travaux existants ont souvent considére le cout de la charge de travail comme le facterur cle pour recommander une configuration d'index, mime si la configu- ration choisie pourrait etre trés couteuse en terme d'espace de stockage. Contrairement a cette démarche de résolution, nous suggerons de considérer un ensemble de solutions op timisées et nous proposons une métrique d'évaluation permettant d'ameliorer la qualite de la configuration retenue en guidant la prise en considération de certaines configura tions intéressantes que l'on peut négliger Dans la deuxieme partie du travail, nous abordons le probleme de la fragmentation ver- ticale Nous montrons qu'il est simple et etficace d'esploiter les proprietes intéressantes des reprisentations condensées des motifs fréquents afin de fragmenter une table. Nous ser un schema de fragmentation pertinent.la fragmentation verticale dans le contexte des entrepots de données relationnels. Notre motivation est d'aborder un problème encore peu étudie dans la littérature. Inspire par le fait que les requétes dans une charge de travail présente souvent de fortes dépendances, nous proposons une approche basée sur la classification automatique pour fragmenter la table des faits d'un entrepôt de données. La classification envisagée permet de mieux connaltre les références réelles des attributs et offre ainsi un éclairage intéres- sant pouvant aider au processus de la fragmentation. Des modèles de coûts théoriques ont ete egalement proposés pour estimer la pertinence des schémas de fragmentation recommandes | note de thèses : | Thèse de doctorat en informatique |
|