Titre : | Fouille de motifs : formalisation et unification | Type de document : | texte manuscrit | Auteurs : | Slimane Oulad Naoui, Auteur ; Hadda Cherroun, Directeur de thèse ; Djelloul Ziadi, Directeur de thèse | Editeur : | Laghouat : Université Amar Telidji - Département d'informatique | Année de publication : | 2017 | Importance : | 125 p | Format : | 27 cm | Accompagnement : | 1 disque optique numérique (CD-ROM) | Langues : | Français | Catégories : | THESES :10 informatique
| Mots-clés : | Fouille de données Motifs fréquents Séries formelles Automates à multiplicité Unification d’algorithmes | Résumé : | Durant les deux dernières décennies, un travail considérable a été consacré aux aspects algorithmiques de la fouille de motifs fréquents, ce qui a donné naissance à un nombre phénoménal d’algorithmes et d’implémentations associées où chacun prétend la prééminence. Parallèlement, il est généralement admis par la communauté que le développement d’une théorie unificatrice est une des questions ouvertes et les plus intéressantes dans la sphère de recherche en fouille de données. Aussi, la première motivation de notre travail dans cette thèse est l’introduction d’un formalisme de haut niveau pour ce problème fondamental, qui induit une vision unifiée des approches algorithmiques développées jusque-là. Un des traits remarquables de notre modèle est qu’il prend en charge de manière intrinsèque les aspects à la fois qualitatifs et quantitatifs de ce problème basique, traités antérieurement toujours de manière séparée. En effet, nous formalisons ce problème à l’aide d’un modèle reposant sur les séries formelles. Après avoir encodé les motifs comme des mots sur un alphabet ordonné, nous exprimons ce problème par une série formelle sur le semi-anneau de comptage (N;+;×;0;1), dont l’étendu représente les motifs et les coefficients sont leurs supports. L’objectif est triple : primo, la définition d’un cadre théorique clair, unifié et extensible à travers lequel nous pouvons reproduire les principales approches de fouille de motifs fréquents de l’état de l’art; secundo, la preuve d’un lien approprié entre la déterminisation de l’automate à multiplicité représentant une base de transactions et le calcul de la collection associée de motifs fréquents; finalement, la mise en œuvre et l’évaluation d’une première implémentation, via des automates à multiplicités, de notre formalisme que nous baptisons WAFI (pour Weighted Automata Frequent Itemset mining algorithm). Les résultats obtenus montrent le bien fondé et l’adéquation de notre modèle. | note de thèses : | Thèse de doctorat en informatique |
Fouille de motifs : formalisation et unification [texte manuscrit] / Slimane Oulad Naoui, Auteur ; Hadda Cherroun, Directeur de thèse ; Djelloul Ziadi, Directeur de thèse . - Laghouat : Université Amar Telidji - Département d'informatique, 2017 . - 125 p ; 27 cm + 1 disque optique numérique (CD-ROM). Langues : Français Catégories : | THESES :10 informatique
| Mots-clés : | Fouille de données Motifs fréquents Séries formelles Automates à multiplicité Unification d’algorithmes | Résumé : | Durant les deux dernières décennies, un travail considérable a été consacré aux aspects algorithmiques de la fouille de motifs fréquents, ce qui a donné naissance à un nombre phénoménal d’algorithmes et d’implémentations associées où chacun prétend la prééminence. Parallèlement, il est généralement admis par la communauté que le développement d’une théorie unificatrice est une des questions ouvertes et les plus intéressantes dans la sphère de recherche en fouille de données. Aussi, la première motivation de notre travail dans cette thèse est l’introduction d’un formalisme de haut niveau pour ce problème fondamental, qui induit une vision unifiée des approches algorithmiques développées jusque-là. Un des traits remarquables de notre modèle est qu’il prend en charge de manière intrinsèque les aspects à la fois qualitatifs et quantitatifs de ce problème basique, traités antérieurement toujours de manière séparée. En effet, nous formalisons ce problème à l’aide d’un modèle reposant sur les séries formelles. Après avoir encodé les motifs comme des mots sur un alphabet ordonné, nous exprimons ce problème par une série formelle sur le semi-anneau de comptage (N;+;×;0;1), dont l’étendu représente les motifs et les coefficients sont leurs supports. L’objectif est triple : primo, la définition d’un cadre théorique clair, unifié et extensible à travers lequel nous pouvons reproduire les principales approches de fouille de motifs fréquents de l’état de l’art; secundo, la preuve d’un lien approprié entre la déterminisation de l’automate à multiplicité représentant une base de transactions et le calcul de la collection associée de motifs fréquents; finalement, la mise en œuvre et l’évaluation d’une première implémentation, via des automates à multiplicités, de notre formalisme que nous baptisons WAFI (pour Weighted Automata Frequent Itemset mining algorithm). Les résultats obtenus montrent le bien fondé et l’adéquation de notre modèle. | note de thèses : | Thèse de doctorat en informatique |
|