Catalogue des ouvrages Université de Laghouat
A partir de cette page vous pouvez :

Titre : | Automatisation de la détection des spams par la classification | Type de document : | document multimédia | Auteurs : | Khadidja Maroua Benferhat, Auteur ; Youcef Ouinten, Directeur de thèse | Editeur : | Laghouat : Université Amar Telidji - Département d'informatique | Année de publication : | 2012 | Importance : | 55 p. | Accompagnement : | 1 disque optique numérique (CD-ROM) | Note générale : | Option : Réseaux, systèmes et applications réparties | Langues : | Français | Mots-clés : | Spam | Résumé : | L’informatisation des communications a permis d’accroître la vélocité des échanges et les a considérablement enrichis en contenu.Les e-mails sont de plus en plus utilisés par les particuliers et encore plus par les entreprises. Mais comme pour le courrier traditionnel, les utilisateurs ont dû, très rapidement, faire face à des courriers non désirés, ou pourriel (SPAM en anglais), et pour la plupart tout à fait indésirables. Pour contrer ce flot de détritus et ne pas perdre les courriels qui nous sont réellement destinés, il faut automatiser la détection et la destruction de ce type de pollution numérique avec le risque qu’un document soit mal classé.Nous présentons dans ce document une étude sur la caractérisation et la classification des spams. Nous avons effectué une comparaison de trois méthodes de classification qui sont les SVM, Naive Bayes et les arbres de décision C4.5 à l’aide du banc d’essai SpamBase de Machine Learning Repository de l’UCI (University of California Irvin) avec le logiciel de datamining TANAGRA.D’une façon générale nous avons montré que les attributs relatifs aux fréquences des mots clés ont une influence importante sur l’erreur d’apprentissage et que les classifieurs SVM et Naïve Bayes ont des performances relativement proches. Par contre C4.5 est meilleur que les deux autres. | note de thèses : | Mémoire de master en informatique |
Automatisation de la détection des spams par la classification [document multimédia] / Khadidja Maroua Benferhat, Auteur ; Youcef Ouinten, Directeur de thèse . - Laghouat : Université Amar Telidji - Département d'informatique, 2012 . - 55 p. + 1 disque optique numérique (CD-ROM). Option : Réseaux, systèmes et applications réparties Langues : Français Mots-clés : | Spam | Résumé : | L’informatisation des communications a permis d’accroître la vélocité des échanges et les a considérablement enrichis en contenu.Les e-mails sont de plus en plus utilisés par les particuliers et encore plus par les entreprises. Mais comme pour le courrier traditionnel, les utilisateurs ont dû, très rapidement, faire face à des courriers non désirés, ou pourriel (SPAM en anglais), et pour la plupart tout à fait indésirables. Pour contrer ce flot de détritus et ne pas perdre les courriels qui nous sont réellement destinés, il faut automatiser la détection et la destruction de ce type de pollution numérique avec le risque qu’un document soit mal classé.Nous présentons dans ce document une étude sur la caractérisation et la classification des spams. Nous avons effectué une comparaison de trois méthodes de classification qui sont les SVM, Naive Bayes et les arbres de décision C4.5 à l’aide du banc d’essai SpamBase de Machine Learning Repository de l’UCI (University of California Irvin) avec le logiciel de datamining TANAGRA.D’une façon générale nous avons montré que les attributs relatifs aux fréquences des mots clés ont une influence importante sur l’erreur d’apprentissage et que les classifieurs SVM et Naïve Bayes ont des performances relativement proches. Par contre C4.5 est meilleur que les deux autres. | note de thèses : | Mémoire de master en informatique |
|
Réservation
Réserver ce document
Exemplaires
Disponibilité |
---|
CD 254 | CD 254 | CD | BIBLIOTHEQUE DE FACULTE DES SCIENCES | théses (sci) | Disponible |