Catalogue des ouvrages Université de Laghouat
A partir de cette page vous pouvez :

Titre : | Détection automatique de plagiat | Type de document : | texte manuscrit | Auteurs : | El Moatez Bellah Nagoudi, Auteur ; Hadda Cherroun, Directeur de thèse | Editeur : | Laghouat : Université Amar Telidji - Département d'informatique | Année de publication : | 2019 | Importance : | 113 p. | Format : | 30 cm. | Accompagnement : | 1 disque optique numérique (CD-ROM) | Langues : | Français | Catégories : | THESES :10 informatique
| Mots-clés : | Plagiat textuel Détection du plagiat Plagiat dissimulé Traitement automatique de la langue Langue arabe | Résumé : | Dans cette thèse, nous nous intéressons au problème de détection du plagiat. Le phénomène du plagiat s'aggrave de plus en plus avec l'intensification de l'utilisation des technologies de l'information et de la communication. Bien que le problème sem- ble une simple recherche de similarité entre textes, chose que la machine est supposée avoir bien géré, il s'avère qu'il est plus difficile de faire face à certaines formes dis- simulées de plagiat telles que la traduction, la substitution des mots par des synonymes, le changement de la structure des textes ou la reformulation des passages. Cela rend les systèmes classiques de détection du plagiat de moins en moins fiables. En effet, le role d'un système de détection du plagiat est de faire face à toutes ces offuscations. Très peu de recherches dans ce contexte ont été appliquées pour la langue arabe, et même les travaux abordés sont incomparables à ce qui se fait pour les autres langues. De ce fait, nous nous intéressons dans cette thèse à la détection du copier- coller ainsi qu'a plusieurs autres formes de plagiat dissimulé principalement pour les documents en langue arabe. Premièrement, nous avons proposé deux approches de détection de similarités sémantiques monolingue (arabe arabe) et translingue (arabe-anglais) basées sur les plongements de mots (word embeddings) et la pondération fréquentielle et mor- phosyntaxique des vecteurs de mots. Puis, nous avons également proposé tèmes de détection du plagiat dans les documents en langue arabe. Le premier système est basé sur la technique d'empreinte digitale et les word embeddings afin de détecter les différentes formes dissimulées de plagiat. Notre deuxième système fait appel aux tech- xnap niques d'apprentissage automatique supervisé. Nos expérimentations sont menées sur le corpus de test de la première campagne d'évaluation de détection du plagiat dédiée à la langue arabe AraPlagDet. Toutes nos approches ont donné des résultats très satisfaisants par rapport à ceux proposés dans la littérature avec un PlagDet de 87% et un rappel dépassant les 92%. | note de thèses : | Thése de doctorat en informatique |
Détection automatique de plagiat [texte manuscrit] / El Moatez Bellah Nagoudi, Auteur ; Hadda Cherroun, Directeur de thèse . - Laghouat : Université Amar Telidji - Département d'informatique, 2019 . - 113 p. ; 30 cm. + 1 disque optique numérique (CD-ROM). Langues : Français Catégories : | THESES :10 informatique
| Mots-clés : | Plagiat textuel Détection du plagiat Plagiat dissimulé Traitement automatique de la langue Langue arabe | Résumé : | Dans cette thèse, nous nous intéressons au problème de détection du plagiat. Le phénomène du plagiat s'aggrave de plus en plus avec l'intensification de l'utilisation des technologies de l'information et de la communication. Bien que le problème sem- ble une simple recherche de similarité entre textes, chose que la machine est supposée avoir bien géré, il s'avère qu'il est plus difficile de faire face à certaines formes dis- simulées de plagiat telles que la traduction, la substitution des mots par des synonymes, le changement de la structure des textes ou la reformulation des passages. Cela rend les systèmes classiques de détection du plagiat de moins en moins fiables. En effet, le role d'un système de détection du plagiat est de faire face à toutes ces offuscations. Très peu de recherches dans ce contexte ont été appliquées pour la langue arabe, et même les travaux abordés sont incomparables à ce qui se fait pour les autres langues. De ce fait, nous nous intéressons dans cette thèse à la détection du copier- coller ainsi qu'a plusieurs autres formes de plagiat dissimulé principalement pour les documents en langue arabe. Premièrement, nous avons proposé deux approches de détection de similarités sémantiques monolingue (arabe arabe) et translingue (arabe-anglais) basées sur les plongements de mots (word embeddings) et la pondération fréquentielle et mor- phosyntaxique des vecteurs de mots. Puis, nous avons également proposé tèmes de détection du plagiat dans les documents en langue arabe. Le premier système est basé sur la technique d'empreinte digitale et les word embeddings afin de détecter les différentes formes dissimulées de plagiat. Notre deuxième système fait appel aux tech- xnap niques d'apprentissage automatique supervisé. Nos expérimentations sont menées sur le corpus de test de la première campagne d'évaluation de détection du plagiat dédiée à la langue arabe AraPlagDet. Toutes nos approches ont donné des résultats très satisfaisants par rapport à ceux proposés dans la littérature avec un PlagDet de 87% et un rappel dépassant les 92%. | note de thèses : | Thése de doctorat en informatique |
|
Réservation
Réserver ce document
Exemplaires
Disponibilité |
---|
Thd 10-39 | Thd 10-39 | Thése | BIBLIOTHEQUE DE FACULTE DES SCIENCES | théses (sci) | Disponible |
thed 10-11 | thed 10-11 | Thése | SALLE DES THESES bibliothèque centrale | théses en informatique | Disponible |