Catalogue des ouvrages Université de Laghouat
A partir de cette page vous pouvez :

Titre : | Étude statistique des documents web en langue arabe | Type de document : | texte manuscrit | Auteurs : | Abdallah Lakhdari, Auteur ; Hadda Cherroun, Directeur de thèse | Editeur : | Laghouat : Université Amar Telidji - Département d'informatique | Année de publication : | 2013 | Importance : | 99 p | Format : | 27 cm | Accompagnement : | 1 disque optique numérique (CD-ROM) | Langues : | Français | Catégories : | THESES :10 informatique
| Mots-clés : | TALN Linguistique informatique Web Analyse morphologique Langue Arabe Apprentissage automatique Statistique non supervis?ee Mot Racine. | Résumé : | Le Traitement Automatique des Langues Naturelles -TALN-, est un domaine de recherche multidisciplinaire regroupant l'informatique et la linguistique. Ses applications ne cessent de s'accroitre et leurs importances dans notre vie de tous les jours prennent de l'ampleur. Le traitement hiérarchique dans le processus TALN se compose principalement d'analyse morphologique, syntaxique et sémantique. Dans ce travail, nous nous sommes intéressées au niveau "analyse morphologique". Vu que c'est une étape cruciale qui s'intéresse à l'étude de la structure des mots de la langue. En effet, nous avons instrumentée les solutions d'apprentissage automatique non supervisée ainsi qu'aux statistiques pour développer un modèle statistique pour capter les régularités de la structure des mots en langue Arabe. Le modèle statistique a été entrainée à l'aide du corpus OSAC; un corpus composé de milliers de documents Web en langue Arabe comportant plus de 18 millions mots. Nous avons aussi conçu un analyseur morphologique non supervisé pour l'extraction de la racine tri-littérale. Les résultats obtenus montrent que notre analyseur atteint une précision de 65%. Ils sont meilleurs que ceux obtenus par les analyseurs de même catégorie. Ces résultats sont même compétitive avec ceux des analyseurs supervisées exigeants beaucoup de connaissance linguistique couteuses. | note de thèses : | Mémoire de magister en informatique |
Étude statistique des documents web en langue arabe [texte manuscrit] / Abdallah Lakhdari, Auteur ; Hadda Cherroun, Directeur de thèse . - Laghouat : Université Amar Telidji - Département d'informatique, 2013 . - 99 p ; 27 cm + 1 disque optique numérique (CD-ROM). Langues : Français Catégories : | THESES :10 informatique
| Mots-clés : | TALN Linguistique informatique Web Analyse morphologique Langue Arabe Apprentissage automatique Statistique non supervis?ee Mot Racine. | Résumé : | Le Traitement Automatique des Langues Naturelles -TALN-, est un domaine de recherche multidisciplinaire regroupant l'informatique et la linguistique. Ses applications ne cessent de s'accroitre et leurs importances dans notre vie de tous les jours prennent de l'ampleur. Le traitement hiérarchique dans le processus TALN se compose principalement d'analyse morphologique, syntaxique et sémantique. Dans ce travail, nous nous sommes intéressées au niveau "analyse morphologique". Vu que c'est une étape cruciale qui s'intéresse à l'étude de la structure des mots de la langue. En effet, nous avons instrumentée les solutions d'apprentissage automatique non supervisée ainsi qu'aux statistiques pour développer un modèle statistique pour capter les régularités de la structure des mots en langue Arabe. Le modèle statistique a été entrainée à l'aide du corpus OSAC; un corpus composé de milliers de documents Web en langue Arabe comportant plus de 18 millions mots. Nous avons aussi conçu un analyseur morphologique non supervisé pour l'extraction de la racine tri-littérale. Les résultats obtenus montrent que notre analyseur atteint une précision de 65%. Ils sont meilleurs que ceux obtenus par les analyseurs de même catégorie. Ces résultats sont même compétitive avec ceux des analyseurs supervisées exigeants beaucoup de connaissance linguistique couteuses. | note de thèses : | Mémoire de magister en informatique |
|
Réservation
Réserver ce document
Exemplaires
Disponibilité |
---|
Thd 10-16 | Thd 10-16 | Thése | BIBLIOTHEQUE DE FACULTE DES SCIENCES | théses (sci) | Disponible |
th 10-130 | th 10-130 | Thése | SALLE DES THESES bibliothèque centrale | théses en informatique | Disponible |
thpg 10-11 | thpg 10-11 | Thése | SALLE DES THESES bibliothèque centrale | théses en informatique | Disponible |