ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Auteurs : soumettez
votre article en ligne
Autres revues >>

Technique et Science Informatiques

0752-4072
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 27/7 - 2008  - pp.851-877  - doi:10.3166/tsi.27.851-877
TITRE
Évaluation de l'analyse sémantique latente et du modèle vectoriel standard appliqués à la langue arabe

RÉSUMÉ
Dans l'objectif d'une amélioration possible des performances des systèmes de recherche d'information pour la langue arabe, nous proposons d'introduire la méthode de l'analyse sémantique latente pour remédier aux problèmes posés par le modèle vectoriel. La présente contribution décrit l'apport des traitements linguistiques et de pondération sur la méthode LSA ainsi qu'une comparaison entre le modèle vectoriel standard et l'approche de l'analyse sémantique latente visant à réduire le nombre de termes d'indexation sur une collection de documents arabes spécialisés dans le domaine de l'environnement. Les résultats de nos expérimentations montrent nettement l'influence positive des traitements linguistiques et des schémas de pondération ainsi qu'une amélioration en faveur de la méthode LSA par rapport au modèle vectoriel standard.


ABSTRACT
In the objective of a possible performance improvement of the Arabic information retrieval systems, we propose to introduce the latent semantic analysis method to cure the problems arising from the vector- space model. The present contribution describes how linguistic processing and weighting schemes could improve the LSA method, and the comparison between the vector-space model and LSA approach, which aim to reduce the index term number of an Arabic corpus specialized in the environment field. The results of our experiments show clearly a positive influence of the linguistic processing and weighting schemes, and LSA improvement compared to the vector-space model.


AUTEUR(S)
Fadoua ATAA ALLAH, Siham BOULAKNADEL, Abderrahim EL QADI, Driss ABOUTAJDINE

MOTS-CLÉS
modèle vectoriel, analyse sémantique latente, langue arabe, pseudo-racinisation.

KEYWORDS
vector-space model, latent semantic analysis, arabic language, stemming.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (324 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier