ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Auteurs : soumettez
votre article en ligne
Autres revues >>

Technique et Science Informatiques

0752-4072
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 21/1 - 2002  - pp.37-63  - doi:10.3166/tsi.21.37-63
TITRE
Nouvelles perspectives en extraction d'information

RÉSUMÉ
L’extraction d’information (EI) est une technologie visant à reconnaître dans un corpus de documents textuels un ensemble d’informations spécifiques, à les extraire et à les structurer dans un format prédéfini. L’EI a connu un essor considérable ces dix dernières années et devrait conduire à des applications industrielles dans un avenir proche. Après une présentation des principes de cette technologie, cet article décrit les travaux menés dans notre groupe sur ce thème. Un système opérationnel, ayant permis d’analyser un corpus de constats d’accidents, y est présenté. Nous montrons ensuite comment les techniques de l’EI peuvent être exploitées pour de nouvelles tâches de l’informatique documentaire : encodage sémantique, aide à la lecture, structuration de documents composites. Enfin nous présentons des travaux en sémantique susceptibles d’améliorer les performances des systèmes actuels.

ABSTRACT
The aim of Information Extraction (IE) consists in recognizing and extracting a specific set of information from a corpus of texts, and structuring it in a predefined format. IE has fostered an increasing interest in the last decade, and is likely to lead to industrial applications in a close future. After a short presentation of the principles of the technology, this paper describes researches performed by our group. An operational system, designed for analysis of car crash reports is presented. Then we show how IE techniques can be used in new tasks of document processing: semantic encoding, reading assistance, composite document structuring. Finally we present some work in semantics aimed to improve the performances of nowadays systems.

AUTEUR(S)
Michel DUPONT, Jean-Marc VUILLAUME, Bernard VICTORRI, Patrice ENJALBERT, Yann MATHET, Nicolas MALANDAIN

Reçu le 7 juin 1999.    Accepté le 10 janvier 2000.

MOTS-CLÉS
traitement automatique des langues, extraction d’information, sémantique, encodage sémantique, informatique documentaire.

KEYWORDS
Natural Language Processing, Information Extraction, Semantics, Semantic Encoding, Information Retrieval.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (888 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier