Compression de phrases par élagage de leur arbre morpho-syntaxique. Une première application sur les phrases narratives
Nous proposons une technique de contraction de phrases qui se fonde sur l’étude de
la fonction syntaxique et de la position dans l’arbre syntaxique des constituants des phrases.
Nous définissons et analysons la perte de contenu et de cohérence discursive que la suppression
de constituants engendre. Notre méthode de contraction s’oriente vers les textes narratifs.
Nous sélectionnons les constituants à supprimer avec un système de règles utilisant les arbres
et variables de l’analyse morpho-syntaxique de SYGFRAN. Nous commentons les résultats obtenus
sur un texte narratif court, totalement analysé, ce qui nous mène à poser le problème
de l’évaluation quantitative des résultats d’une telle approche, par opposition à des résultats
qualitatifs. La technique dépendant très fortement de la qualité de l’analyse, la question de la
compression par élagage apparaît comme intimement subordonnée à l’évaluation de l’analyse
syntaxique.
We propose a sentence compression technique which uses constituents syntactic func tion and position in the sentence syntactic tree. We analyze contents and discourse consistency losses caused by deleting such constituents. We explain why our method works best with narrative texts. With a rule-based system using SYGFRAN's morpho-syntactic analysis for French, we select removable constituents. We discuss the results obtained on a short narrative text, which has been completely analyzed. This rises the problem of quantitative versus qualitative evaluation. Since our technique is highly dependant on the quality of syntactic analysis, summarizing through pruning seems intimately intermeshed with parsing evaluation.
M.YOUSFI-MONOD, V.PRINCE
résumé automatique, compression de phrases, analyse syntaxique.
automatic summarization, sentence compression, syntactic analysis.
Français
|