Construction automatique d'adaptateurs guidée par une ontologie pour l'intégration de sources et de données XML
Automatic construction of wrappers guided by an ontology for XML data and sources integration
Le travail décrit dans ce papier porte sur l'intégration de sources d'informations hétérogènes XML au sein d'un serveur d'information selon une approche mixte combinant médiation et entrepôt de données. Ce serveur dispose d'un schéma, ou ontologie, utilisé pour l'accès tant aux sources externes qu'aux données locales. La méthode que nous proposons est une méthode unifiée qui s'appuie sur l'ontologie et permet de réaliser à la fois l'intégration de sources et de données. Notre contribution est double. Elle porte d'une part, sur la génération automatisée de mises en correspondance, ou mappings, entre l'ontologie et une nouvelle source à intégrer, d'autre part, sur la construction automatique d'adaptateurs (wrappers en anglais) allant de la description du contenu abstrait de cette nouvelle source jusqu'à l'extraction des données. Des expérimentations ont été réalisées sur des données réelles dans le domaine du tourisme.
This paper deals with integration of XML heterogeneous information sources into an information server according to an approach combining mediation and data warehousing. A schema, or ontology, is used to access to the external sources and also to the local data. We propose a unified method based on such an ontology able to achieve the two kinds of integration. Our contribution is twofold. First, we propose techniques to automate the generation of mappings between the ontology and a new source. Second, we present an approach to automate the construction of wrappers starting from the description of the abstract content of a source and ending by data extraction. Experiments on real data in the tourism domain have been achieved. Analysis and comments of the results are given.
C.REYNAUD, B.SAFAR
intégration de sources hétérogènes, médiation, entrepôt, ontologie, mappings, adaptateurs, documents XML.
integration of heterogeneous sources, mediation, data warehouse, ontology, mappings, wrappers, XML documents.
Français
|