ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Auteurs : soumettez
votre article en ligne
Autres revues >>

Technique et Science Informatiques

0752-4072
Revue des sciences et technologies de l'information
 

 ARTICLE VOL 30/10 - 2011  - pp.1247-1270  - doi:10.3166/tsi.30.1247-1270
TITRE
Base de caractérisation des valeurs manquantes

TITLE
Caracterization basis of missing values

RÉSUMÉ

Dans cet article, nous proposons de caractériser les mécanismes d’apparition des valeurs manquantes dans les données. Ce mécanisme a été défini par Little et Rubin, selon un point de vue statistique. Nous montrons d’abord que ces modèles sont difficiles à utiliser pour les techniques de fouille de données actuelles. Nous présentons ensuite comment caractériser le type des valeurs manquantes à l’aide d’une base de règles d’association non redondantes. Cette nouvelle caractérisation permet a priori de recommander des stratégies fines de complétion. Finalement, nous illustrons expérimentalement cette caractérisation sur des données médicales réelles.



ABSTRACT

When tackling real-life datasets, it is common to face the existence of missing values within data. Explaining the origin of the missing values appearance allows to better control the quality of the data, as well as proposing suitable handling methods, e.g., their completion. The abundant literature heavily relies on the missing value appearance models proposed by Little and Rubin. However, a careful scrutiny of these statistic-based models highlights that they constitute an actual hamper towards their use by data mining techniques. The main thrust of this paper is the proposition of a new model for missing values appearance. Such introduced models rely on the use of the proper implication basis.



AUTEUR(S)
Leila BEN OTHMAN, François RIOULT, Sadok BEN YAHIA, Bruno CRÉMILLEUX

MOTS-CLÉS
fouille de données, valeurs manquantes, données incomplètes, règles d’association.

KEYWORDS
data mining, missing values, incomplete data, association rules.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 12.5 €
• Non abonné : 25.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (305 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier