Imitation dans le cadre des systèmes de classeurs
Dans cet article, nous étudions les moyens de mise en oeuvre d’un processus d’apprentissage
par imitation permettant d’aider l’apprentissage dans le cadre des systèmes de
classeurs. Il s’agit de méthodes d’apprentissage par renforcement utilisant des algorithmes
évolutionnaires pour générer une population de règles condition-action. Nous présentons trois
approches de la prise en compte d’un comportement observé : deux avec une modélisation de
ce comportement, et une sans modèle. Ces approches sont évaluées dans différents environnements
lorsqu’elles sont appliquées à trois systèmes de classeurs majeurs : ZCS, XCS et ACS. Les
résultats obtenus sont analysés et discutés. Ils mettent en évidence l’importance de la modélisation
du comportement observé pour une imitation efficace. Ils montrent, de plus, les avantages
d’intégrer cette modélisation par une action interne spécialisée.
In this paper, we study the means of developing an imitation learning process allowing to improve learning in the framework of learning classifier systems. It consists on reinforcement learning methods applying evolutionnary methods to develop a set of condition-action rules. We present three approaches of the taking into account of an observed behavior: two approaches using a model of this behavior, and one without modelling. These approaches are evaluated in different environments when they are applied to three major classifier systems: ZCS, XCS and ACS. Obtained results are analyzed and discussed. They highlight the importance of using a model of the observed behavior to enable an efficient imitation. They show the advantages of taking this model into account by a specialized internal action.
M.MÉTIVIER, C.LATTAUD
Reçu le 21 mars 2005.
Accepté le 20 février 2006.
imitation, systèmes de classeurs, ZCS, XCS, ACS, guidage.
imitation, learning classifier systems, ZCS, XCS, ACS, guidance.
Français
|