Un protocole de tolérance aux pannes pour objets actifs non préemptifs
Les protocoles de points de reprises induits par messages semblent être l'approche la plus adaptée aux applications s'exécutant sur des systèmes hétérogènes avec un faible taux de panne. Mais ces protocoles supposent qu'il soit toujours possible de prendre un point de reprise de manière préemptive, avant la prise en compte d'un message. Nous proposons donc, dans le cadre d'un modèle à objets actifs, un protocole de tolérance aux pannes par points de reprise induits par messages adapté à la non-préemptivité des processus. A la différence de nombreux protocoles existants, ce protocole assure la cohérence forte des lignes de recouvrement formées, et permet une reprise complètement asynchrone du système réparti en cas de panne.
Communication induced checkpointing protocols seem to be the most adapted approach for applications running on heterogenenous systems with low failure rate. However, these protocols make the assumption that it is always possible to preemptively trigger a checkpoint before delivering a message.We offer, within the framework of an active objects model, a communication induced checkpointing protocol, adapted to the non-preemptibility of processes. Unlike many protocols, this one ensures strong consistency of recovery lines, and enables a fully asynchronous recovery of the distributed system after a failure.
F.BAUDE, D.CAROMEL, C.DELBÉ, L.HENRIO
tolérance aux pannes, points de reprise, journalisation de messages, objets actifs.
fault tolerance, checkpointing, message logging, active objects.
Français
|