Ce projet de recherche doctorale est publié a été réalisé par Amal El Fallah Seghrouchni

Description d'un projet de recherche doctoral

ADS2 : Vers une Supervision Adaptative des Systèmes Distribués

Mots clés :

Résumé du projet de recherche (Langue 1)

A l'instar des être vivants, les systèmes informatiques sont sujets à de nombreuses perturbations. Sans mécanisme de protection, celles-ci peuvent entrainer de graves dysfonctionnements. Pour palier à ce problème, de nombreux modèles portant sur la redondance et/ou le recouvrement (diagnostic et réparation) dans les systèmes informatiques sont étudiés par la communauté scientifique. Dans le cadre de ma thèse, nous nous intéressons plus particulièrement au cas des {{systèmes distribués asynchrones}} avec {{pannes franches}} et {{communications non fiables}} (comportements byzantins non considérés). Mon travail de recherche vise à concevoir un système de supervision qui permettre de Détecter, Isoler, Diagnostiquer et Réparer automatiquement un sous-ensemble des différentes fautes survenant au sein d'un tel système dans le but d'obtenir un système (supervisé + superviseur) autoguérissant. Dans ce contexte, nous proposons un {{système de supervision adaptatif}} reposant sur une architecture multi-agent. Chaque agent supervise la région du système où il est déployé. Chaque agent est autonome et doté de capacité de diagnostic et de réparation. Nous définisons un processus décisionnel qui permet à chaque agent de prendre une décision à tout moment en fonction de l'état du système. Cette décision repose sur un compromis entre le fait d'échanger des informations avec les autres agents du système (couteux en temps mais améliorant la fiabilité du diagnostic) et le fait de décider unilatéralement de l'action à entreprendre. Ainsi, à haut niveau, le comportement du superviseur passe automatiquement d'un fonctionnement quasi-centralisé (quand les coûts de communications sont faibles) à un fonctionnement distribué (lorsque les coûts de communications varient au cours du temps). Nous avons identifié 3 points clés pour l’obtention d’une telle architecture de supervision : (1) le modèle décisionnel des agents, (2) le mécanisme d’inférence pour l’établissement d’un diagnostic, et (3) le mécanisme qui permet de maintenir une vision cohérente de l’état du système par les agents. Nos travaux abordent ces différents points.