menu

Home
Présentation
Vocabulaire
Problématique
+ Les clusters d'applications
Les clusters de fichiers
  problématique
  fonctionnement
  conclusion
Conclusion
Liens

Le Power Point ...
Le site web ...


mail:
cedric.lherm@libertysurf.fr

Les clusters de fichiers


Nous allons maintenant nous pencher sur le cas des clusters de fichiers. Ces derniers sont étroitements liés aux clusters d'applications car ils reposent sur les même principes. Je vais donc étudier dans la suite de ce document la métode de fonctionnement d'un outil appelé Mosix et disponible sur les distributions GNU Linux.

Nous allons donc voir les points suivants :
   - problématique
   - fonctionnement
   - conclusion


Problématique

A quoi servent les clusers de fichiers ?

Voici quelques arguments pour opter pour ce type de stockage :
   - sauvegarde de fichiers de très grande taille
   - redondance
   - haute disponibilité
   - accélération des accès
   - ...

Les clusters de fichiers permetttent de partager l'enregistrement physique (sur un disque dur) d'un fichier sur différentes nodes. Ce type de sauvegarde permet une redondance, une haute disponibilité et une garantie d'accès aux données même en cas de panne d'une node.

Tous ces points posent beaucoup de problèmes quant aux méthodes de partage de ces données, aux méthodes de stockage et aux principes d'accès.

Nous allons maintenant voir comment fonctionnent ces applications.


Fonctionnement

Comme nous venons de le voir, ces systèmes permettent d'offrir des services de haute disponibilité et de redondance. Pour ce faire, les serveurs liés à un cluster de fichiers utilisent le même principe que les clusters d'applications, c'est à dire une adresse IP virtuelle discutée en permanence entre les différents serveurs.

Si un serveur connait un problème quelconque, le premier des serveurs disponibles prendra le relais d'une façon totalement transparente pour l'utilisateur final.

Mosix utilise un outil appelé Meta Manager (MM) pour gérer son système de fichiers : MFS (Mosix File System). Cette application gère les fichiers. Elle a pour rôle de contrôler :
   - le partitionnement des fichiers
   - les nodes de rattachement d'un fichier
   - les segments mémoire utilisé
   - la suppression de fichiers
   - la sécurité

Le schéma ci-dessous illustre la méthode de contrôle et de sauvegarde des données sur une node grâce au Meta Manager :
Meta Manager
Ce schéma nous permet de voir que les données gérées par le Meta Manager sont réparties entre les différentes nodes. Celle-ci sont capable de stocker des data segments qui constituent la plus petite unité de stockage comprise entre 1 Moctets et 4 Goctets.

Ces datas segments sont autonomes. Le Meta Manager gère également les correspondances entre les nodes et les datas segments. Ce méchanisme est en quelque sorte comparable aux inodes des systèmes de fichiers des systèmes Unix. C'est à dire qu'à un nom de fichier de l'arborescence, correspond une inode sur le disque dur, ici à un nom de fichier de l'arborescence, correspond une node cliente et un data segment.

Il nous reste maintenant à comprendre comment Mosix accède à ces données. Cette exploitation des informations utilise les mêmes propriétés que celles vues précédemment pour les clusters d'applications.

Cet accès utilise une technique de migration des processus. En quelque sorte, se ne sont pas les données qui sont envoyées sur le poste client, mais le processus s'exécutant sur ce dernier qui est émis vers la node cliente hébergeant les données.

Cet algorithme est vraiment différent et novateur comparé aux autres systèmes de partage de fichiers tel que NFS. Il permet entre autre d'accélérer les performances, et autorise une intéraction continue avec l'utilisateur accédant à ces données.


Conclusion

Ce type de système de fichiers est aujourd'hui extrèmement utilisé par les sociétés désireuses d'effectuer des sauvegardes lourdes et fiables et tout ceci d'une façon rapide et pratique. Voici un comparatif de performances entre les sytèmes de fichiers NFS et MFS :
Block Access Method
Local MFS NFS
1 Ko 14,4 18 162
4 Ko 13,2 15,4 162
8 Ko 13 15 161,6
16 Ko 13 15 162
32 Ko 13,8 15,4 162,8
64 Ko 14,2 16,4 163

Ce tableau présente les temps d'accès en ms, à un fichier dont la taille varie entre 2 et 32 kilo octets de données. La première colone représente le temps lorsque le fichier est stocké localement sur la machine, la seconde présente le temps avec un système de fichiers Mosix (MFS) et la dernière fait référence au système NFS.

Il apparait donc clairement que les temps d'accès des systèmes de fichiers Mosix sont environ 10 fois plus performants que ceux liés au NFS.

Nous allons maintenant pouvoir conclure sur ces différents types de clusters.

Les clusters d'applications Conclusion