Le Grid Computing

Définitions

Des définitions différentes...

Il n'existe pas de définitions très précises des grilles de calcul.

  • Plaszczak/Wellner définissent la grille de calcul comme la technologie qui permet la virtualisation de ressource à la demande, et le partage entre plusieurs organisations.
  • IBM définit le calcul en grille comme une méthode utilisant une panoplie de protocoles standards pour avoir l'accès aux applications et aux données, à la puissance de calcul, à la capacité de stockage entre un vaste réseau de ressources informatiques à travers Internet.
  • Une autre définition de la grille de calcul est donnée par Fernando Corbató du MIT. Lui et les autres concepteurs du système d'exploitation Multics envisageait le système comme une enterprise fournisseur d'énergie une une compagnie des eaux.
  • Buyya définit la grille comme un type de système parallèle et distribué qui permet le partage, la sélection, et l'aggrégation de ressources autonomes géographiquement distribués dynamiquement. Chacune de ces ressources ont leur propre disponibilité, capacité, performance, coût, et utilisateurs, avec leurs propres contraintes de qualité de service. [1]
  • Le CERN (European Organization for Nuclear Research), un des plus gros consommateurs de puissance de calcul à travers la technologie du Grid Computing, la définit comme un service pour le partage de puissance informatique et de capacité de stockage à travers l'Internet. [2]
  • Mais la définition finale est fournie par Ian Foster dans son article "What is a Grid? A Three Point Checklist" [3] .
    Les trois points qu'il définit sont:
    • Des ressources informatiques dont leur administration n'est pas centralisée,
    • Des méthodes utilisées qui sont standardisées,
    • Des ressources dont la qualité de service n'est pas assurée.


    ...Mais des principes communs

    Le Grid Computing, également appelé calcul partagé ou calcul distribué, consiste à exploiter pleinement les ressources de l'intégralité d'un parc informatique (serveurs et PC) , c'est une forme d'informatique distribuée, basée sur le partage dynamique des ressources entre des participants, des organisations et des entreprises dans le but de pouvoir les mutualiser, et faire ainsi exécuter des applications de calcul intensif ou des traitements de très gros volumes de données.

    Composés de ressources, ces dernières sont potentiellement qualifiées de :

  • Partagées : elles sont mises à la disposition des différents consommateurs de la grille et éventuellement pour différents usages applicatifs.
  • Distribuées : elles sont situées dans des lieux géographiques différents.
  • Hétérogènes : elles sont de toute nature, différant par exemple par le système d'exploitation ou le système de gestion des fichiers.
  • Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs ordonnanceurs.
  • Externalisées : les ressources sont accessibles à la demande chez un fournisseur externe.
  • Non-contrôlées (ou autonomes) : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle.