Ceci est la troisième partie d'une série de blogs en cinq parties qui examinera de plus près notre nouveau suite de services de données Cela aidera nos clients à simplifier radicalement la gestion des données de fichiers à grande échelle. Nous avons parlé de Performances en cache NVMe et Balance dynamique Qumulo dans les messages précédents. Ici, nous fournissons un aperçu de Qumulo Instant Upgrade. Les prochains blogs de cette série approfondiront les autres nouveaux services de données inclus dans cette annonce.

Qumulo Instant Upgrade automatise les mises à niveau logicielles, ce qui vous permet d'accéder facilement aux dernières fonctionnalités, aux améliorations de sécurité et de performances

Les administrateurs informatiques ont toujours redouté le processus de planification et d'exécution des mises à niveau, sans parler de la mise en place de plans de restauration en cas de panne. Pourtant, une mise à niveau est nécessaire pour tirer parti des nouvelles fonctionnalités, de nouvelles améliorations des performances et pour maintenir la sécurité du système contre les dernières menaces de cybersécurité.

Le problème: un choix entre la perturbation et le temps

Historiquement, les stratégies de mise à niveau des systèmes d'infrastructure à grande échelle sont tombées dans deux camps:

  1. Mise à niveau continue - un seul nœud est mis hors ligne, mis à niveau, remis en ligne, puis la mise à niveau passe au nœud suivant. Le temps total de mise à niveau d'un système augmente linéairement avec la taille du système. Les mises à niveau progressives peuvent prendre des heures, voire des jours, à se terminer dans de très grands clusters. Et, en cas d'échec de la mise à niveau de certains des nœuds du processus, un plan de restauration est nécessaire pour revenir à la configuration d'origine. Ceci est extrêmement long et très risqué pour l'intégrité du système et reste dans une fenêtre de maintenance si une restauration est nécessaire.
  2. Mise à jour simultanée - tous les nœuds de stockage sont mis à niveau en même temps.
    Cela nécessite généralement un temps d'arrêt du système et les propriétaires d'applications doivent prévoir de suspendre leurs applications, puis de les remettre en ligne une fois que le système est de nouveau en ligne. En cas d'échec de la mise à niveau de l'un des nœuds du processus, le temps d'arrêt de l'application est prolongé à mesure que les administrateurs exécutent le processus fastidieux de restauration de la mise à niveau sur d'autres nœuds, puis vérifient que tout est correctement revenu dans son état d'origine et fonctionne correctement .

Une meilleure approche: mise à niveau instantanée

Qumulo pense que vous devriez passer vos week-ends à faire les choses que vous aimez. Au cours des huit dernières années, Qumulo a entrepris de simplifier la gestion des données non structurées. Au début de ce voyage, nous savions que rendre les mises à niveau rapides et faciles serait une promesse essentielle à faire à nos utilisateurs, nous avons donc choisi une architecture logicielle dans laquelle Qumulo Core fonctionne dans l'espace utilisateur au-dessus de Linux.

Cette approche nous donne la flexibilité d'une application; Cependant, profiter de cette flexibilité exigeait la mise en œuvre d'une innovation fondamentale dans notre produit: la conteneurisation. Au cours des six derniers mois, nous avons repensé la façon dont nous regroupons notre système de fichiers et les plus de 25 services sur lesquels nous comptons dans un seul conteneur d'exécution. Grâce à ce changement, nos clients peuvent désormais mettre à niveau quatre nœuds ou 100 nœuds avec le même processus de mise à niveau à un seul bouton et mettre à niveau l'ensemble de leur cluster en seulement 20 secondes de panne perçue par les utilisateurs finaux.

Lors de la conception de notre solution de mise à niveau instantanée, nous tirons parti des avantages uniques de Qumulo en tant que système de fichiers défini par logiciel et entièrement conteneurisé. Nous regroupons tous les logiciels et services de données Qumulo dans un seul conteneur défini par logiciel qui réside sur chaque nœud au sein d'un cluster de production. Lorsque la mise à niveau instantanée commence, un deuxième conteneur avec la version la plus récente de Qumulo Core est créé et mis en ligne en parallèle avec l'ancienne version du logiciel restant en ligne et en production. Une fois la nouvelle version exécutée et validée, les processus actifs de l'ancienne version de Qumulo Core sont déplacés de manière transparente vers la nouvelle version exécutée dans le nouveau conteneur (voir Figure 1). L'ancien conteneur est supprimé ultérieurement.

La mise à niveau instantanée vers Qumulo Core est:

  • Simplicité - Lancez la mise à niveau d'un cluster de toute taille en appuyant sur un seul bouton
  • Blanchiment - La mise à niveau d'un cluster de toute taille se termine en seulement 20 secondes hors ligne
  • Fiable - Pas besoin de planifier les temps d'arrêt des applications, pas d'impact notable sur les performances

Lorsque le système d'exploitation hôte sous-jacent ou les pilotes doivent être mis à niveau, Instant Upgrade automatise également ce processus et lancera automatiquement un redémarrage.

Figure 1: Mise à niveau instantanée Qumulo

Pourquoi Qumulo est-il uniquement capable d'offrir l'expérience de mise à niveau instantanée?

La mise à niveau instantanée est possible car Qumulo fonctionne comme une application «d'espace utilisateur» au-dessus de Linux. D'autres systèmes de fichiers fonctionnent dans «l'espace noyau», après avoir effectué des personnalisations approfondies et créé des dépendances sur des noyaux de système d'exploitation spécifiques. Parce que Qumulo est une application d'espace utilisateur, nous sommes en mesure de la conteneuriser, ce qui nous permet à son tour de mettre à jour le conteneur actif d'une version à une autre tout en laissant le système d'exploitation et le noyau en marche.

D'autres systèmes de fichiers nécessitent généralement un processus de mise à niveau distinct pour les différents composants du système de fichiers, les serveurs de métadonnées, les passerelles NAS, l'analyse des données et l'interface utilisateur, et les serveurs de stockage sous-jacents. Ces divers composants font souvent l'objet de calendriers de publication distincts et doivent être mis à niveau à différents moments de l'année.

Innover au nom de nos clients

L'ensemble de ce processus n'était pas une simple prouesse d'ingénierie, mais une véritable récompense pour les utilisateurs cherchant à consacrer leur temps à un travail stratégique ou à passer du temps avec leur famille et leurs amis, au lieu de tâches d'administration système fastidieuses. Désormais, l'ensemble du cluster, du système d'exploitation, des pilotes et des services sont tous mis à niveau en appuyant simplement sur un bouton, pendant la journée de travail standard.

Alors que nous avons commencé ce projet logiciel plus tôt cette année, nous avons vraiment commencé ce voyage il y a huit ans lorsque Neal Fachan et le reste de notre équipe fondatrice ont imaginé un futur logiciel d'abord et ont pris des décisions architecturales pour permettre cette réalité. Aucun client ne nous a demandé de «fonctionner dans l'espace utilisateur», mais nous savions que cela serait essentiel pour débloquer l'innovation future. Avec la sortie d'Instant Upgrade, nous avons réussi ces paris.

En savoir plus

En savoir plus sur Nouveautés dans la plate-forme de données de fichiers de Qumulo, et voyez ce qui rend le logiciel de Qumulo unique dans ce aperçu de l'architecture logicielle.

Contact pour une démo, et n'oubliez pas de Abonnez-vous à notre blog pour des meilleures pratiques et ressources plus utiles!

.