Par définition, un lac de données accepte toutes les données, sans surveillance ni gouvernance. Sans métadonnées descriptives… le lac de données risque de se transformer en un véritable bourbier de données. – Nick Heudecker, anciennement chez Gartner
Introduction
Au cours de la dernière décennie, le terme « lac de données » a été utilisé si largement qu'il obscurcit souvent plus qu'il n'éclaire. La plupart des organisations exploitent aujourd'hui une mosaïque de systèmes de fichiers et de compartiments d'objets répartis sur des baies sur site, de multiples clouds hyperscale et des infrastructures périphériques. Les coûts ne se mesurent pas simplement en pétaoctets et en dollars, mais aussi en pertes de visibilité, en ralentissements opérationnels et, trop souvent, en failles de sécurité évitables.
Avec l'introduction de l'architecture Qumulo Stratus, notre plateforme de données cryptographiquement isolée et sensible aux locataires, nous avons franchi une étape décisive vers le « Universal Data Lake » : un écosystème de données sans frontières et axé sur les politiques qui peut s'étendre des centres de données privés à tous les principaux clouds, sans jamais sacrifier la souveraineté ou les performances.
Une fondation pour le lac de données universel
Qumulo Stratus allie les avantages d'une infrastructure de niveau souverain isolée à un cœur de données sans partage, utilisant le chiffrement des données pour préserver leur isolement et leur confidentialité. Chaque locataire connecté à Stratus gère ses propres clés de chiffrement et services d'entreprise, notamment AD, DNS, SIEM, etc. À mesure que les données arrivent aux moteurs de protocole Stratus, elles sont chiffrées avec la clé du locataire et stockées dans Qumulo DataCore. Le résultat est simple, mais fondamental :
La localisation des données devient un choix, pas une contrainte. Les workflows peuvent être déployés sur AWS aujourd'hui, rapatriés vers une ferme de GPU sur site demain et archivés sur Azure le trimestre suivant sans refactorisation des applications ni formation des utilisateurs.
La sécurité n’est pas « ajoutée ». Chaque locataire possède son destin cryptographique (clés, KMS et pistes d'audit), de sorte que les charges utiles des fichiers et des objets restent opaques pour tous les autres locataires et même pour les administrateurs du cœur de données Qumulo.
Les performances évoluent de manière linéaire. Les locataires gourmands en ressources de calcul déploient leur propre couche NeuralCache et adaptent leur capacité d'E/S à la demande ; les locataires centrés sur la capacité consomment simplement le DataCore mutualisé des conteneurs ou machines virtuelles Kubernetes. Personne n'est pénalisé par un voisin bruyant.
Ces propriétés remodèlent les attentes du marché et les capacités techniques dans trois domaines qui nous concernent tous : la résilience civique, l’innovation académique et la sécurité nationale.
Gouvernement municipal : isoler les services essentiels sans cloisonnement
Les responsables des infrastructures et les DSI des villes et des comtés me racontent la même histoire : leurs cartographies et images ArcGIS, leurs archives de caméras corporelles, leur observabilité Splunk, leurs sauvegardes Rubrik, leur vidéosurveillance Genetec, leurs CAO des travaux publics et leurs dossiers de santé publique se trouvent dans des emplacements radicalement différents, chacun avec des dispositifs de sécurité spécifiques. Stratus permet à une municipalité de regrouper ces îlots en un seul espace de noms tout en conservant des compartiments cryptographiquement scellés pour l'administration municipale, la police, les travaux publics et les services de santé.
Lorsqu'un ransomware frappe – et malheureusement, ce sera le cas – les équipes d'intervention peuvent intervenir chirurgicalement pour restaurer un locataire impacté sans dommages collatéraux pour les autres services de la ville. Parallèlement, les équipes informatiques aux budgets serrés bénéficient d'un ensemble unique d'analyses, d'une politique de réplication unique, d'une utilisation bien plus efficace des ressources et de la possibilité d'utiliser le cloud public comme centre de données de reprise après sinistre à la demande, bien au-delà du rayon d'action des catastrophes naturelles impactant les services.
Universités de recherche : fusionner la liberté académique avec un contrôle de niveau entreprise
Les universités modernes sont à cheval entre deux mondes : la science ouverte et collaborative et les opérations commerciales de niveau entreprise. Historiquement, cette dualité a contraint les établissements à adopter des infrastructures parallèles : l’une pour les dossiers universitaires, les finances et les systèmes administratifs, l’autre pour l’ingénierie, la génomique, la protéomique ou la modélisation météorologique. Stratus renverse la situation.
Les étudiants diplômés en chimie computationnelle peuvent créer des caches isolés et performants sur n'importe quelle région cloud compatible avec leurs budgets de subvention, tandis que le service financier continue de gérer ses registres sur des hôtes sur site robustes, le tout au sein du même lac de données logique. Les comités de surveillance obtiennent des preuves vérifiables que les informations personnelles identifiables (IPI) issues des dossiers des étudiants ne sont jamais mélangées aux données de recherche soumises aux contrôles à l'exportation. L'innovation prospère, les ingénieurs en stockage bénéficient d'un meilleur équilibre entre vie professionnelle et vie privée et les responsables de la conformité dorment sur leurs deux oreilles.
Programmes d'accès spécial : intégrité opérationnelle à l'échelle classifiée
J'ai passé de nombreuses années à concevoir des systèmes pour et avec des agences de défense et de renseignement, et une leçon est incontestable : les compromissions commencent rarement avec du code open source, mais plutôt avec du code propriétaire et des identifiants. Les administrateurs aux privilèges excessifs ont divulgué plus de secrets que les exploits zero-day n'en révéleront jamais, et les logiciels propriétaires sont bien moins contrôlés que les logiciels libres. Stratus réduit cet « rayon d'action » – et ce, intentionnellement. Chaque bureau de programme – par exemple, une direction ISR spatiale – dispose de son propre fournisseur d'identité isolé du réseau, de son DNS, de son Active Directory, de sa couche HSM et de son interface NeuralCache. Les administrateurs du tenant logistique ne peuvent même pas connaître l'existence des ensembles de données dans le tenant analytique, et encore moins y accéder. Pourtant, lorsque les analystes approuvent la diffusion interdomaines d'un flux de télémétrie via Cloud Data Fabric, Stratus exécute instantanément cette politique, chiffrée, validée et consignée pour assurer la traçabilité. Il en résulte une plateforme qui empêche précisément ce type de menace interne qui a affecté des missions sensibles, de Snowden aux récentes fuites d'identifiants de connexion au cloud, sans les inefficacités d'une infrastructure cloisonnée.
Qumulo Stratus : l'avenir des données
Le lancement de Stratus ne se limite pas à un simple événement produit ou à une architecture novatrice ; il signale que l’ère du stockage « tout partagé » a atteint ses limites. Il est tout simplement impossible de proposer une architecture mutualisée efficace sur un tel modèle, alors même que l’objectif est de ne rien partager. Les clients exigent désormais de l’élasticité sans exposition et une mutualisation sans compromis. Ces attributs ne sont plus incompatibles : ils sont devenus des prérequis. Je suis fier de l’ingéniosité technique qui sous-tend Stratus, mais je suis encore plus enthousiaste quant à son potentiel : des services municipaux opérationnels même en cas de catastrophe ; des universités qui accélèrent la recherche tout en protégeant les données personnelles ; et des programmes de sécurité nationale qui peuvent enfin collaborer à une échelle compartimentée sans craindre les dérives de privilèges. C’est cet impact sur le marché que nous visons avec Stratus, et ce n’est que le début. Si vous êtes prêt à décloisonner vos données, à reprendre le contrôle et à accélérer votre stratégie de données vers l’ère universelle, je vous invite à nous rejoindre. dg Douglas Gourlay est président-directeur général de Qumulo et un peu passionné d'informatique. Pour en savoir plus sur Stratus, rendez-vous sur https://discover.qumulo.com/qumulo-stratus-webinar