Elastic Fabric: l'avenir du stockage de fichiers d'entreprise

Elastic Fabric: l'avenir du stockage de fichiers d'entreprise

Une ère d'échelle de données sans précédent

La nature fondamentale de la manière dont les entreprises utilisent l'informatique pour stimuler l'innovation, l'agilité et la réactivité a considérablement évolué au cours des cinq dernières années. Alors que les entreprises utilisaient traditionnellement les données pour gérer leurs activités, leur acquisition et leur stockage étaient souvent coûteux.

Au cours des cinq dernières années, nous avons assisté à une réduction considérable des aspects économiques de la création de données et à une réduction tout aussi spectaculaire du coût de leur stockage. Nous avons évolué de l'ère de "Comment stocker des données?"Pour"Comment gérer intelligemment et efficacement les données?«De plus, nous sommes à une époque où des milliards de fichiers - ou plus - sont la norme.

C'est l'ère de l'échelle des données sans précédent. Ces données sont produites et consommées par des applications et des systèmes basés sur des fichiers qui constituent la base des pipelines de production numériques modernes. Cela signifie que les entreprises génèrent désormais beaucoup plus de données sous forme de fichiers que jamais auparavant.

En conséquence, les entreprises dépassent rapidement leurs systèmes de fichiers hérités et ne peuvent plus gérer leurs énormes collections de ressources numériques. Cependant, ces actifs restent au cœur de l'activité et les flux de travail basés sur des fichiers constituent des canalisations essentielles pour ces actifs.

Dans le monde actuel de données abondantes, le nombre de fichiers est illimité. Des milliards ou des milliards de fichiers sont non seulement possibles, mais en train de devenir monnaie courante. Il n'y a pas non plus de limite de taille de fichier aux extrêmes - petites et grandes, ni de disponibilité, que ce soit sur site, dans le cloud ou dans des centres de données géographiquement répartis.

Le passage de la grande échelle à l'hyperscale

IDC prédit que la quantité de données créée atteindra les zettaoctets 40 (un zettaoctet est un milliard de téraoctets) par 2020, et qu'il y aura plus de Zettaoctets 163 par 2025. C'est dix fois plus que les données générées dans 2016.

Environ 90% de cette croissance concernera le stockage de fichiers et d’objets.

illustration montrant les données du fichier 2018 par rapport aux données du fichier 2020 du projet

Quatre tendances contribuent à la quantité de données que les entreprises doivent stocker:

  1. La forte augmentation des données générées par la machine;
  2. La prévalence de la vidéo en tant que type de données dans toutes les industries;
  3. La résolution et la fidélité sans cesse croissantes de ces actifs numériques, et
  4. Durée de vie plus longue des données et tendances à la mondialisation qui créent des ressources informatiques réparties et de stockage.

Données générées par machine

Les entreprises performantes s'appuient de plus en plus sur des données générées par machine pour leurs activités principales et leurs connaissances. L'Internet des objets (IoT) alimente une transformation de la valeur des données pour les entreprises de tous types, couvrant toutes les industries à forte intensité de données.

Les données alimentent la valeur et la croissance comme jamais auparavant. Par exemple, grand jeux de données générés par machine dans les sciences de la vie font des découvertes révolutionnaires et des traitements médicaux qui sauvent des vies. En raison de sa valeur considérable pour les chercheurs, les professionnels de la santé et les patients, le besoin de telles données ne fera que croître.

Autre exemple, les sociétés pétrolières et gazières utilisent les données pour créer une valeur considérable pour leurs clients. Il n’est pas exagéré de dire que le principal atout de ces organisations réside dans les données sismiques basées sur des fichiers utilisées pour la découverte de gaz naturel et de pétrole.

Ressources numériques à plus haute résolution

Les progrès techniques des systèmes matériels et logiciels permettent de nouvelles fonctionnalités pour les entreprises de toutes sortes.

Par exemple, les sociétés de médias et de divertissement peuvent désormais se standardiser vidéo 4K non compressée, avec 8K à l’horizon. Ce niveau de fidélité pour des expériences de visualisation réellement immersives était impensable il y a quelques années à peine.

La résolution des capteurs numériques et des équipements scientifiques est également en constante augmentation. Une résolution plus élevée entraîne une croissance plus que linéaire des tailles de fichiers - un doublement de la résolution d'une photo numérique, par exemple, augmente sa taille de quatre fois.

À mesure que le monde exige une plus grande fidélité des actifs numériques, ses besoins de stockage augmentent.

Durée de vie des données plus longue

Parallèlement, l’apparition du machine learning a permis à de nouvelles sources de valeur pour les entreprises et leurs clients. Il est maintenant possible de tirer parti de millions ou de milliards de données individuelles et de demander aux systèmes d'identifier des modèles, des sources de valeur, des opportunités et des risques qui n'étaient tout simplement pas possibles auparavant. Ces énormes progrès dans l'analyse des données et l'apprentissage automatique rendent les données plus précieuses au fil du temps.

Pour les entreprises, cela a énormément pesé sur leurs applications et sur le stockage dont dépendent ces applications. Brouillés pour s'adapter au nouveau paysage de possibilités, les entreprises sont obligées d'adopter la philosophie «mieux vaut la conserver que de la rater plus tard» en ce qui concerne leurs données.

Le cloud public a changé la nature même de la construction et du déploiement des applications. La tendance des entreprises à offrir une valeur considérable à leurs clients, due à l’empreinte massive de données et au développement d’outils analytiques sophistiqués, a été accompagnée par l’avènement du cloud public. Son arrivée a renversé les hypothèses de base sur la manière dont l’informatique pourrait être réalisée et sur la manière dont le stockage devrait fonctionner.

Cela a entraîné un changement profond du rythme de l'innovation dans les entreprises, mais aussi du rythme de ces personnes. La facilité avec laquelle les responsables de secteur peuvent créer et gérer des données, et déployer des applications pour tirer parti de ces données, met à rude épreuve de nombreuses organisations de technologie prenant en charge les entreprises.

Portée mondiale

Le nuage signifie que les chefs d'entreprise peuvent stimuler l'innovation et la valeur pour leurs clients plus rapidement et plus efficacement, tout en tirant parti des ressources qui se comportent de manière élastique.

Le passage des dépenses de technologie basées sur les dépenses en capital aux dépenses en capital sur les dépenses en capital et en dépenses d’exploitation a transféré le processus décisionnel et le rythme de l’innovation des organisations de technologie centralisées aux responsables commerciaux. Il en a résulté une adoption rapide des nouvelles technologies, rendue possible par un accès élastique aux ressources informatiques nécessaires à leur livraison. Et cette élasticité s'étend aux zones géographiques, rendant possible une portée mondiale sans la construction de centres de données physiques à travers le monde.

De nouvelles méthodes de résolution des problèmes et de création de valeur pour le client sont arrivées et sont là pour rester. Toutes les entreprises se rendent compte qu’à l’avenir, elles ne géreront plus leur charge de travail à partir de centres de données uniques et autogérés.

Au lieu de cela, ils se déplaceront vers plusieurs centres de données, avec un ou plusieurs dans le cloud public. Cette flexibilité les aidera à s'adapter à un monde où les employés et les partenaires commerciaux sont répartis.

Les entreprises concentreront leurs ressources sur leurs activités principales plutôt que sur leurs dépenses informatiques. La plupart d'entre eux amélioreront leurs plans de reprise après sinistre et de continuité des opérations, et plusieurs le feront en tirant parti de l'élasticité fournie par le cloud.

Les réalités perturbatrices du stockage de fichiers incitent les entreprises à trouver de nouvelles solutions et approches pour leurs flux de travail et leurs actifs basés sur des fichiers.

Le défi des solutions de stockage

Les utilisateurs d’applications dépendant de systèmes de fichiers existants à grande échelle et à l’échelle - les outils de travail traditionnels des données basées sur des fichiers - constatent que ces systèmes sont inadéquats pour la réalité de l’informatique élastique actuelle et son potentiel futur.

L’un des principaux problèmes est l’incapacité de comprendre la nature même des données dont vous disposez; sa valeur atteint une limite critique imposée par les systèmes existants. Cette limitation a une incidence sur la façon dont les systèmes hérités gèrent les métadonnées des systèmes de fichiers volumineux: leurs structures de répertoire et leurs attributs de fichier deviennent eux-mêmes des données volumineuses.

Les solutions traditionnelles qui reposent sur la force brute pour donner un aperçu du système de stockage ont été vaincues par l’échelle. Les méthodes de force brute sont fondamentales pour la conception des systèmes de fichiers hérités et ne peuvent pas être corrigées avec des correctifs.

diagramme montrant la capacité et l'échelle de performance en stockage élastique

Une autre limitation empêchant les systèmes hérités de fonctionner dans ce nouveau monde élastique est qu’ils n’ont jamais été conçus pour une échelle «élastique», ce qui signifie une mise à l’échelle pour des tailles de fichiers petites et grandes, ainsi que des emplacements géographiques.

Traditionnellement, les entreprises rencontraient deux problèmes lors du déploiement de systèmes de stockage basés sur des fichiers: elles devaient évoluer à la fois en termes de capacité et de performance.

Avec stockage élastique, la capacité ne se limite pas à créer un grand référentiel de téraoctets de stockage brut. Dans le monde d'aujourd'hui, toutes les données étant précieuses, l'échelle ne se limite plus à ces deux axes.

De nouveaux critères d'échelle sont apparus. Ils incluent le nombre de fichiers stockés, la capacité de contrôler d’énormes quantités de données en temps réel, la distribution mondiale de données et la flexibilité permettant de tirer parti des calculs élastiques dans le cloud public de manière à couvrir également le centre de données.

Dans ce contexte de profonde perturbation, les critères d'achat traditionnels n'ont pas perdu de leur pertinence. Le prix, les performances, la facilité d'utilisation et la fiabilité restent plus importants que jamais, peu importe l'évolution du paysage.

Aujourd'hui paysage de stockage changeant place les entreprises clientes à la croisée des chemins. Ils auront du mal à gérer des quantités massives de données. Ils auront du mal à répondre aux demandes de portée mondiale, avec peu de bonnes options pour les données basées sur des fichiers couvrant le centre de données et le cloud public.

Solutions essayées: Objet et subdivision par volume

Naturellement, il y a eu des tentatives progressives pour répondre à ce besoin croissant de stockage de fichiers élastiques à grande échelle. Mais pour les raisons exposées ci-dessous, ces approches sont insuffisantes du point de vue architectural pour répondre aux exigences importantes du stockage élastique et aux exigences des entreprises en cette ère de stockage élastique.

Stockage d'objets

Stockage d'objets permet de très grands systèmes avec des pétaoctets de données et des milliards d'objets, et fonctionne bien pour son utilisation prévue. En fait, il est de plus en plus courant d’affirmer que les technologies de stockage d’objets sont la solution aux problèmes d’envergure et de géo-distribution du stockage non structuré.

Fournisseurs de cloud croire de tout cœur au stockage d'objets. Aujourd'hui, un client souhaitant stocker des données dans le cloud est pratiquement obligé de les utiliser, quel que soit le cas d'utilisation.

illustration montrant des types de fichiers incompatibles dans le stockage

Certaines entreprises tentent d’adopter le stockage d’objets dans des cas d’utilisation non prévus et mal adaptés. Afin de réaliser leurs propriétés d'échelle et de géo-distribution, les librairies ont intentionnellement échangé des fonctionnalités dont de nombreux utilisateurs ont besoin et s'attendent: cohérence transactionnelle, modification d'objets (par exemple des fichiers), contrôle d'accès détaillé et utilisation de protocoles standard tels que NFS. et SMB, pour n'en nommer que quelques-uns.

Le stockage d’objets ne laisse pas non plus le problème de l’organisation des données. Les utilisateurs sont plutôt encouragés à indexer les données elles-mêmes dans une sorte de base de données externe. Cela peut suffire aux besoins de stockage des applications autonomes, mais cela complique la collaboration entre les applications et entre les utilisateurs et ces applications.

Les workflows modernes impliquent presque toujours des applications qui ont été développées indépendamment, mais qui fonctionnent ensemble en échangeant des données basées sur des fichiers, un scénario d'interopérabilité qui n'est tout simplement pas possible avec le stockage d'objets. De plus, les magasins d'objets n'offrent pas les avantages d'un système de fichiers pour la gouvernance.

Division en volumes

Une autre approche du traitement de grandes quantités de données sur les systèmes de fichiers hérités consiste à partitionner les fichiers en volumes distincts, ce qui signifie plusieurs espaces de noms. Les volumes sont des silos de données de fichiers.

illustration montrant des volumes ou des silos de données de fichier

Des volumes séparés signifient toujours un gaspillage d'espace de stockage. Chaque volume contient une capacité de réserve, et si vous additionnez toute la capacité de réserve de tous les volumes, vous avez une capacité de gaspillage importante.

Des volumes distincts signifient une inefficacité, ce qui se traduit par des coûts de stockage et d’infrastructure plus élevés.

La collaboration est fondamentale pour de nombreux flux de travail basés sur des fichiers, mais elle ne peut se produire que si tout le monde a accès aux données. Étant donné que les volumes créent des silos de données isolés, les informations doivent être copiées d'un silo à un autre, ce qui prend du temps et est peu pratique.

Dans un un seul espace de noms système, il existe un référentiel de stockage centralisé auquel toute personne disposant des autorisations appropriées peut accéder.

Un seul espace de noms rend la collaboration et la coopération possibles.

Les approches multi-volumes peuvent limiter la capacité des performances du système de fichiers à évoluer, car les administrateurs doivent allouer le débit à des volumes spécifiques. Cela signifie que des volumes de trafic élevés peuvent devenir des goulots d'étranglement. Avec un seul espace de noms, le débit global est réparti sur un ensemble plus large d'utilisateurs et d'applications, ce qui réduit les risques de goulots d'étranglement.

Il est difficile de gérer des volumes distincts en termes d'autorisations, de planification de la capacité, de quotas d'utilisateurs ou de projets, de sauvegardes et d'autres tâches, car les administrateurs ont une vue fragmentée du système de fichiers. Un seul espace de noms donne une vue unifiée, ce qui simplifie considérablement l’utilisation du système de fichiers.

La structure des fichiers de stockage élastiques permet une consommation flexible du stockage de fichiers

Stockage de fichiers élastiques échelles à des milliards et des milliards de fichiers.

L'idée que la capacité ne soit mesurée qu'en termes d'octets de stockage brut cède la place à une compréhension plus large du fait que la capacité est aussi souvent définie par le nombre d'actifs numériques pouvant être stockés. Les flux de travail modernes basés sur des fichiers incluent un mélange de fichiers de grande taille et de petite taille, en particulier s'ils impliquent une quantité quelconque de données générées par une machine.

Lorsque les systèmes de fichiers existants atteignent les limites des ressources numériques qu'ils peuvent efficacement stocker, les acheteurs ne peuvent plus présumer qu'ils disposeront d'une capacité de fichier suffisante.

illustration graphique répertoriant les composants du tissu de fichier de stockage élastique

Le stockage de fichiers élastique évolue dans tous les environnements d'exploitation, y compris le cloud public. Le matériel propriétaire est de plus en plus une impasse pour les utilisateurs de stockage de fichiers à grande échelle. Les entreprises d'aujourd'hui ont besoin de flexibilité et de choix. Ils souhaitent stocker des fichiers dans des centres de données et dans le cloud public, en choisissant l'un ou l'autre système en fonction de décisions commerciales et non de limitations techniques de leur plate-forme de stockage.

Les entreprises souhaitent tirer parti des progrès techniques et économiques rapides du matériel standard, notamment des disques plus denses et des composants moins coûteux. Ils souhaitent réduire la complexité de la maintenance matérielle grâce à la standardisation et à la rationalisation des configurations.

La tendance des logiciels intelligents sur le matériel standard dépassant le matériel propriétaire ne fera qu’augmenter.

Les utilisateurs de stockage de fichiers à grande échelle ont besoin que leurs systèmes de stockage fonctionnent sur divers environnements d'exploitation et ne soient pas liés à du matériel propriétaire.

Une structure de fichiers élastique permet une consommation flexible du stockage de fichiers. Un modèle d'utilisation flexible et à la demande est une caractéristique du cloud public. Cependant, le passage au cloud a contraint les utilisateurs du stockage de fichiers à grande échelle, qui ne disposent d'aucun moyen efficace pour exploiter la puissance du cloud.

Une structure de fichiers élastiques évolue à travers les emplacements géographiques grâce à la mobilité des données. Les entreprises sont de plus en plus mondiales. Leurs systèmes de stockage basés sur des fichiers doivent désormais évoluer sur plusieurs sites géographiques. Cela peut impliquer plusieurs centres de données et presque certainement le cloud public.

Une approche fragmentée et une étiquette indiquant «CLOUD-READY» ne fonctionneront pas. Une véritable mobilité et une portée géographique sont maintenant nécessaires.

Une structure de fichier élastique offre une visibilité et un contrôle en temps réel. Alors que les collections d'actifs numériques atteignent des milliards de fichiers, la capacité de contrôler les ressources de stockage en temps réel est devenue une nouvelle exigence urgente.
Les administrateurs de stockage doivent pouvoir surveiller tous les aspects des performances et de la capacité, quelle que soit la taille du système de stockage.

Une structure de fichiers élastique donne accès à une innovation rapide.

Stockage de fichiers moderne nécessite un design simple et élégant et une ingénierie avancée. Entreprises qui développent un stockage de fichiers moderne utilisera des processus de développement agiles qui mettent l’accent sur les cycles de libération rapides et l’accès continu à l’innovation. Les cycles de mise à jour de trois ans sont une relique du passé que les clients ne peuvent plus tolérer.

Le tissu élastique est l'avenir du stockage de fichiers

Les données basées sur des fichiers deviennent transformatrices lorsqu'elles donnent aux personnes la liberté de collaborer, d'innover et de créer. Il alimente la croissance et la rentabilité à long terme du moderne, entreprises à forte intensité de données.

Les données basées sur des fichiers sont plus importantes que jamais et les entreprises doivent trouver de meilleurs moyens d'accéder à ces données et de les gérer. Pour relever le défi, les entreprises doivent adopter des technologies de système de fichiers modernes qui permettent une structure de fichiers élastique.

Fiabilité, grande capacité et performant sont des enjeux de table. Au-delà de cela, les entreprises ont besoin d'un accès global et d'une échelle élastique, y compris la capacité de s'adapter à des milliards de fichiers. Le système de stockage de fichiers doit déplacer les données là où elles sont nécessaires, lorsque cela est nécessaire, tout en réduisant les coûts, les performances, la fiabilité et la facilité d’utilisation des systèmes existants.

Elastic fabric est l'avenir du stockage de fichiers pour les entreprises qui resteront compétitives, innovantes et agiles à l'ère du numérique.

Partager avec votre réseau