Éléments à prendre en compte lors de l'évaluation des solutions de stockage de données d'entreprise

Solutions de stockage de données

Dans cette série en 4 parties sur l'évaluation solutions de stockage de données d'entreprise, nous vous fournirons un aperçu des options de stockage disponibles aujourd'hui, comparerons ces solutions et vous aiderons à choisir une solution de stockage idéale en fonction des types de données stockées par votre entreprise. De plus, cette série vous aidera à déterminer si une solution de stockage en réseau (NAS) évolutive est la meilleure solution pour votre entreprise, avec des exemples spécifiques et concrets que les entreprises nécessitant un calcul haute performance (HPC) rencontrent dans les cycles de vie des données et comment ils ont transformé les données d'un état brut en un état utile.

Quelle est l'efficacité de la gestion des données de votre entreprise ?

Maintenir une architecture informatique d'entreprise, c'est comme posséder une vieille voiture qui est constamment dans l'atelier de réparation : les coûts différentiels s'additionnent et les ressources consommées pourraient être investies dans un modèle plus récent pour un meilleur rendement. De même, si vous êtes un administrateur de systèmes informatiques contraint à une technologie de stockage basée sur un matériel monolithique propriétaire inefficace, coûteux et difficile à gérer, vous aurez peut-être du mal non seulement à rattraper votre retard, mais aussi à prendre en charge les initiatives de transformation des données.

Lorsque vous êtes à la recherche d'une solution de stockage de données d'entreprise évolutive, il est essentiel de comprendre si le stockage que vous choisissez est conçu pour fonctionner avec des données et des applications sous leur forme native. Nous aborderons cela plus en détail ci-dessous, ainsi que certaines des principales considérations lors de l'évaluation de vos flux de travail HPC. Tout compte fait, cela aidera à guider votre décision dans le choix d'une solution qui correspond le mieux aux besoins de votre entreprise aujourd'hui et à l'avenir.

Évaluez vos workflows de calcul hautes performances

Flux de travail HPCLa plupart des données proviennent de fichiers, créés et accessibles directement à partir d'applications natives ou de systèmes de fichiers montés. Travailler avec ces données de fichier en natif signifie y accéder via protocoles standard de l'industrie comme le système de fichiers réseau (NFS), le bloc de messages du serveur (SMB) ou le passage direct du système de fichiers (bloc).

Les données stockées dans leur format natif sont considérées comme des données non structurées, ce qui signifie qu'elles n'ont pas de modèle ou de schéma de données prédéfini et ne peuvent pas être stockées dans une base de données relationnelle traditionnelle (nous en parlerons plus tard). Étant donné que ce type de données non organisées ne peut pas simplement être stocké dans un ensemble de tables utilisant des colonnes et des lignes, les entreprises ont toujours été confrontées au défi fondamental de gérer, d'analyser et d'exploiter leurs données non structurées de manière significative, en raison de la complexité et de la processus d'analyse de données chronophages requis pour extraire des informations précieuses.

Les analystes de Gartner estiment que les données non structurées représentent 80 à 90 % de toutes les nouvelles données d'entreprise. Cela peut sembler surprenant, mais la réalité est que les données d'entreprise sont principalement constituées de données non structurées depuis des décennies maintenant. En effet, en 1998 Merrill Lynch a revendiqué, "Les données non structurées comprennent la grande majorité des données trouvées dans une organisation, certaines estimations vont jusqu'à 80%." Lynch a essentiellement affirmé qu'en tant que volume de création de données mondiales continue de croître d'année en année, plus il sera important pour les solutions de gestion des données d'entreprise hautement évolutives qui peuvent exploiter efficacement ces données de manière significative.

Cette "explosion de données non structurées" est générée à partir de caméras vidéo, d'appareils d'enregistrement, de satellites, de capteurs, de données génomiques, d'imagerie aérienne et d'autres technologies connectées à l'IoT, et représente une mine d'or potentielle d'informations.

Tirez-vous parti de vos données sous leur forme native ?

Les entreprises qui réussissent stockent, gèrent et créent des flux de travail et des applications de calcul hautes performances (HPC) avec des données de fichiers sous leur forme native, en tirant parti des systèmes de fichiers montés localement (rendus accessibles en créant des exportations NFS et des partages SMB) et des services de données intégrés de manière native. avec des magasins d'objets cloud (comme Amazon S3 et des tours Microsoft Azure) et transformer ces données en valeur. Ces innovateurs adoptent et gèrent les données sous toutes leurs formes pour créer de nouveaux modèles commerciaux, traitements médicaux, produits de consommation, outils de veille économique et médias numériques.

Flux de travail HPC

Pouvez-vous suivre et gérer vos données non structurées ?

Pour de nombreuses entreprises HPC tirant parti du stockage hérité et des applications natives du cloud, la tâche de traitement, de gestion et de transformation des données non structurées d'un fichier à un objet est un énorme défi. La plupart des technologies ne sont pas conçues pour résoudre ce problème, ce qui signifie que les entreprises doivent reconstruire leur architecture, refactoriser leurs applications ou utiliser des packages de transfert de données tiers pour générer de la valeur à partir de leurs données. Dans de nombreux cas, cela conduit à de vastes silos de données avec peu de visibilité sur ces données. . De plus, les organisations sont souvent limitées à certains protocoles qui peuvent ne pas être pris en charge ou appropriés pour certaines applications ou utilisateurs finaux. Les résultats difficiles pour de nombreuses grandes entreprises du monde entier sont que ces données précieuses ne sont jamais utilisées, sont consultées de manière inefficace et sont souvent mal comprises.

Dans un 2019 NewVantage Partners' Enquête auprès des dirigeants sur les mégadonnées et l'IA, composé de 64 responsables technologiques et commerciaux de niveau C représentant de très grandes entreprises, 53 % des répondants au sondage déclarent « ils ne traitent pas encore les données comme un actif commercial ». Ces résultats alarmants surviennent malgré le fait que 92% des personnes interrogées déclarent que le rythme de leurs investissements dans le Big Data et l'intelligence artificielle (IA) s'accélère.

Évaluez vos besoins spécifiques en matière de stockage de données d'entreprise

Les entreprises qui ont besoin d'activer de grands ensembles de données dans des environnements HPC avec des données non structurées signifient que la capacité de traiter et de servir des données fait partie de leur activité. À cette fin, lorsque vous envisagez une solution de stockage de données d'entreprise optimale, il est important d'évaluer si elle répondra à vos exigences en matière de capacité, de performances, d'intégrité des données et d'évolutivité nécessaires pour traiter les données et servir des workflows potentiellement denses et hautes performances.

Évaluez les solutions de stockage de données d'entreprise idéales pour vos flux de travail HPC

Une solution de stockage de données d'entreprise optimale doit fournir l'infrastructure nécessaire pour tirer parti des ressources HPC dans leurs flux de travail. Selon un Sondage Forbes, plus de 95 % des entreprises doivent gérer des données non structurées, et plus de 150 2025 milliards de gigaoctets de données devront être analysés d'ici XNUMX, ce qui signifie que le stockage de fichiers devient plus important que jamais. 

Testez gratuitement Qumulo

Testez gratuitement Qumulo

Explorez un environnement Qumulo entièrement fonctionnel, directement dans votre navigateur.

Try Demo
Gestion efficace des données non structurées

Étant donné que les données non structurées représentent la majeure partie de toutes les nouvelles données créées chaque jour, plus les entreprises HPC peuvent consolider, traiter et exploiter ces données efficacement, plus leurs résultats seront probants. Il n'est donc pas surprenant qu'une solution de stockage de données d'entreprise idéale soit conçue pour fonctionner de manière native avec ce type de données.

Stockage d'objets vs stockage de fichiers

À l'ère moderne du cloud, le stockage d'objets a tendance à être une priorité pour de nombreuses entreprises, mais la plupart des données sont créées et consommées sous forme de fichiers. Stockage d'objets est une architecture qui gère les données en tant qu'objets, par opposition à une architecture de stockage comme un système de fichiers. Stockage de fichiers est un format ou un programme pour stocker et gérer des données sous forme de hiérarchie de fichiers, dans laquelle les fichiers sont identifiables dans une structure de répertoires (généralement affichée sous forme d'arborescence hiérarchique).

Les systèmes de fichiers fournissent l'abstraction fondamentale de la hiérarchie qui permet aux ordinateurs et aux humains d'opérer sur des groupes de données sémantiquement intéressants. Bien sûr, les utilisateurs de stockage de données d'entreprise apprécient d'avoir un grand seau de stockage. Cependant, les systèmes de stockage d'objets présentent une multitude de problèmes imprévus de nouvelle génération ; par exemple, le stockage d'objets n'est pas aussi performant.

Obtenez le guide : Téléchargez le manuel de stockage de données d'entreprise

Évaluez vos besoins en matière de gestion de données non structurées

Le traitement de données à l'échelle du pétaoctet nécessite la bonne solution de stockage de données d'entreprise en fonction du type de données que vous devez analyser. Par exemple, pour traiter et analyser les données non structurées qui existent dans le cloud et sur site, les entreprises auraient besoin d'une plate-forme de données de fichiers capable de répondre aux exigences d'une infrastructure de stockage hybride tout en fournissant des analyses et des informations en temps réel. Lors de l'évaluation des types de stockage de données d'entreprise, il est plus important que jamais de choisir la solution qui correspond le mieux aux besoins actuels et futurs de votre entreprise.

Alignez vos flux de travail HPC avec une solution de stockage d'entreprise moderne

Solution de stockage de données d'entreprise moderne

Systèmes de stockage de fichiers hérités

Systèmes de stockage de fichiers hérités sont basés sur un dispositif de bloc en tant que niveau d'abstraction pour le matériel responsable du stockage et de la récupération des blocs de données souhaités ; cependant, la taille de bloc dans un système de fichiers peut être un multiple de la taille de bloc physique. Cela conduit à un manque de évolutivité et inefficacité de l'espace en raison de la fragmentation interne, car les longueurs des fichiers ne sont souvent pas des multiples entiers de la taille des blocs ; ainsi, le dernier bloc d'un fichier peut rester partiellement vide. Cela crée une fragmentation dans laquelle l'espace de stockage est utilisé de manière inefficace, réduisant ainsi la capacité et les performances.  

Systèmes de stockage d'objets hérités

Certaines entreprises tentent d'adopter systèmes de stockage d'objets hérités comme solution aux problèmes d'échelle et de géo-distribution des données non structurées. Cependant, l'adoption du stockage d'objets dans des cas d'utilisation pour lesquels il n'a jamais été conçu est une mauvaise solution technique. Pour y parvenir, les magasins d'objets compromettent intentionnellement les fonctionnalités dont de nombreux utilisateurs ont besoin et qu'ils attendent : cohérence transactionnelle, modification de fichiers, contrôle d'accès précis et utilisation de protocoles standard tels que NFS et SMB, pour n'en nommer que quelques-uns. Le stockage d'objets laisse également intact le problème de l'organisation des données ; au lieu de cela, encourager les utilisateurs à indexer les données eux-mêmes dans une sorte de base de données externe. Cela peut suffire pour les besoins de stockage des applications autonomes, mais cela complique la collaboration entre les applications et entre les humains et ces applications.

Une quantité surprenante de logique métier précieuse est encodée dans la structure de répertoires des systèmes de fichiers d'entreprise. Par conséquent, le besoin de stockage de fichiers à grande échelle reste impérieux.

Flux de travail HPC modernes

Flux de travail HPC modernes impliquent presque toujours des applications qui ont été développées indépendamment mais qui fonctionnent ensemble en échangeant des données basées sur des fichiers, un scénario d'interopérabilité qui n'est tout simplement pas possible avec le stockage d'objets. De plus, les magasins d'objets n'offrent pas les avantages d'un système de fichiers pour la gouvernance. 

Systèmes de stockage de fichiers modernes

Systèmes de stockage de fichiers modernes tel que Qumulo Core, a cherché à résoudre ce problème par une technique appelée Magasin de blocs évolutif (SBS). Le système de fichiers Qumulo est construit sur le SBS, une couche de blocs virtualisés, qui utilise les principes des bases de données distribuées massivement évolutives et est optimisé pour les besoins spécialisés des données basées sur des fichiers.

Du point de vue du stockage de blocs, le SBS est la couche de blocs du système de fichiers Qumulo et son mécanisme sous-jacent pour stocker les données, donnant au système de fichiers une évolutivité massive, performances optimisées et protection des données. Un travail fastidieux tel que la protection, les reconstructions et le choix des disques contenant quelles données se produisent dans la couche SBS, sous le système de fichiers. De cette façon, les fichiers de données non structurés peuvent être extraits dans une disposition de type de système de fichiers hiérarchique, combinant le meilleur de l'architecture du système de fichiers et de l'architecture du magasin de blocs. 

La fonctionnalité de bloc protégé virtualisé de SBS est un énorme avantage pour le système de fichiers Qumulo. Étant donné que le système de fichiers Qumulo utilise une protection basée sur les blocs, les petits fichiers sont aussi efficaces que les gros fichiers. Le résultat est un système de fichiers avec des caractéristiques d'échelle inégalées. En revanche, les appliances de stockage héritées n'étaient tout simplement pas conçues pour gérer l'échelle massive de l'empreinte des données d'aujourd'hui, qui utilise une mise en miroir inefficace pour les petits fichiers et les métadonnées du système. 

Le stockage en réseau évolutif (NAS) est-il l'avenir de la gestion du stockage de données d'entreprise (EDM) ?

NAS de stockage en réseau évolutifLes anciens systèmes de fichiers scale-up et scale-out ne sont pas capables de répondre aux nouvelles exigences de gestion du stockage sur site et dans le cloud à grande échelle. Les ingénieurs qui les ont conçus il y a 20 ans n'avaient jamais anticipé le nombre de fichiers et de répertoires, et les tailles de fichiers mixtes, qui caractérisent les charges de travail modernes. Ils ne pouvaient pas non plus prévoir le cloud computing.

L'essor des données non structurées

Les entreprises s'appuient de plus en plus sur la gestion du stockage de données non structurées (EDM) pour la réglementation, l'analyse et la prise de décision. Les données non structurées sont l'épine dorsale de l'analyse, de l'apprentissage automatique et de l'intelligence d'affaires. 

La gestion des données d'entreprise (EDM) nécessite une évolutivité

Les entreprises qui ont besoin d'activer gros des ensembles de données dans des environnements HPC avec des données non structurées signifie que la capacité de traiter et de servir des données fait partie de leur activité. Pour cette raison, les systèmes informatiques d'entreprise et les administrateurs de stockage recherchent une solution conçue pour travailler avec ce type de données de manière native. La solution de stockage idéale pour cela répondra à leurs exigences de capacité, de performances, d'intégrité des données et d'évolutivité nécessaires pour traiter les données et servir des flux de travail potentiellement denses et hautes performances. 

Solutions de stockage de données d'entreprise évolutives avec NAS évolutif

Qumulo a été fondée en 2012, alors que la crise du stockage de fichiers commençait à atteindre son point de basculement. Un groupe de pionniers du stockage, le inventeurs du NAS évolutif, ont uni leurs forces et formé une société de stockage d'un type différent, qui répondrait de front à ces nouvelles exigences. Le résultat de leur travail et de l'équipe qu'ils ont réunie est Qumulo, qui a développé le premier système de stockage de fichiers cloud hybride éprouvé au monde qui couvre le centre de données, les clouds privés et les clouds publics. Il s'adapte à des milliards de fichiers, coûte moins cher et a un coût total de possession (TCO) inférieur à celui des solutions de stockage traditionnelles. L'analyse en temps réel permet aux administrateurs d'accéder et de gérer facilement les données, quelle que soit leur taille ou leur emplacement. La réplication continue de Qumulo permet aux données de se déplacer là où elles sont nécessaires, quand elles sont nécessaires ; par exemple, entre les locaux et les clusters s'exécutant dans le cloud ou entre les clusters s'exécutant sur différentes instances de cloud.

Choisir la bonne solution de stockage de données d'entreprise

Avec ce bref aperçu de la façon d'évaluer les solutions de stockage de données d'entreprise et de comparer ces solutions, vous devriez maintenant avoir une meilleure compréhension de la façon de choisir une solution de stockage de données idéale en fonction des types de données stockées par votre entreprise. Pour plus d'informations, consultez la partie 2 de cette série dans laquelle nous proposons une comparaison plus approfondie des différents types de stockage de données : stockage de blocs vs stockage d'objets vs stockage de fichiers.

Cet article n'est que le premier d'une série de 4 parties sur Pourquoi les entreprises devraient considérer les données de fichiers lors de l'évaluation des solutions de stockage de données d'entreprise—et n'a fait qu'effleurer la surface de ces importantes considérations. Pour apprendre plus, téléchargez notre nouveau manuel d'entreprise pour notre guide le plus complet sur le choix de la bonne solution de stockage de données pour vous aider à gérer l'explosion des données non structurées.

Le nouveau manuel de stockage de données d'entreprise

Le nouveau manuel de stockage de données d'entreprise

Les données non structurées sont partout et elles se développent à des rythmes incontrôlables. Les DSI et les responsables informatiques se tournent vers des solutions de stockage évolutives pour gérer ces données et rester compétitifs. Le stockage de blocs, le stockage d'objets et le stockage de fichiers ont chacun des capacités et des limitations uniques, ce qui signifie que les systèmes de stockage au niveau de l'entreprise ne sont pas des solutions "taille unique".

Découvrez pourquoi les données non structurées sont importantes et quelle solution de stockage vous convient le mieux.

Télécharger le livre de jeu

Rester au courant!

Restez à l'écoute pour les parties 3 et 4 de cette série où nous évaluerons et comparerons les systèmes de stockage de fichiers hérités par rapport aux systèmes modernes, puis discuterons de la façon dont le Qumulo Scalable Block Store (SBS) a révolutionné l'industrie du stockage de données d'entreprise avec un système de stockage de fichiers de pointe qui offre une évolutivité massive, des performances optimisées et une protection des données.

Partager cette publication