Rechercher
Fermez ce champ de recherche.

Qumulo : la solution de fichiers basée sur le cloud la plus rapide du secteur pour les charges de travail d'IA

Rédigé par:

Le monde de l' intelligence artificielle (IA) a connu une croissance exponentielle et a une soif insatiable de consommer des données. Des voitures autonomes aux chatbots qui imitent la conversation humaine, l’IA révolutionne les industries à un rythme effréné. La puissance de l’IA provient de sa base de données. L'accès aux données, la vitesse de leur traitement et les performances de stockage évolutives sont autant de facteurs essentiels qui déterminent l'efficacité d'un pipeline d'IA. C'est là que Qumulo s'est révélé être la meilleure solution de stockage de données au monde pour les charges de travail d'IA, en tant que solution de données de fichiers la plus performante et la plus rentable du secteur dans le cloud.

Pourquoi Qumulo est idéal pour les charges de travail d'IA basées sur des fichiers

Les applications d'IA, qu'il s'agisse de modèles d'apprentissage profond ou de réseaux de neurones, nécessitent un ensemble unique de caractéristiques de stockage, qui sont toutes satisfaites par Qumulo :

  1. Évolutivité: Les ensembles de données d'IA sont dynamiques. Ils augmentent avec le temps à mesure que davantage de données sont collectées et traitées. La capacité de Qumulo à évoluer avec des performances élevées et prévisibles garantit qu'à mesure que les charges de travail d'IA augmentent, Qumulo peut répondre à ses demandes à n'importe quelle échelle.
  2. Rentabilité: Financer des initiatives d’IA peut représenter un investissement important. Économiser sur les coûts de stockage sans compromettre les performances peut libérer des ressources pour d'autres domaines critiques, qu'il s'agisse de recherche, de développement ou de déploiements de production.
  3. Possibilité d'évoluer n'importe oùTM: Les propriétaires d'infrastructures et les data scientists bénéficient de la flexibilité de la formation dans un endroit, mais du déploiement dans un autre, avec une infrastructure hautement sécurisée. Le système de stockage défini par logiciel de Qumulo peut être déployé et exécuté n'importe où. Cela facilite la formation d'un modèle d'IA dans le centre de données principal, mais permet de le mettre en production n'importe où.
  4. Performance : Les modèles d'IA, en particulier ceux utilisés dans des scénarios tels que les véhicules autonomes ou les transactions financières, nécessitent un accès aux données en temps réel pour la formation préalable et post-modèle. La récupération de données à grande vitesse de Qumulo garantit la disponibilité des données au moment où c'est nécessaire.

Examinons la puce n°4 et soulignons l'importance d'une récupération transparente et ultra-rapide des données/métadonnées. Ceci est vital pour les applications d’IA qui nécessitent un stockage de fichiers évolutif – sur site ou dans le cloud.

En testant des charges de travail d'IA synthétiques, nous avons constaté que nous sommes effectivement la solution cloud basée sur des fichiers la plus rapide du marché pour l'IA, où les scientifiques des données peuvent utiliser Qumulo pour la collecte de données, la pré-formation, la formation en production et l'inférence continue, quelle que soit l'échelle. .

Continuer à lire.

Benchmark d’IA largement applicable

Pour mettre en perspective les capacités de performances de Qumulo, examinons le dernier résultat obtenu avec Qumulo fonctionnant dans le cloud sur l'infrastructure AWS. Nous avons utilisé SPECstorage pour caractériser les performances de l'IA sur Qumulo. Ce benchmark (bien nommé AI_Image) exploite la taille des fichiers et les modèles d'E/S qui exercent de manière synthétique et précise les charges de travail d'IA courantes :

  • Basé sur Tensorflow les meilleures pratiques – le framework IA/ML le plus largement déployé au monde
  • Tracé à partir de 3 modèles différents : Resnet, VGG (Visual Geometry Group) et SSD (Single shot detector)
  • Utilisation d'ensembles de données open source de CityScape, ImageNet et COCO

En raison de l'omniprésence de Tensorflow dans l'espace de l'IA, le benchmark s'applique à un large éventail de charges de travail de modèles d'IA qui produisent des résultats d'IA pour :

  1. Classification d'images et détection d'objets
  2. Traitement du langage naturel (PNL)
  3. Reconnaissance vocale
  4. Systèmes de recommandation
  5. Modèles génératifs
  6. Santé et sciences de la vie

…et beaucoup plus

Description du benchmark et résultats obtenus

L'objectif du benchmark est de transmettre rapidement les données du stockage Qumulo à la couche application (à l'aide de GPU) exécutant les tâches d'IA. Le benchmark teste les performances de stockage et la latence à partir d'un ensemble réaliste de modèles d'E/S provenant d'un lot de clients. Les clients augmentent progressivement leur nombre de tâches d'IA jusqu'à atteindre l'objectif, qui dans le cas de ce test est un total de 480 tâches. Il y a quatre opérations principales dans le benchmark, avec 4 sous-charges de travail simultanées indépendantes :

  • AI_SF – Lectures de petits fichiers image
  • AI_TF – Écrit des fichiers plus volumineux (idéalement plus de 100 Mo de fichiers)
  • AI_TR – Lit dans de grands TFRecords
  • AI_CP – Effectue des points de contrôle occasionnels

Résultats

La figure 1 ci-dessous affiche les résultats suivants :

  • L'axe X montre le nombre de tâches exécutant le benchmark IA au fil du temps
  • L'axe Y montre la latence globale pendant toute la durée du test
  • La latence montre les performances de stockage de manière rapide et prévisible à mesure que le nombre de tâches d'IA augmente !

Fig. 1

Qumulo est le stockage le plus rapide pour l'IA dans le cloud

** Comparaison basée sur les systèmes les plus performants dans les cloud publics publiée sur www.spec.org en octobre 2023. SPEC® et le nom de référence SPECgeneric® sont des marques déposées de Standard Performance Evaluation Corporation. Pour plus d'informations sur SPECstorage2020, voir https://www.spec.org/storage2020/.

Applicabilité sur site

Bien que les tests de référence SPECstorage aient utilisé un environnement basé sur le cloud, ces résultats peuvent être facilement extrapolés pour estimer les résultats en utilisant un matériel sur site similaire. Lorsque Qumulo publie ce benchmark sur le site Web de SPEC (ETA décembre/2023), les détails et le coût de l'environnement peuvent être trouvés, en notant les types d'instances EC2 (nombre de cœurs, mémoire disponible, etc.) utilisés et la bande passante disponible dans le réseau. environnement. En attendant, nous incluons les détails supplémentaires en annexe de ce blog pour les lecteurs curieux.

Scientifiques des données et ingénieurs des données, voici. Essayez-le vous-même !

Dans le monde en évolution rapide de l’IA, disposer d’une solution de stockage robuste, rapide et évolutive n’est pas un luxe mais une nécessité. Qumulo, avec ses performances et sa rentabilité de pointe, se distingue comme la solution de fichiers cloud de référence pour les charges de travail d'IA. Le benchmark souligne non seulement les prouesses de Qumulo, mais consolide également sa position de solution de stockage la plus rapide et la plus largement applicable pour l'IA.

See résultats complets publié sur Spec.org




Appendice


Performance

Temps de réponse global = 1.22 ms

La Brochure
Métrique
(AI_Jobs)
Moyen
Latence
(ms)
AI_Jobs
Opérations/Sec
AI_Jobs
Mo/sec
16 1.360 6960 1565
32 1.281 13921 3127
48 1.313 20882 4691
64 1.213 27843 6255
80 1.201 34804 7822
96 1.147 41765 9385
112 1.158 48726 10950
128 1.123 55687 12514
144 1.122 62648 14082
160 1.109 69609 15644
176 1.144 76570 17208
192 1.117 83530 18774
208 1.112 90491 20340
224 1.112 97452 21899
240 1.121 104413 23470
256 1.271 111374 25037
272 1.143 118335 26598
288 1.155 125296 28161
304 1.197 132257 29729
320 1.205 139218 31289
336 1.257 146178 32859
352 1.323 153139 34418
368 1.430 160100 35984
384 1.503 167061 37552
400 1.632 174022 39112

Informations sur le produit et les tests

Qumulo – Référence du cloud public
Testé par Qumulo, Inc.
Matériel disponible Novembre 2023
Logiciel disponible Novembre 2023
Date du test Novembre 2023
Numéro de licence 6738
Emplacements des titulaires de licence Seattle, WA USA

Qumulo est une solution de stockage de fichiers cloud hybride qui offre une évolutivité de plus d'exaoctets dans un seul espace de noms, des fonctionnalités identiques que ce soit sur site ou dans le cloud, et une prise en charge multiprotocole complète, garantissant flexibilité et compatibilité entre diverses applications. En s'intégrant de manière transparente à l'infrastructure de cloud public, Qumulo offre un stockage de données non structurées à n'importe quelle échelle, avec une visibilité en temps réel sur les performances de stockage et l'utilisation des données.

Le système de fichiers cloud natif de Qumulo permet aux organisations de migrer en toute transparence des applications et des charges de travail basées sur des fichiers vers l'environnement de cloud public. Avec Qumulo, les entreprises peuvent gérer efficacement des exaoctets de données, que ce soit sur site ou dans le cloud. Les résultats suivants démontrent clairement que le système de fichiers Qumulo excelle dans l'offre de performances exceptionnelles lorsqu'il est déployé sur AWS.

Solution en cours de test Nomenclature

Point n Qté Type Vendeur Nom du modèle Description
1 16 Instances AWS EC2 AWS c5n.18xlarge Nœuds Qumulo – Instances Amazon c5n EC2 (les instances c5n.18xlarge ont 72 vCPU, 192 Go de mémoire, une mise en réseau de 100 Gbit/s)
2 16 Instances AWS EC2 AWS c5n.18xlarge Clients Ubuntu – Cluster Qumulo – Instances Amazon c5n EC2 (les instances c5n.18xlarge ont 72 vCPU, 192 Go de mémoire, réseau 100 Gbit/s)

Schémas de configuration

Qumulo dans AWS

Qumulo dans AWS

Logiciel composant

Point n Composant Type Nom et version Description
1 Qumulo Core Système de fichiers 6.2.2 Le système de fichiers natif cloud de Qumulo permet aux organisations de déplacer sans effort des applications et des charges de travail basées sur des fichiers vers le cloud public.
2 Ubuntu Système d'exploitation 22.04 Le système d'exploitation Ubuntu est déployé sur les seize nœuds de calcul c5n.18xlarge. Ils sont utilisés comme clients exécutant les benchmarks SPEC Storage 2020.

Configuration et réglage du matériel – Physique

Nom du composant
Le nom du paramètre Valeur Description
SR-IOV Activé Active la technologie de virtualisation du processeur
Vitesse du port 100 GbE Chaque nœud dispose d'une connectivité 100 GbE

Notes de configuration et de réglage du matériel

Aucun

Configuration et réglage du logiciel – Virtuel

Réseautage
Le nom du paramètre Valeur Description
Cadres Jumbo 9001 Permet des trames jumbo Ethernet jusqu'à 9001 XNUMX octets
Paramètres de montage NFS des clients Ubuntu
Le nom du paramètre Valeur Description
Vers 3 Utiliser NFSv3
nconnecter 16 Augmentez le nombre de connexions client NFS jusqu'à 16
tcp Protocole de transport réseau TCP pour communiquer avec le cluster Qumulo
local_lock TOUTE Le client suppose que les verrous flock et POSIX sont locaux
Paramètre de volume EBS
Le nom du paramètre Valeur Description
IOPS 16000 IOPS maximales pour le volume EBS
Cadence de production 1000 Débit maximum pour le volume EBS

Notes de configuration et de réglage du logiciel

Aucun

Remarques sur les SLA de service

AWS déploie des efforts commercialement raisonnables pour rendre les produits et services inclus disponibles chacun avec un pourcentage de disponibilité mensuel d'au moins 99.99 %, dans chaque cas pendant tout cycle de facturation mensuel. Le pourcentage de disponibilité mensuel est calculé en soustrayant de 100 % le pourcentage de minutes au cours du mois au cours duquel l'un des produits et services inclus, le cas échéant, était dans l'état « Région indisponible ».

Stockage et systèmes de fichiers

Point n Description Protection des données Stockage stable Qté
1 Volume de stockage Elastic Block, capacité de 1 To gp3. Chaque nœud Qumulo dispose de 6 volumes EBS. Protection de 2 disques ou 1 nœud avec codage d'effacement AWSEBS 96
Nombre de systèmes de fichiers 1
Capacité totale 78.54 TB
Type de système de fichiers Qumulo

Notes de création du système de fichiers

Le système de fichiers Qumulo Core est déployé sur AWS via un modèle de formation cloud ou Terraform. L'AMI Qumulo Core est déployée et le système de fichiers est configuré dans le cadre du processus automatisé de formation de cloud ou via Terraform. Aucune étape supplémentaire de création de système de fichiers n'est requise.

Notes sur le stockage et le système de fichiers

Aucun

Configuration du transport – Virtuel

Point n Type de transport Nombre de ports utilisés Notes
1 Carte réseau virtuelle Ethernet 100 Gbit/s 16 Utilisé par les machines clientes
2 Carte réseau virtuelle Ethernet 100 Gbit/s 16 Utilisé par Qumulo Core pour les communications inter-nœuds ainsi que pour les communications avec tous les clients.

Remarques sur la configuration des transports

Aucun

Commutateurs – virtuels

Point n Changer de nom Type de commutateur Nombre total de ports Nombre de ports utilisés Notes
1 AWS Ethernet 100 Gbit/s avec mise en réseau améliorée 16 16 Utilisé par les machines clientes
2 AWS Ethernet 100 Gbit/s avec mise en réseau améliorée 16 16 Utilisé par les nœuds Qumulo Core

Éléments de traitement – ​​virtuels

Point n Qté Type Localisation Description Fonction de traitement
1 1152 Processeur virtuel c5n.18xlarge Noyau Qumulo Processeurs Intel Xeon Platinum 3.5 GHz Qumulo Core, communication réseau, fonctions de stockage
2 1152 Processeur virtuel c5n.18xlarge Noyau Qumulo Processeurs Intel Xeon Platinum 3.5 GHz Spécifications des processeurs de référence du client de stockage

Notes sur les éléments de traitement

Aucun

Mémoire – Virtuelle

Description Taille en Gio Nombre d'instances Non volatile Gio totaux
Mémoire d'instance AWS EC2 c5n.18xlarge 192 16 V 3072
Mémoire d'instance AWS EC2 c5n.18xlarge 192 16 V 3072
Gibioctets de mémoire totale totale 6144

Notes de mémoire

Aucun

Stockage stable

Qumulo Core utilise des appareils Elastic Block Storage (EBS) ; qui offrent un stockage stable.

Notes de configuration de la solution en cours de test

La solution testée était un cluster distribué standard construit à l'aide de Qumulo Core. Les clusters Qumulo Core peuvent gérer des E/S de fichiers de grande et petite taille ainsi que des applications gourmandes en métadonnées. Aucun réglage spécialisé n’est requis pour les charges de travail différentes ou à usage mixte.

Articles Similaires

Remonter en haut