Gérer les volumes de données, la visibilité et une vision d'avenir pour les organisations de recherche en génomique et des sciences de la vie

C'est une semaine passionnante pour la recherche biomédicale, la découverte et le développement de médicaments et les professionnels de la santé en tant que Conférence mondiale Bio-IT et Expo virtuelle démarre aujourd'hui. Nous sommes ravis d'entendre les participants parler de leurs besoins en matière de capture, de traitement, de collaboration et de gestion de données de fichiers.

Défis courants de la gestion des données

Je m'attends à ce que la gestion des données soit un sujet brûlant cette semaine, alors que les chercheurs en sciences de la vie et en génomique recherchent des plates-formes et des services de données permettant une puissance de calcul accrue, ainsi que des solutions capables d'évoluer pour gérer efficacement des milliards de points de données et de fichiers.

Nous comprenons que les chercheurs et autres professionnels biomédicaux sont mis au défi non seulement de tirer des connaissances significatives des volumes massifs de données, mais aussi d'être en mesure d'analyser et de fournir les données résultantes plus rapidement que jamais.

L'objectif de Qumulo est d'aider les organisations de recherche à se concentrer sur leur science plutôt que sur leur stockage.

Vous trouverez ci-dessous quelques-uns des défis courants en matière de gestion des données que nos clients nous disent et comment la plate-forme de données de fichiers de Qumulo peut vous aider.

Défi n ° 1: volumes de données

L'Institut médical futuriste estime qu'un seul génome humain occupe 100 gigaoctets d'espace de stockage. Au fur et à mesure que de plus en plus de génomes sont séquencés, les besoins de stockage passeront de gigaoctets à pétaoctets à exaoctets.

«D'ici 2025, environ 40 exaoctets de capacité de stockage seront nécessaires pour les données génomiques humaines», selon l'Institut.

Et cette croissance des données ne s'arrête pas de sitôt.

Lorsque vous avez un grand nombre de fichiers comme ceux-ci, la structure des répertoires et les attributs des fichiers deviennent eux-mêmes des données volumineuses.

La plate-forme de données de fichiers de Qumulo est unique dans sa façon d'aborder le problème de évolutivité. Il est conçu pour atteindre des milliards de fichiers et stocker efficacement toutes les tailles de fichiers. La conception de la plate-forme met en œuvre des principes similaires à ceux utilisés par les bases de données distribuées modernes à grande échelle. Le résultat est une plate-forme de données de fichiers avec des caractéristiques d'échelle inégalées.

Défis n ° 2: visibilité des données

Lorsque vous avez des milliards de fichiers dans un système de stockage, vous avez besoin d'un moyen de les gérer.

Les administrateurs de systèmes de fichiers hérités peuvent souvent être gênés par la «cécité des données», ce qui signifie qu'ils ne peuvent pas obtenir une image précise de ce qui se passe dans leur système de fichiers.

Institut de calcul scientifique et d'imagerie (SCI) de l'Université de l'Utah ne connaissait que trop bien ce défi. L'organisation a été confrontée à d'énormes fichiers de données - et à des problèmes de traitement et de capacité tout aussi massifs.

«Lorsque nous sommes à court de capacité, la direction venant d'en haut est inévitablement" supprimer simplement les anciennes données "», a déclaré Nick Rathke, directeur adjoint des technologies de l'information à l'Institut SCI. «Mais quelles vieilles données? Il y a une grande différence entre les données anciennes et les données importantes, et je ne peux pas dire laquelle est laquelle sans exécuter de longs rapports manuels. »

Compte tenu de ce manque de visibilité, l'équipe de Rathke a également eu du mal à travailler avec les utilisateurs sur la gestion du stockage. "Je ne peux pas leur dire facilement combien ils utilisent, je ne peux pas contester l'importance d'un dossier qui n'a pas été touché depuis des années, je ne peux pas suivre les allocations - c'est un processus extrêmement douloureux."

La plate-forme de données de fichiers de Qumulo est conçue pour donner exactement ce type de visibilité, quel que soit le nombre de fichiers et de répertoires. Vous pouvez obtenir un aperçu immédiat des tendances de débit et des hotspots. Vous pouvez également définir des quotas de capacité en temps réel, ce qui évite la surcharge de provisionnement des quotas du stockage hérité. Les informations sont accessibles via une interface utilisateur graphique et il existe également une API REST qui vous permet d'accéder aux informations par programme.

Défi n ° 3: Réaliser une vision pour la gestion des données sur site, dans le cloud public et multicloud

Les organisations de recherche se tournent de plus en plus vers le cloud pour leur donner plus de ressources de calcul pour leurs analyses.

Ce qui est le plus intéressant, c'est pourquoi cela se produit actuellement dans les sciences de la vie, selon Accenture. «Dans d'autres secteurs, le stockage de données rentable et le délai de mise sur le marché accéléré sont les principaux moteurs. Cependant, les organisations des sciences de la vie considèrent que tirer parti de l'expertise et de la capacité de concentrer leurs ressources sur l'innovation sont les principaux avantages de la migration vers le cloud.

«Parce qu'il offre aux entreprises la flexibilité et la capacité de mettre à l'échelle les capacités d'infrastructure, d'informatique et d'analyse à la demande plutôt que d'attendre de grands déploiements informatiques traditionnels, le cloud permet aux organisations de passer de l'idée à l'expérimentation, au déploiement à grande échelle. à une vitesse sans précédent. »

L'approche unique et définie par logiciel de Qumulo qui permet à notre système de fichiers de fonctionner à la fois sur site et dans le cloud. Qumulo fonctionne sur Serveurs Apollo Gen10 de Hewlett-Packard Enterprise (HPE), Fujitsu et dans le cloud sur Amazon Web Services (AWS) et des tours Google Cloud Platform (GCP).

Les plates-formes de cloud public telles que AWS ou GCP offrent une flexibilité aux organisations de sciences de la vie et de recherche. L '«élasticité» inhérente aux ressources cloud permet aux organisations de mettre à l'échelle leurs ressources de calcul en fonction de la quantité de données qu'elles doivent analyser.

Apprendre encore plus

Regardez ce webinaire gratuit à la demande avec moi, Adam Kraut de BioTeam, Inc., et Emric Delton de ARUP Laboratories, pour les tendances de l'industrie et des conseils pour accélérer la recherche en génomique: "Accélérer la recherche génomique avec des solutions de cloud hybride. »

Participants inscrits de Monde Bio-IT peut visiter le stand de Qumulo pour des discussions Zoom interactives, des démos privées ou pour télécharger des études de cas, des livres blancs et d'autres documents. Envoyez un courriel aux représentants de Qumulo au salon Brian Conway (bconway@qumulo.com) ou Matt Boutin (mboutin@qumulo.com) pour organiser une réunion, ou envoyez-nous un tweet @Qumulo - nous serions ravis de vous parler!

Ne pas oublier de Abonnez-vous à notre blog!

Partager cette publication