Eureka ! Craquage du code « omique » avec StorNext à l’Institut Suisse de Bioinformatique (ISB)
L’Institut Suisse de Bioinformatique (ISB) est en première ligne de la prochaine grande révolution qui va bouleverser les sciences de la vie, à savoir l’application de méthodologies informatiques à diverses sciences bioinformatiques comme la génomique et la protéomique. L’ISB axe de plus en plus ses recherches sur la génomique appliquée afin d’améliorer la qualité de vie.
« L’ISB a récemment travaillé sur un algorithme destiné au dépistage prénatal de maladies telles que le syndrome de Down », explique le Professeur Ioannis Xenarios, directeur du groupe Vital-IT. « Un simple prélèvement sanguin effectué sur la mère à la onzième semaine de grossesse nous permet de procéder au séquençage du matériel génétique du fœtus in utero. Cette technique est moins invasive et beaucoup moins risquée qu’une amniocentèse traditionnelle. Elle démontre par ailleurs l’impact croissant de la génomique dans nos vies quotidiennes. »
Défis liés à la gestion d’un volume hebdomadaire de plus de 30 To de données
L’ISB dirige six centres de séquençage et quelque 300 équipes de recherche, avec jusqu’à 30 To de données générés chaque semaine.
« Au cours des dernières années, la vitesse de séquençage s’est nettement accélérée », déclare Roberto Fabbretti, chercheur principal et responsable informatique au Vital-IT. « Nous traitons par conséquent plus de projets que jamais auparavant, ce qui entraîne une croissance très rapide des volumes de données. »
Préservation des données associées aux travaux de recherche à long terme
« La recherche dans des domaines comme la cancérologie ou l’immunothérapie implique la collecte d’importants volumes de données séquencées pour chaque patient », souligne M. Xenarios. « Si le patient revient toutes les semaines ou tous les mois, les chercheurs doivent bénéficier d’un accès fiable et ultrarapide à l’ensemble des données des analyses précédentes. Pour étendre nos efforts en bioinformatique à des dizaines de milliers de patients, nous devons trouver un moyen économique de conserver les données génomiques pendant 20, 30 ou 40 ans en vue d’un suivi efficace du parcours du patient, de sa vie prénatale à sa mort. »
Stockage hautes performances à l’échelle du pétaoctet
Aujourd’hui, Vital-IT s’appuie sur la plate-forme de stockage en mode « scale-out » StorNext de Quantum pour son infrastructure de recherche. Quatre systèmes StorNext distincts assurent aux chercheurs un séquençage et une analyse rapides des données. Cela représente près de 1 Po de stockage primaire et 4 Po d’archives économiques sur bande. StorNext garantit un traitement hautes performances via le protocole IP sur Infiniband, conserve les données actives sur le stockage primaire à des fins d’analyse et transfère automatiquement les fichiers vers une archive sur bande AEL à mesure qu’elles vieillissent. Plus de 600 utilisateurs accèdent aux données directement depuis l’un des datacenters, ou à distance par le biais d’une interface CIFS.
Disponibilité continue des données génomiques pour les recherches grâce à un accès en libre-service
« Les données recueillies et analysées par nos chercheurs nous fournissent aujourd’hui de précieux renseignements, mais peuvent également s’avérer utiles plusieurs mois ou années après avec la sortie de nouvelles applications d’analyse à même d’extraire davantage d’informations de ces mêmes séquences brutes », explique M. Fabbretti. « StorNext nous permet d’archiver tous nos projets de manière économique, quelle que soit leur durée. »
Les fichiers archivés sont toujours visibles aux chercheurs, à l’endroit du système de fichiers où ils s’attendent à les trouver, si bien qu’ils sont facilement accessibles sans l’aide du département informatique.
« Pour aller plus loin, les chercheurs doivent disposer d’un jeu d’outils approprié », confie M. Xenarios. « La plate-forme de stockage multiniveau StorNext® accélère l’ingestion des données ainsi que leur déplacement vers une archive, tout en les tenant à la disposition des bioinformaticiens afin qu’ils puissent poursuivre leurs travaux. »
Protection automatisée des données les plus précieuses au monde
« StorNext ne se contente pas d’accélérer la capture des données : il automatise l’archivage et en réduit le coût pour nous aider à remplir notre rôle de dépositaires des données », explique M. Fabbretti. « Nous effectuons systématiquement deux copies des fichiers sur bande. L’une d’elles reste disponible dans l’archive, tandis que l’autre est externalisée en vue d’une protection renforcée en cas de panne matérielle ou de sinistre d’un site. »
« Les données que nous traitons comptent parmi les plus précieuses au monde », ajoute M. Fabbretti. « StorNext nous offre une capacité d’archivage de plusieurs pétaoctets, une protection des données à long terme et la possibilité de revenir à une version antérieure des fichiers. Autant de facteurs essentiels à notre stratégie. »
L’ISB paré à affronter l’avenir grâce à une solution évolutive
« StorNext accompagne notre croissance depuis plus de six ans. Nous pouvons désormais ajouter des disques et augmenter la capacité en toute simplicité chaque fois que nécessaire. En fait, nous sommes allés au-delà de la génomique en stockant et en protégeant des données de recherche médicale générale. La capacité de StorNext à intégrer aisément des niveaux de stockage supplémentaires, de type objets ou Cloud par exemple, dans notre workflow de stockage à mesure que nos besoins augmentent est cruciale pour nous. »