Heureka! Swiss Institute of Bioinformatics knackt mit StorNext den 'Omik-Code
Das Swiss Institute of Bioinformatics (SIB) steht an der Spitze der nächsten großen Revolution in den Biowissenschaften – der Anwendung von computergestützten Methoden in Genomik, Proteomik und anderen Gebieten der Bioinformatik. In letzter Zeit konzentriert sich das SIB verstärkt auf die angewandte Genomik, die konkret dazu beitragen kann, die Lebensqualität zu verbessern.
„Das SIB hat vor kurzem einen Algorithmus für einen pränatalen Diagnosetest auf Bedingungen wie das Down-Syndrom entwickelt“, erläutert Professor Ioannis Xenarios, Director der Vital-IT Group. „Mit einer einfachen Blutabnahme bei der Mutter in der 11. Schwangerschaftswoche können wir das genetische Material des Fötus in der Gebärmutter sequenzieren. Diese Methode ist weniger invasiv und viel weniger riskant als die bislang übliche Fruchtwasserentnahme. Und sie zeigt, dass Genomik heute im Alltagsleben eine immer größere Rolle spielt.“
Über 30 TB pro Woche stellen besondere Anforderungen an das Datenmanagement
Das SIB betreibt sechs verschiedene Sequenzierungszentren und unterstützt ca. 300 aktive Forschungsteams, die jede Woche bis zu 30 TB Daten generieren.
„In den letzten Jahren ist die Sequenzierung viel schneller geworden“, erklärt Roberto Fabbretti, Senior Scientist und IT Manager bei Vital-IT. „Das bedeutet, wir verarbeiten mehr Projekte denn je und unser Datenvolumen explodiert.“
Lange Projektlaufzeiten erfordern eine zuverlässige Datensicherung
„In Bereichen wie der Krebsforschung und Immuntherapie erfassen wir von jedem Patienten große Mengen an sequenzierten Daten“, so Xenarios. „Wenn diese im Wochen- oder Monatsrhythmus zur Untersuchung erscheinen, benötigen die Wissenschaftler innerhalb kürzester Zeit exakten Zugriff auf alle Daten der vorherigen Tests. Um längerfristig Zehntausende Patienten unterstützen zu können, brauchen wir kosteneffektive Verfahren, mit denen wir genomische Daten 20, 30 oder selbst 40 Jahre vorhalten können – und damit im Prinzip ein Bild des Patienten erstellen, das von vor seiner Geburt bis zu seinem Ableben reicht.”
Hochperformanter Storage im PB-Bereich
Vital-IT unterstützt seine Forschungsinfrastruktur mit StorNext Scale-Out Storage von Quantum. Vier separate StorNext-Systeme – fast 1 PB Primärspeicher und 4 PB an kosteneffizienten Tape-Archiven – bieten den Wissenschaftlern Hochgeschwindigkeitszugriff auf Sequenzierungs- und Analysedaten. StorNext unterstützt die hochperformante Verarbeitung mittels IP over Infiniband. Aktive Daten werden für Analysezwecke auf dem Primärspeicher vorgehalten und bei zunehmendem Alter automatisch in das langfristige Archiv verschoben. Über 600 Anwender greifen auf die Daten zu – entweder lokal über eines der Rechenzentren oder remote über eine CIFS-Schnittstelle.
Self-Service-Zugriff sichert direkte Verfügbarkeit der Forschungsdaten
„Die Daten, die die Wissenschaftler erfassen und analysieren, liefern schon heute wichtige Antworten. Sie haben aber auch für die kommenden Monate oder Jahre ein immenses Potenzial, denn neue Analyseanwendungen sind dann möglicherweise in der Lage, aus denselben Rohsequenzen noch ganze andere Informationen abzuleiten“, so Fabbretti. „StorNext ermöglicht uns eine kosteneffektive langfristige Archivierung all unserer Projekte – unabhängig von ihrer voraussichtlichen Laufzeit.“
Die archivierten Dateien werden weiterhin im Dateisystem angezeigt, sodass die Wissenschaftler direkt, ohne Unterstützung durch die IT, darauf zugreifen können.
„Wenn man Forschern die richtigen Tools an die Hand gibt, sind sie nicht mehr zu bremsen“, berichtet Xenarios. „Mit dem mehrstufigen StorNext-Storage können wir Daten schnell einspeisen, sie rasch ins Archiv verschieben und dort bereithalten, sodass die Bioinformatiker mit ihrer Arbeit fortfahren können.
Automatische Sicherung für einige der wertvollsten Datensätze weltweit
„StorNext gewährleistet nicht nur, dass wir Daten schnell erfassen können – es erlaubt uns auch eine automatische, kosteneffektive Archivierung, mit der wir unserer Rolle als Datenhüter gerecht werden“, führt Fabbretti aus. „Wir legen immer zwei Kopien der Dateien auf Tape an, wobei wir die eine im Archiv verfügbar halten und die andere extern aufbewahren, um bei einem eventuellen Hardwarefehler oder Standortausfall zusätzlich abgesichert zu sein.“
„Wir haben es mit einigen der wertvollsten Datensätze weltweit zu tun“, so Fabbretti. „StorNext sichert uns Archivkapazitäten im Umfang von mehreren Petabyte, eine langfristige Datensicherung und die Möglichkeit, mühelos frühere Dateiversionen wiederherzustellen – und ist damit ein erfolgskritischer Bestandteil unserer Strategie.“
Mit Skalierbarkeit für die Zukunft gerüstet
„StorNext hält nun schon seit über sechs Jahren mit unserem Wachstum Schritt. Wir wissen, dass wir im Bedarfsfall einfach weitere Disks hinzufügen können, um die Kapazität aufzustocken. Tatsächlich speichern und sichern wir mittlerweile nicht mehr nur unsere genomischen Daten auf StorNext, sondern auch allgemeine Datensätze mit medizinischen Forschungsdaten. Dabei ist uns sehr wichtig, dass wir mit StorNext ggf. auch problemlos weitere Ebenen wie Cloud oder Object Storage in unseren Storage-Workflow einbinden können.“