ベストマッチなStorNextのDNA
30億個のDNA塩基であろうとStorNextには問題ありません
24種類のヒト染色体のDNAを構成する30億個の塩基配列の決定よりも、さらにデータ集約的な作業がいくつかあります。そのデータを管理することは、ベイラー医科大のヒトゲノム配列決定センター(HGSC)がクアンタムのStorNextを導入するまで、煩雑を極めた仕事でした。導入の結果、膨大な量の研究データを瞬時に共有できるコスト効率の高いデータ管理を行えるようになりました。
レガシー・システムのキャパシティを超えるデータ量
疾病への遺伝的影響に関する研究をリードする米国の三大拠点の1つであるHGSCには、DNA配列決定データの分析に携わる多数の研究者が働いています。HGSCでは、毎日膨大な量のデータが生成され、解析のためにいつでも数百テラバイトのデータを利用できる必要があることから、断片的な技術インフラは重要な研究の障壁となっていました。
2008年にGeraint Morgan氏が情報システムのディレクターに指名された頃には、データ量はすでにHGSCのストレージ能力を圧迫しており、次の2年間でさらに20ペタバイト増加することが予測されました。また、複雑な異種環境のサーバ、ネットワーク、およびストレージ技術を集中管理しなければならないという課題がありました。
ビッグデータに実績のあるStorNext
ビッグデータの課題を抱えている他の会社を調べたときに、常にある名称が現れていることにMorgan氏はすぐ気が付きました。それがクアンタムのStorNextです。
「StorNextには、当社が必要としているスケーラビリティ、ハードウェアの追加購入に大きな投資をしなくても済む既存のストレージ・ハードウェアのサポート、管理しやすいシステムという特長がありました」とMorgan氏は述べています。
HGSCは、複数のオペレーティング環境間でのファイル共有やストレージ階層間でのデータ移動の自動化を実現するために、StorNextファイル・システムとストレージ・マネージャを導入しました。
現在、ローカルのゲノム・スキャナー・デバイスで取り込まれたデータは、集中管理のStorNextファイル・システムにコピーされます。StorNextを展開したLANクライアントがデータを並列処理する中央ストレージに接続されており、このクライアント上で複数のゲノム解析アプリケーションが動作しています。StorNextのストレージ・マネージャが自動的に各種のディスク・システムとクアンタムのScalarテープ・ライブラリ間でデータを移動し、コンテンツを低コストで保護します。
StorNextを導入して以来、Morgan氏はそのメリットにとても満足しています。
「生成されたデータが今は価値あるものか不明ですが、将来の重要な発見につながるかもしれないというゲノム研究の性質を考えて、HGSCで生成されたすべてのデータを保存しています」とMorgan氏は述べています。「このように増え続けアーカイブの管理にStorNextは重要な役割を果たします。急激なデータの増加も、StorNextで提供されるデータ重複排除機能を使用することを計画している理由の1つです。この機能を使えば、アーカイブに必要なストレージ容量を最適化することができます」