2015年1月,中科院北京基因组研究所海量磁带库备份系统上线,该系统经前期调研、招标、谈判、装置、调试、验收等一系列事情后于日前正式投入使用。
该系统的引进将有效缓解所内高性能集群数据存储缺乏的问题,满足研究所迅速增长的大数据存储需求,确保数据的宁静性及恒久生存,同时为研究所高性能盘算平台提供了有利的存储支持。
近年来,随着组学研究发动的生物大数据时代的到来,高通量测序技术的迅速生长,组学数据亦泛起了爆炸式增长。在资源相对有限的情况下,一方面新爆发的数据需要存储,而另一方面大宗非活跃的数据却占据了大部分存储空间。如何解决这一矛盾——构建本钱低廉、容量大、宁静性高、易扩展的存储介质将是重要举措。
高性能盘算平台外观图
该套系统同普通存储相比,降低了80%以上的电能消耗,也大大降低了数据存储的使用本钱。其初期可以备份数据量抵达3PB,并可便当扩展到10PB甚至更多。系统内部装置有1200盘LTO6磁带(单盘2.5TB),4台LTO6光纤接口磁带驱动器,最大数据吞吐量1600MB/秒。
磁带库系统外观图
该套系统作为一种大规模的离线存储资源,是研究所现有的高性能盘算和在线存储资源的有力增补。其已无缝接入研究所具有5000余CPU盘算焦点及近4PB在线存储能力的高性能盘算平台,用户无需繁琐庞大的操作就可以便当的将数据转移到磁带库系统。预计,在2015年,该系统将为研究所高性能盘算平台中的400余用户提供数据存储及备份效劳。
磁带库系统内部图