浪潮存储服务清华大学,推动中国脑科学研究

2019-06-18 22:31:58

背景:人类始终对“大脑”这个重要器官怀着浓浓的好奇:大脑是怎么指挥我们日常行为的?八百亿神经元是如何协同传递信息的?经过数年的攻关,清华大学推出了综合指标国际领先的多维多尺度高分辨光学显微成像系统(简称RUSH脑成像),采用浪潮分布式存储提供PB级容量和20.16GB/s的带宽,承载了小鼠全脑皮层神经元的实时成像研究。

 

浪潮存储服务清华大学,推进脑科学研究

正文:

近期,清华大学多维多尺度高分辨率显微成像(简称RUSH脑成像)项目取得重大进展,其第二代RUSH的视场、分辨率、帧率、数据通量等综合技术指标国际领先,可实现对小鼠全脑皮层神经元的分布、动态功能信号传递过程的精准呈现,对推动中国生命和医学科学发展,提升脑科学研究和应用水平具有重大战略意义。

活体全脑成像 难在哪?

开展大脑研究,需要在活体动物的全脑上进行观测和研究。因此清华大学脑科研项目组选择了小鼠大脑率先进行全脑实时成像研究。

RUSH脑成像项目对拥有1亿神经元的小鼠大脑进行了研究

但是,这项工作的复杂性极高,要知道,小鼠大脑的神经元胞体直径大概只有10微米,神经元之间连接的突触才2~4微米,而小鼠大脑有一亿个左右的神经元,神经元之间有千余个数据连接,即使是最简单的神经连接也可能跨越大脑的两个半球,其神经网络的复杂程度远远超越当今的互联网。而考虑到人类大脑规模是小鼠的大脑的800倍(神经元数量),复杂度不可同日而语。

从脑成像角度来看,要对大脑进行观测,不仅需要宽阔的视野和极高的分辨率,还需要极高的呈现速度来观测动态信号传递过程。

清华大学范静涛老师表示,“在RUSH研究之前,现有的显微观测设备,要么可以实现足够高的分辨率,但难以观测到全脑;要么可以观测到全脑神经活动,但无法观测到足够的神经元细节。主要原因是同时受制于光学成像能力和数据采集-传输通量瓶颈。”如今,在清华RUSH项目组的努力下,这一情况已经被改写。

脑成像:每秒100亿像素、每天2.7PB,还不能丢帧

RUSH-II实现了视场大小 1平方厘米、分辨率0.4微米、帧率30帧/秒的指标,意味其能够更好地满足对于大脑的观测需求。

RUSH脑成像项目在拍摄过程中每秒100亿像素数据通量,每天产生1.5PB数据

如果说大视场、高分辨率考验着RUSH脑成像项目的光学特性,那么要满足“极高的呈现速度”这个需求,就需要数字化能力的支撑。RUSH脑成像项目有着28台相机,每台相机1200万像素,在连续拍摄过程中会产生100.8亿像素/秒的数据通量,这就意味着当其连续拍摄任务中,每天将产生2.7PB左右的数据,存储系统显然要具备极高的容量。

“清华脑科研项目对于存储的要求不仅在于容量,更大的挑战是存储要实时在线,不能丢帧”,清华大学范静涛表示。例如,在研究过程中,研究人员会在小鼠血液中加入荧光剂,然后会使用RUSH中的28台相机,以每秒30帧、连续72小时的方式对小鼠进行拍摄,最后将这些图片拼接成三维图像序列。由于小鼠是活体的,其血液无时无刻不在流动,相机需要去追踪每一个细胞的流动曲线,即使出现一帧的丢失,也会让研究人员无法跟踪到全过程,3D成像的拼接也无从谈起,会导致耗时、耗资巨大的拍摄项目功亏一篑。

除此之外,RUSH脑成像项目对于存储系统所带来的挑战还有很多。比如,RUSH脑成像系统的摄像仪器每秒钟会产生840个文件、每个文件24MB,这些海量的小文件非常考验存储系统的处理能力;又如,在某些生命科学成像观测中,长达72小时的观测会产生海量的文件,而且从第一个文件到写满,不能丢帧,这就需要确保长时间的稳定写入;再如,RUSH-II无法采用冷数据备份,所以需要采用创新数据冗余机制,确保数据不丢失。

分布式存储:以智能运维,满足PB级数据不丢帧

针对该项目的需求,浪潮提供了基于分布式存储平台AS13000的高性能、高可用、高稳定性存储解决方案,提供40个节点的存储服务,存储空间约为5PB,满足20.16GB/s数据通量、最长拍摄时间72小时、拍摄过程中不丢帧等严格要求。

分布式存储成为新趋势

浪潮工程师表示:“根据RUSH脑科研的应用特征,以及对存储系统性能、带宽、扩展性、接口等需求指标,我们进行了业务模拟测试,对承载的数据量和运行时间进行实际测算,并根据用户未来业务扩展的需求加大数据量以验证系统和平台的承载能力和性能变化,并多次对用户设备进行匹配,对接口、外围设备匹配、文件删除性能等进行深度优化。”

此外,RUSH脑成像系统还部署浪潮智能统一存储管理平台InView,在数百万个文件的环境下,通过人工智能技术实现存储部署、运维、管理、调优的自动化,实现了对于故障盘90%以上的预测准确率。

正如IDC与浪潮在《2019数据及存储发展报告》提到,数据存储已经成为承载产业转型的基础平台,高效、易于扩展的分布式存储成为趋势,人工智能技术也将快速融入存储系统的发展。而清华大学RUSH脑成像项目在数字化、智能化方面成功应用实践,展现了数据平台在推动科研行业转型升级方面的巨大能量。

探索生命科学的“终极疆域”

探索脑科学,不仅有助于我们增进对于生命的认知,同样也对脑疾病的治疗与预防至关重要。虽然现代医学已经有了极大的发展,但是我们依然没有找到自闭症、抑郁症、精神分裂症等精神类的疾病的“特效疗法”,更不用说,帕金森综合征、阿尔兹海默症等脑疾病正在让数以亿计的人忍受病痛的折磨。

科学家们正在向脑科学这个生命科学的“终极疆域”发起冲击,而脑成像的研究与创新,则为揭开大脑的秘密带来了新的机会。

中国脑计划虽然起步较晚,但是发展速度非常快,《“十三五”国家科技创新规划》就将“脑科学与类脑研究”列为“科技创新2030-重大项目”,提出抢占脑科学前沿研究制高点。2016年,中国发布了“脑科学与类脑研究”国家重大科技专项,在这个未知的前沿疆域留下了更多科研工作者的身影。

范静涛表示,他最近在思考一件事,“纵观世界上的显微系统,在小视场/低分辨率、大视场/低分辨率,小视场/高分辨率这三大领域,先后出现了二十余项诺贝尔奖,但唯独大视场/高分辨率还未出现突破。”这个机会,有没有可能来自中国,又会不会是现在做的方向呢?未来会给出答案。



COPYRIGHT 2020美辰信息技术 版权所有 ICP备案:鲁ICP备15017533号 鲁公网安备37040202006133