服务器数据恢复—硬盘坏道离线导致raid崩溃的StorNext文件系统数据恢复案例
服务器存储数据恢复环境&故障:
一台昆腾存储设备中有一组raid5磁盘阵列。阵列上有两块硬盘先后离线,raid5磁盘阵列不可用。
服务器存储数据恢复过程:
1、将故障服务器存储内的所有磁盘编号后取出,将所有没有离线的硬盘以只读方式镜像。使用专业工具修复两块离线硬盘后进行只读镜像。镜像过程中观察硬盘状态。镜像完成后将所有硬盘根据编号按照原样还原到原存储设备。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始数据造成二次破坏。
在数据镜像的过程中发现其中一块离线硬盘存在大量的物理坏道,初步判断其为硬盘掉线的直接原因。
2、服务器数据恢复工程师对镜像后的数据进行分析,获取原raid5阵列内的raid信息,根据这些信息虚拟重组raid阵列。在重组完成的raid阵列中将原存储内的lun恢复为镜像文件。
3、在分析数据的过程中发现后离线的硬盘存在有大量的坏道,虽然镜像了数据,但坏道仍然对恢复结果产生一定的影响。
4、登录昆腾存储的管理界面,获取到StorNext文件系统中和卷相关的一些基本信息。继续分析StorNext文件系统中的Meta卷和Data卷。StorNext文件系统中包含2个Data卷,每一个完整的Data卷都是由多组RAID中的LUN组成的。
5、北亚企安数据恢复工程师分析LUN,获取到LUN之间组合的算法规律,根据这些规律虚拟重组Data卷。
6、分析Meta卷中的节点信息和目录项信息,Meta卷和Data卷之间的对应关系进行,针对一个Meta卷管理多个Data卷的情况,研究得到Meta卷到Data卷的索引算法。
7、获取到存储上的全部数据后,北亚企安数据恢复工程师编写数据恢复程序。扫描和解析卷内的目录项信息及节点信息,提取节点信息及目录项信息。
8、利用分析到的数据信息编写数据提取程序,并提取存储内的卷。
9、服务器数据恢复工程师利用数据提取程序提取数据,数据提取完成后随机抽取验证提取的数据。验证数据没有异常后让用户方验证数据,经过验证用户方确认所有数据完整恢复。