组织的数据安全与容灾备份
【摘 要】作为IT环境下组织的数据安全手段——备份制度,已经发展了若干年,由于企业在数据灾难预警体制上的欠缺,导致在备份手段、技术及重视程度上均处于较弱阶段。本文论述了数据备份工作的重要性,并对各种数据备份手段与技术进行了探讨,以帮助企业提高数据备份水平及成功率和数据灾难的恢复能力。
【关键词】数据安全;数据灾难;备份
随着中国信息化的发展,组织越来越依赖信息技术,而数据以指数方式增长,同时由分散存储逐渐转向集中存储,大量的数据在带给组织(企业)财富的同时,数据的安全问题已成为关注的重点,特别是2008年中国大陆地区发生的大面积雪灾,造成南方的一些省市大面积停电;四川汶川地震不仅仅大面积停电,而且很多重要的信息数据资料及设备也严重丢失,造成了巨大的损失,给灾后的恢复带来了较大的困难,容灾备份问题不得不引起组织的高度重视。
一、灾难及容灾备份
所谓“灾难”,一般可分为下面几个类型:自然灾难(洪水、飓风、地震)、外在事件(电力或通讯中断)、技术失灵(电脑宕机或网络受损)及设备受损(火灾)等。从广义上讲,任何恢复系统可用性的努力,都可称之为容灾(或容灾备份)。在企业信息化应用日益广泛的今天,如何在这些灾难发生后能保证数据的可用性,并能及时恢复企业信息处理的正常性成为企业不得不考虑的一个问题。
容灾备份(disaster recovery,DR)是指在各种灾难损害发生后通过特定的容灾机制,仍然能够最大限度地保障提供正常应用服务的信息系统。它又可分为本地容灾备份和远程容灾备份。评价衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object)。其中RPO代表了当灾难发生时允许丢失的数据量,而RTO则代表了系统恢复的时间。RPO与RTO越小,系统的可用性就越高,当然用户需要的投资也越大。对于小型的以批处理方式为主的信息系统,本地容灾备份一般采用脱机多份备份的方法,以便在灾难发生时能及时恢复系统及数据;而对于大型实时化信息系统,本地容灾备份一般采用主机集群(cluster),即当某台主机出现故障不能正常工作时,其他的主机可以替代该主机,继续进行正常的工作。远程容灾备份是指在相隔较远的异地,建立二套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一处系统因灾难而停止工作时,整个应用系统可以切换到另一处,使得该系统可以继续正常工作,远程容灾备份由于成本较高,技术手段较为复杂,一般不适用于小型的信息系统。通常可将容灾备份分为四个等级。见表1。
作为企业信息化早期的会计电算化阶段,财政部在相关文件中早已对日常备份及强制备份做出了相关规定,但由于企业发生各种自然灾难的几率较小,包括技术性故障及设备受损的几率也很小,使得企业渐渐地对数据的备份工作失去了信心。备份对有些企业而言,从来没有发生过很大的作用,变得可有可无,使得这些企业对灾难发生的宽容度大大降低。但是灾难不发生则已,一旦发生,则会对企业信息系统造成致命打击。大型公司、组织或政府部门经常需要面对的一个课题是如何避免在各种自然灾害和人为破坏的情况下保障其系统的安全有效。传统的离线备份、备份介质异地保存的方法可以在一定的程度上解决上述课题。但随着业务对系统可用性、实时性要求的提高,远程容灾成为保障用户需求的唯一选择。
二、容灾备份的现状
任何信息系统在构建之时,必然会考虑到备份这一重要的保证性措施,小型的信息系统可能只是使用软件自带的备份功能,而大型企业和数据中心不仅通过快照、远程数据复制等技术将数据实时传输到异地备份,并在异地建立热备份站点,在灾难发生时能够自动切换系统,从而担负起关键作用。然而,由于不少企业并没有真正意识到容灾备份的重要性,对灾难性事件可能引起的影响准备不足,数据安全与完善的容灾备份还有很大的距离。
由于认识到了容灾备份的重要性,不少企业提出了365天24×7不间断服务的需求,至少是24×5的不间断服务的需求,于是,提供容灾备份服务的企业应运而生。小型企业如果通过提供容灾服务的企业实现数据备份,就可以在较短的时间恢复企业的正常运行而不必投资建立热备份站点。中型企业则更加趋向于实现实时的数据备份来保障关键应用。数据中心和大型企业则会提出更高的要求,最典型的是一些金融企业及证券行业,则会要求任何时刻的应用和服务都不会中断。
在西方发达的国家,企业对容灾备份的投入在不断地逐年升高。据国外权威机构调查,2002年,全球2 000家大型企业用于容灾备份的资金占企业IT支出的2%~4%。而2002年关于容灾备份的支出则是2000年的3倍。
随着国内经济的不断发展,信息化利用程度的不断升高,越来越多的企业已经意识到数据安全的重要性。在这些企业,信息存储正处于从数据分散存储向集中存储转变的过程,并开始投资构建专业的存储系统,但是,由于灾难发生的概率较小,许多企业还没有意识到容灾备份是信息存储的一个重要环节。
诚然,我国一些中小规模的企业由于没有充足的资金和人员,一般无力构建关键数据的容灾中心。同时,已建成容灾备份中心的企业,在实际运作过程中发现除先期的硬件及软件投入外,日常运作中还要投入大量的资金和人员来管理这些硬件设备,也有不堪重负之感。只有大型银行或企业有足够的人力、物力构建容灾备份中心,并使其正常运作。而专门提供容灾服务的备份中心还处于起步阶段,目前国内虽然也有一些由电信企业提供的容灾备份中心,但由于大部分企业对容灾备份中心及其提供的服务并不了解,因而利用率并不高。
目前容灾备份的技术和市场正处于一个快速发展的阶段。据权威机构研究表明,亚太地区(不包括日本)容灾备份市场每年增幅有20%,2006年达到了13亿美元,而中国市场每年的增幅将达到46%,是一个巨大的尚待开发的市场。
国家也认识到容灾备份的重要性,将容灾备份作为今后信息发展规划中的一个重点,各地方和行业准备或已建立起一些容灾备份中心,不仅可以为大型企业和部门提供容灾服务,也可以为大量的中小企业提供不同需求的容灾服务。国内金融行业已经具备了灾难备份的意识并进行了一些相应的软硬件投资,人民银行总行在2002年8月30日下发的《中国人民银行关于加强银行数据集中安全工作的指导意见》中明确规定:“为保障银行业务的连续性,确保银行稳健运行,实施数据集中的银行必须建立相应的灾难备份中心。”
但是,对于国内一般企业而言,容灾备份中心离他们还很远,虽然这些企业在信息化系统构建之初即已引入了相应的备份软件和备份手段,但在容灾中心还未适用的情况下,如何利用好现有的设备完成数据备份成为当务之急。
三、完成数据备份的要点
(一)备份需要测试
由于备份介质有发生损坏的可能性,定期对备份介质做测试显得极其重要。经过测试,才能够确认备份媒体是否处于可用的状态。在每个基本周期内(比如每月一次)测试你备份到的每个磁带或磁盘。这样只需花费几分钟,但是这个任务可能是极其重要的。记录下测试你的备份这个步骤,在你外出时,或者你需要计算出在灾难恢复情况下你恢复数据会花费多少时,这些信息就会垂手可及。
(二)轮换你的备份媒体
这有两个非常重要的原因。第一,你可以根据你的轮换时间表在一天、一周或者一个月后再重新获得原有数据。至少要有磁带、镜像、数字化视频光盘(DVD)或者其他一些媒体形式在一周内的每天轮换。考虑用四个不同的“星期五”磁带,这样你就可以在需要的时候在整整一个月后重新获取原有数据。第二,备份媒体,特别是磁带,会随着时间的流逝而损坏。如果你每天都用同样的磁带,它会增加你失去好的备份的可能性。
(三)保持你的备份软件的更新
软件厂商常常发布软件的更新(如软件的安全补丁),用以解决关于备份日程安排程序、数据完整性安全性等的某种问题,因此要确保你的软件是最新的。
(四)不要把备份放在靠近监控器或者不能被中断的电源
计算机监控器、不能被中断的电源(UPS)甚至还有打印机中发出的电磁场能够损坏备份磁带中的数据或者把它完全消磁。
(五)把你的备份媒体储存在一个防火的媒体保险箱中
你是可以离开你的备份磁带、磁盘或者其它备份媒体所在的现场的,如果你能够把它们储存在一个防火的媒体保险箱中的话。备份媒体能够在比纸张和其它附件更低的温度下被融化或烧伤,你应该将它们储存在合格的防火保险箱中。仔细选择专门为媒体制作的保险箱。它们有专门的设计比标准的防火保险箱能够保持内部的安全低温更长的时间。
(六)把你的备份软件保存在一个安全的地方
如果你的软件允许这样做(必须这样做)的话,你会制作一个你的备份软件的拷贝并且将它保存到防火保险箱中,或者会把它放错地方或是在灾难中失去它。这份拷贝是你需要恢复你的备份时要做的第一件事。
(七)用密码保护你的备份媒体
这样能够保护数据在遇到偷盗事件时不被未经授权的人读取。一些备份软件甚至支持编写密码,因此可以认为,为备份花费越多的时间备份就会越安全。这个方法很适用。
(八)清洁你的磁带驱动器
如果你是用磁带驱动器来备份的话,那么必须每个月或者按照驱动器制造商介绍的频率在驱动器中运行清洁带。这样能够延长磁带驱动器和磁带的使用寿命并且还能提高写入磁带的数据的完整性;如果磁头变脏的话,能够被写入磁带的数据或许根本就是被损坏的。
(九)自动进行你的备份
不幸的是,我们很忙而且很容易忘记进行备份。如果你的软件能够支持,那么就自动进行你的备份,这样你就不用每天担心忘记备份。
(十)不要忽略开着的文档
如果文档停留在程序能够读取它们的开放状态,他们通常就不能被备份或者不能被正确地备份。无论是关闭所有可能上载数据到文档的程序还是使用能够支持为开放文档备份的备份软件,都会是这样。
(十一)备份保留数据库日志文件
监控你的备份记录,如果你不了解某个错误信息具体是什么,以及是什么导致了它,那么你绝对不可以就此忽略它。通常,如果你这么做了,那就会养成你忽略错误信息的习惯。理想情况下,你应当尽可能地去解决这些错误信息所报告的问题。
(十二)检查备份时间
你的备份是否准时开始和结束?全部花费的时间是否和你预期的时间长度大致相同?如果和通常相比,这次备份的数据明显偏多或者明显偏少,那么你可以从消耗的时间中发现某些端倪。另外,它也可以给你一个提示,那就是可能发生了某些性能方面的问题,需要你去解决。