| 中国电信各省公司在业务支撑系统改造后,大部分实现了以省为单位的集中计费模式,包括计费、帐务、客服、CRM等系统都采取了集中化的模式,此举加快了电信公司信息化的进程,提高了信息系统的运行和管理效率。
传统磁带备份技术存在诸多问题
在备份过程中,由于数据量越来越大,在关键业务系统的备份和恢复方面,传统磁带备份技术存在许多问题,主要体现在:
1、增量备份时间太长
传统的增量备份速度很慢,因为大量的备份软件对于Oracle数据库的备份是采用Oracle的备份接口程序RMAN来完成,RMAN在做数据库的增量备份时,需要扫描全库,花费的时间很长,这样在整个数据库的备份策略中,无论全备份还是增量备份,备份时间都会很长。
2、备份策略不合理、恢复时间太慢
正常的备份策略应该是”全备-增备-增备-增备-增备-增备-增备”,也就是每天至少做一个增量备份。 但是由于增量备份时间太长,所以传统磁带备份不能每天都进行增量备份,只能设置为每天备份归档日志。只备份归档日志的策略将会对恢复过程产生很大的影响:
当恢复的时间点距全备份时间点比较长的话,需要Recover的Archive Log就会很长。按照某电信每天产生近100GB的日志量计算,那么最长的恢复可能需要Recover 600~700GB的日志,这个过程也会非常的漫长。
NBU备份数据在恢复时的读取速度也非常慢,从磁带中恢复部分数据时,例如恢复一个数据文件,那么该数据文件的恢复过程非常慢。这严重影响到了备份应该具备的恢复支持功能。
3、备份状态和正确性不可知
使用传统的备份软件,数据都是备份到磁带上,备份出来的数据是否可用,必须通过恢复才能够验证。但是对于一个生产系统来说,不可能经常做恢复测试来验证备份数据的可用性。一旦发生灾难或故障,需要启动备份数据进行数据恢复时,数据是否可用也不可预知,这存在着很大的风险。
VTL技术还是DSG SnapAssure-DC来升级传统带库备份
很多客户采取许多措施来提高其备份和恢复的效率,例如采用VTL技术来代替传统的磁带库,实际上这仅仅是从备份介质上作了替换;
DSG SnapAssure所采用磁盘阵列是为了利用磁盘阵列的随即读取功能,而不是简单因为其速度快,从而从备份的实现原理上作了根本性的改变,并带了以下显著的技术优势:
|
|
VTL技术+传统备份软件
|
DSG SnapAssure+磁盘阵列
|
|
增 量 备 份 的 效 率
|
有所提高,但效率提高幅度不大。
因为增量备份慢的原因主要不取决于存储介质是带库还是磁盘,主要原因是RMAN的增量备份原理造成的。RMAN做增量备份时需要对数据块进行扫描,即使只有几个块发生了变化,RMAN也需要花费很长时间进行全库扫描。 所以即使采用VTL,现有的备份软件依然无法提高备份效率,增量备份效率依然很低。
|
大幅度提升增量备份效率:1TB的数据库增量备份时间可控制在30分钟左右。
备份效率之所以提高,不是因为用磁盘阵列做存储介质,而是因为DSG SnapAssure采用了无需扫描的增量备份技术。 在增量备份时,SnapAssure不需要从扫描全库的数据中去发现变化的块。
|
|
备 份 策 略
|
不能从根本上得到改善:
因为现有备份软件是因为增量备份性能低下,所以每天才只备份归档日志,而不是按照宣称的那样每天都做增量备份或者差量备份。 所以即使改成了VTL,那么备份策略依然不能改变。
|
根本上改善:每天都会进行一次增量备份(SnapAssure叫合成全备份)。
因为DSG SnapAssure增量备份的速度提高了,每天的增量备份时间在1小时左右。所以,SnapAssure每天都将进行数据文件和归档日志的双备份。
|
|
恢 复 效 率
|
Restore过程将有所提高,但Recover过程无法提升:
采用VTL后,Restore一个文件或所有文件的效率相对于磁带库而言将会有很大提升。 但是对于Recover过程却无法提升,因为如果只备归档日志,那么在数据恢复时需要Recover的日志量就非常大,例如在电信行业可能达到600~700GB左右,这么大的日志量Recover的时间也是需要非常长时间的。
|
Restore和Recover都提升:
DSG SnapAssure采用合成备份概念,每次备份都是一个全备,无论是恢复周日的数据,还是恢复周六的数据,都只需要从一次备份版本中恢复。 同时,在Recover过程中,由于SnapAssure每天都有一个合成全备,那么在Recover过程中,最多只需要恢复1天的日志,以电信行业为例,<100GB。
|
|
备份 数据 的可 验证 性
|
几乎没有。
VTL技术备份的数据如果要确认是否能够恢复,最彻底的办法就是将数据恢复并Open一次。 这一点与现有的带库备份没有什么差别
|
支持。
DSG SnapAssure提供了备份数据可打开验证的手段,从备份服务器上可直接打开备份的数据,让Oracle数据库来验证备份数据是否可用,是否可以恢复。
|
|
表 恢 复
|
不支持。
即使采用VTL技术,也只能支持物理恢复,比如全恢复、表空间恢复、数据文件恢复等。 但对于因为误操作造成的drop table,truncate table,drop table,truncate table以及其他的逻辑误操作造成的损坏,VTL的恢复过程将非常复杂。
|
支持。
DSG SnapAssure提供单表直接恢复功能,能从备份系统上直接恢复某张表。 这是其他备份软件都不具备的功能。
|
DSG在电信IBSS系统中的集中备份应用案例分析
以某电信为例:
某电信IBSS系统各业务平台都积累了大量的重要业务数据,需要规划建设的IBSS备份系统,应该实现安全、可靠、高效、易管理、可扩展的数据备份恢复策略等目标,并且确保备份操作不影响业务系统正常运行为前提,同时可以提供快速的备份正确性验证的手段。
具体需求如下:
(1) 针对业务服务器多、今后业务数据的数据量增长幅度大的特点,对各系统数据的日常备份及备份数据的有效恢复需要一套完整的、统一的策略,备份系统应该能满足电信业务系统到2008年末支持800万用户的需求;
|
系统
|
一级备份
|
二级备份
|
脱机备份
|
| 计费 |
28.5T |
7.2T |
28.8T |
| OSS |
11.9T |
0T |
0T |
| CRM |
16.5T |
0T |
0T |
| EAI |
8.1T |
0T |
0T |
| 原有支撑系统 |
12.3T |
6T |
24T |
| 合计 |
77.3T |
13.2T |
52.8T |
(2) 系统应能支持多种类型的操作系统、多种类型的数据库,并具有良好的扩展性;
(3) 由于业务系统的24x7的特点,要求备份系统支持数据库的在线备份,确保业务系统的可用性和数据备份系统恢复的高效性;
(4) 结合磁盘存储和磁带存储应用技术,通过集中管理软件,做到备份数据的存储和恢复实现自动化管理。磁盘阵列、磁带库系统以及相应介质应有优异的性能和安全性,存储系统容量具备较大的扩展空间;
(5) 实施公司应具备优秀的技术力量,提供合理科学的管理方案,具有实施大型项目的管理经验,并保证提供完善的、合格的技术支持。
IBSS数据备份管理系统建成后,应该能够达到以下目标:
(1) 自动化运行的数据备份和集中管理;
(2) 可靠的数据备份、恢复和归档管理;
(3) 可靠的备份介质有效性管理;
(4) 历史数据的脱机备份、恢复手段;
(5) 数据库全库、表空间、表的在线备份;以及数据库全库、表空间、表的方便、可靠恢复;
(6) 支持原有支撑系统通过DCN网络实现数据库、文件系统的备份和恢复;
(7) 针对各个系统都有完善的、可操作的灾难恢复方案;
(8) 备份系统架构能够适应未来的业务需求,系统软硬件设备易于扩展。
DSG推出D-D-T的增强备份系统架构
针对某电信备份系统的建设,DSG推出了D-D-T的增强备份系统架构:
传统的磁带库作为备份技术时,同时兼有备份和历史归档功能。但是磁带库在作为备份时存在备份时间长、恢复速度慢、可靠性较差等缺点,不适合对大容量的关键业务系统进行备份和恢复。但它在作为历史归档方面却具有可长期保存、单位存储成本较低等优势,而且对性能要求较低。磁盘作为备份介质,具有I/O带宽高、恢复速度快、可靠性高、性价比最优等特点,非常适合大容量系统的快速备份和恢复需求。
因此,最优方案是将二者结合起来,实现D-D-T的增强备份系统架构:
将磁盘作为对生产系统的快速数据保护,作为一级备份。
将磁带库作为历史数据归档使用,不再依赖磁带库对系统进行恢复。
如图:系统采用DSG SnapAssure实现所有的Oracle数据库系统的备份,
该备份分为两级备份模式:
一级备份:磁盘备份方式,采用中低端磁盘阵列用作备份服务器,通过DSG SnapAssure备份软件从生产系统备份出来后,压缩后存入备份磁盘阵列。
二级备份:磁带库,将DSG SnapAssure备份到一级磁盘中的数据通过磁带备份管理软件转存到磁带库中用于长期保存。 在某电信全省集中备份方案中,充分体现了DSG SnapAssure-DC作为业界优秀磁盘阵列备解决方案的优势,为客户提供了一套非常合理可靠的备份策略:
|
|
DSG SnapAssure
|
|
D-D-T的备份架构
|
最领先的D-D-T备份模式 专业针对磁盘阵列备份 同时支持向磁带库迁移功能
|
|
备份方式
|
相比以前的方案,由于考虑到数据量庞大,增量备份的性能很慢,因此曾一度将备份策略设计为“每周两次全备,每天只备份归档日志”。这个方案虽然解决了备份的问题,但却离恢复的目标越来越远,因为大量的Archive Log会让Recover过程极其漫长,起不到及时恢复的作用。 而DSG的方案,采用了智能全备技术,使得每天完成一个全备,而且备份速度非常快。全备时间大幅度缩减,可以实现1-2小时完成一个系统的日常全备。这样用户的恢复时间就会大大的缩短。
|
|
恢复性能
|
每天一个全备,每个全备都可直接恢复。 Recover的日志最多为一天的,不象标书中要求那样Recover日志就需要好几天。
|
|
直接单表恢复
|
从物理备份上支持单表恢复
|
|
备份数据可打开查询
|
业界唯一支持该功能
|
|
磁盘空间占用
|
压缩存储,节约存储空间: 从要求的53.9TB降低到25TB。
|
|
备份数据的可验证型
|
备份数据打开验证可靠性
|
|
No Archive Log备份
|
业界唯一支持
|
SnapAssure-DC在电信行业的其他应用案例
和某电信集中备份模式类似的应用案例还包括: 1、10省结算系统备份 2、电信总部、江苏电信、江西电信、广西电信、青海电信、海南电信、新疆电信、贵州电信 3、青海电信全省OSS系统备份 4、新疆电信全省OSS系统备份 5、海南电信系统备份 6、电信北方事业部
|