当下,数据备份保护正迎来全新的发展周期,这是因为数据库这一基础软件迎来了全新的机遇。众所周知,在信创、国产替代,云计算、大数据深入普及的大背景下,集中式数据库正逐渐被分布式数据库取代,越来越多关键行业,如金融、电信的核心数据正在尝试部署于分布式数据库,至于快递、物流、互联网、餐饮、旅游等C端客户较多的行业更是很早就应用了分布式数据库。
2022年5月,Frost & Sullivan联合头豹研究院发布的《2021年中国分布式数据库市场报告》指出,在中国市场,分布式数据库发展正处于“爆发期”。中国的分布式数据库相关专利申请量从2012年的全球占比22%爬升至2021年的76%,中国已经成为全球分布式数据库的技术创新中心。
分布式数据库带来市场新难题
新机遇伴随新挑战,分布式数据库快速普及的同时,给数据备份保护带来了新的难题。与传统集中式数据库完全不同的是,分布式数据库有着自己的特性,最突出的两点:海量、云原生。
就海量而言,分布式数据库节点数量比集中式数据库大的多。集中式数据库几百个节点已经是非常大的数据库环境,而对于分布式数据库而言,成千上万个节点是很普遍的。
拿云原生来说,海量的备份作业对备份主节点是否可以横向扩展、备份的存储空间是否可以池化并横向扩展,以解决备份性能及备份存储空间都提出了新的要求。与此同时,大批量数据库上线及下线对备份系统能否自动感知并动态调整也提出了新的考验。
除此之外,海量节点引发的数据恢复一致性问题相比集中式数据库,概率更大,问题更严重。如果数据没有恢复一致性保证,对于分布式数据库的数据备份将变得毫无意义。
目前,针对分布式数据库的数据备份挑战,市场供给侧基本上是空白的,主要有三个方面的原因:一是,分布式数据库市场还比较新,国外领先的数据备份厂商还没有跟进;二是,分布式数据库厂商当前主要的精力,是解决数据库的可用可靠,让数据库不掉链子,虽然有数据备份功能,但没有余力完备;三是,分布式数据库数据保护涉及到的技术门槛较高。