备份数据湖,多云时代的价值刷新 | ToB产业观察

在各地方政府掀起的数据交易热潮中,从数据备份到数据管理的路径转变,是必然选择。

对于企业级用户而言,存储系统是支撑业务生产、数据运转的生命线,常见的如块存储、对象存储、NAS等等,对系统的性能、稳定性要求极高。而在处理用于备份、灾备、开发测试等环境中的数据存储问题时,过去非常传统的磁带、磁盘技术,也早已伴随现代应用开发面临的新环境而有了新的迭代。

多云策略,是当下企业数字化转型过程中面临的其中一类环境变化,尤其对于政府、大企业、金融机构而言是重要的技术路径。与之伴随的是,多云带来了成本集约性难解,以及各类复杂性问题。

同样,在数据管理方面,多云也同样导致了数据分散,增加了企业数据管理的复杂性。数据从生产系统到备份系统,到归档系统,到不同使用场景的版本管理和数据副本管理阶段,企业都会通过不同的工具、平台进行数据管理。在上述问题之外,数据管理所衍生出的数据合规也是一个需要关注的领域。

诸多难题之下,业界开始了破解数据管理的探索。

架构升级

探索之一在于升级原有技术架构。

以爱数为例,不久前,爱数升级AnyBackup Family 8,并对其涉及的核心技术架构包括备份数据湖、数据管理开放架构、数据生命周期管理等等,进行了完整阐述。

2017年,爱数AnyBackup Family 7产品基于CDM(Copy Data Management,数据副本管理)技术推出分级数据保护,实现数据两极分布数据保护技术,五年后AnyBackup Family 8产品是对CDM技术进行充分论证下的改进。

从这套技术架构来看,主要包括三个层面:

首先是最底座的备份数据湖,可支撑1700+工作负载、180+云数据的保护,并通过Proplyd分布式存储实现存储资源Scale-Out扩展,提供海量数据的高性能备份、存储、管理与使用。此外,备份数据湖可统一管理各类型的第三方存储、云存储介质,满足多云架构下的海量数据管理。

其次,在备份数据湖之上,提供了一层数据管理服务,通过对数据实现备份恢复的管理、副本数据管理、数据治理、数据归档、数据搜索。

而数据管理开放架构的实现,则是希望将备份数据湖和数据管理服务的能力以API、SDK等方式,开放给生态伙伴、第三方开发者、DBA管理员等。目前开放架构提供了可扩展的代理架构SuperAgent,以实现备份脚本开发、自定义应用备份开发,以及系统管理命令集和集成接口,用于备份系统管理运维的集成和与云管平台的整合。

最上层是业务数据生命周期管理,面向不同业务,开发测试、数据科学、数据保护、长期归档、灾难恢复等业务,提供一系列数据生命周期管理及围绕每一个业务,数据从采集、准备、提供、使用、处理、归档、销毁生命周期的过程提供全生命周期管理。

备份数据湖思路的引入

作为底座的备份数据湖,不同于此前理解的数据湖(Data Lake)或者湖仓一体(Lakehouse)架构,是将不同云上不同业务、不同类型数据通过保护的方式、备份的方式,将数据放在备份数据湖中。也就是说,“利用企业的备份数据,直接建湖。”

在技术实现的逻辑上,按照爱数的解释,它没有将底层的分布式存储做成通用的存储,而是采用集成系统的思路,把数据管理应用和分布式存储进行紧耦合的设计,让整体数据管理平台的性能不仅能够进行快速的备份和恢复,也能进行高速的挂载,提供接近生产系统的高性能的数据服务。

当然,对于客户而言,并非所有的业务场景都需要用上备份数据湖,目前它针对的“是具有多云架构的客户场景,这类客户的数据量会比较大,遇到数据管理挑战也会比较多,可以通过备份数据湖架构支撑统一数据管理产品来解决问题。”爱数研发副总裁邓平告诉钛媒体APP。

而从数据备份的角度,AnyBackup Family 8类似于第二存储系统,即以CDM技术为基础,除了备份与数据湖理念进行结合外,还具备CDM本身的技术特性。这也让其不仅具备对数据的备份、灾备,同样侧重于对数据的全生命周期管理,从数据存储、数据管理和数据服务等全周期。

事实上,2016年Gartner发布的《Innovation Insight:Copy Data Management Accelerates Bimodal IT》报告,就明确了CDM的定义和使用场景,并且到如今已经成为一项具有生命力的技术。根据Gartner给出的定义,CDM是从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”(Golden Image),这个“黄金副本”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或开发测试。

“在新技术的演进下,原来传统备份的技术(如重删、压缩),也逐渐在CDM技术框架下已经实现了。通过CDM技术替代传统备份是完全可行的,而且也是对任何一个组织的数据保护,不管是从数据备份恢复的角度来讲,还是未来数据管理的角度来讲,都有更高的价值。”

邓平还指出,未来的备份CDM会逐渐完成对传统数据备份的替代。一是在技术层面相比传统备份技术的优势,能够提供更高效的数据备份机制;二是用于数据访问和使用时,通过数据存储可以更高实现数据恢复以及数据利用。

长远来看,这样的好处是,备份数据不再是沉睡的企业成本,而是也能够服务于业务,为业务产生类似于生产数据的价值,将数据价值可量化、数据可交换,让数据价值要素得以释放,也就是当前企业所重视的数据资产化和数据交易范畴

从另一个数据维度来看,从结构化数据,到非结构化数据,再到由机器产生的日志指标等机器数据,爱数面向全域数据能力构建出了4+2体系,包括核心的灾备产品AnyBackup、智能内容管理平台AnyShare、AnyRobot Eyes 5等等,归根结底都是大数据服务商在应对市场需求变化时进行的一定创新。

显然,在当下各地方政府掀起的数据交易热潮中,从数据备份到数据管理的路径转变,是必然选择。

(本文首发钛媒体APP 作者 | 杨丽)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

20:29

新疆电力中长期年度交易首破千亿千瓦时,新能源占比近三成

20:27

本周20家上市公司公告披露回购增持再贷款相关情况

20:21

12月22日新闻联播速览16条

20:17

超20家A股上市公司本周披露并购重组最新公告

20:16

爱科赛博:陕西省集成电路产业投资基金拟减持不超1%公司股份

20:15

专家:金融体系需适应性调整,发展科技金融和多层次资本市场,满足科技创新融资需求

19:09

宏柏新材:两股东拟合计减持不超4.97%公司股份

19:01

中信建投策略陈果:跨年行情进行时,AI+是中期主线

18:54

肖钢:加强金融AI算法和模型治理

18:44

墨西哥总统:相信国会明年将禁止在该国种植转基因玉米

18:32

星巴克员工在纽约等四个美国城市扩大罢工

18:31

国泰集团行政总裁林绍波:希望明年航点数量增至超过100个

18:14

“女子实名举报前公公”,农发行通报:未发现巨额财产来源不明问题

18:04

香港餐饮业界:冬至生意额料达4亿胜预期,预计圣诞元旦市道乐观

17:51

信息发展:交信基金的实际控制人尚未发生变更

17:38

“第三次世界大战是否正在进行”?普京回应

17:35

外交部:中方决定对加拿大2家机构及20名机构人员采取反制措施

16:43

新希望:向特定对象发行股票申请获深交所受理

16:42

2025年就业援助月专项活动启动,将开展摸排走访、精准帮扶

16:38

中金公司:港股市场整体呈震荡格局

扫描下载App