云信达张兵ceo接受了长江证券的邀请就这段时间网络上议论的沸沸扬扬的wm删库事件做出数据保护层面的剖析。
wm事件的本质
感谢长江证券计算机首席分析师凌总,感谢清泉石资本提供的机会,让我来跟大家解读一下最近的wm事件。2月23号wm发生了一次比较严重的事故,直到3月3日才最终恢复了全部的业务。这件事情引起了轩然大波,波及到上百万的商户。作为一名it的老兵,我来给大家做一次科普。
首先从科学的角度解读一下。顺便也揭示一下行业乱象。首先wm事件发生的根本原因是数据被人为删除了,包括数据运行的软环境一起被破坏了。需要注意一点,这里面没有发生任何的硬件故障。机房、链路、设备没有任何问题,所以故障的核心问题直接指向了数据。
常见的几种数据保护技术
在解读之前,先跟大家科普一下常见的三种数据保护技术:
第一种是本地高可用,是利用冗余算法把数据写成多份。常见的有镜像技术、多副本技术、主从复制等技术。它实现不止一份数据运行在不同的物理位置,所以叫本地的高可用。
第二种技术是容灾,本质上是本地高可用技术在物理位置上的延展。数据跨越大型的物理环境,通过通信链路来实现业务连续不中断。容灾的范畴比较广,不仅仅考虑数据,还要考虑整个物理环境和用户的应用。容灾不是简单的一种技术,它是一大堆技术加上管理的组合。
本地高可用和远程容灾复制技术,都是着眼于抵御基础设施的故障,从而保障业务持续运行不中断;我们制造的多份冗余数据,都是确保“当下”的数据在多个地方都有,而不关心传播的数据正确与否。
举个例子,不管是多副本还是容灾,主数据插入一个a,副本数据也插入一个a;主数据删除一个a,副本数据也删除一个a,以保持一致性。主数据全部delete all,副本数据也是删除全部delete all。wm事件的本质是系统本身没坏,但因为人为的灾难导致数据被错误的改变,进而蔓延到整个运行环境,彻底搅乱了应用系统,造成了数据逻辑灾难。从删库到跑路,这是我们业内经常调侃的一句话。多副本和容灾都拯救不了wm。能抵御逻辑错误和人为错误的,只有接下来要介绍的第三种技术,就是数据备份。
不少人喜欢用“灾备”这个词,但是容灾是容灾,备份是备份,出发点和作用有本质区别,专业的it规划从来都是严格区分,各自建设的。
数据备份和前两种技术最本质的差别是它制造冗余副本的过程,不在生产系统的主操作逻辑里面,备份和生产是两个平行的逻辑。备份进程伴随在生产进程旁边,真实记录数据的变化量。好比营业大厅的视频监控,不干扰营业,但是记录营业厅每个时间点的状态,可以回放。如果把数据当作客体对象,这个对象会沿着时间轴发生变化。我们想象一个长条切片面包,备份系统保留有每个时间点的切片,所以备份系统不是一个或两个生产数据的副本,而是一系列按时间轴排列的副本集。从时间维度来看,备份系统不强调实时性,但极其强调时间序列的连续性和真实性。
容灾不可替代备份,对数据保有敬畏之心
备份和生产,好比一个硬币的两面,是自it诞生之初就存在着的一种古老的技术。在对生产系统进行任何重大的操作之前,例如上线、割接、升级和变更,我们通常都会说,“先做一次备份再干吧”。中国的哲学观点是“福祸相倚,阴阳相济”,因此既要对生产中的数据有敬畏之心,也要对数据备份有敬畏之心。
由于时间关系,就不对备份技术做大篇幅的展开了。接下来也想揭露一下wm事件折射出来的因为无知和缺乏敬畏之心而导致的行业乱象,让大家避免跳坑。
云端数据保护
备份面临的现状与出路问题探讨
我现在向大家提出两个问题,第一,企业为什么容易忽视数据备份的建设?wm这次出事明显地看出来,他没有备份。第二,数据备份的出路和方向在哪里?
第一个问题,备份是要花钱的,道理大家都是懂的。2018年idc面向全球企业的cio做了一次调研,结果显示,70%的cio对现有的备份系统不满意,50%的cio计划改造或更换备份系统,这是为什么?因为消费者花了钱觉得不爽,不爽在哪里?首先备份数据需要的存储空间是大于生产系统的存储空间,有当前的有历史的,当然大了。这不是主要的原因。在2016年之前,市面上的主流备份技术都是把生产数据拷贝成一系列的映像文件,备份下来的映像文件是不能直接使用的,恢复数据是需要我们找到相应时间点的映像文件,restore倒回到一个存储空间才能打开数据。
因此,backup和restore是一对逆过程。正是因为这份数据不能直接使用,需要准备额外的存储空间,并且要经过一系列复杂的操作,所以恢复时间长,代价大。用户平时很少做恢复操作。
我有个cio朋友跟我说过一句话,他说:“我希望永远也不要用到备份系统”。用到它的时候都是发生了巨大的灾难,所以数据备份是企业救命的最后一根稻草。
在我职业生涯里面,我遇到好几回痛彻心扉的故事。有一次,一个很大的用户发生了逻辑灾难,生产系统无法修复。大领导忍痛挥泪下决定,把生产系统格式化存储,从备份系统把数据找回来恢复。恢复了n个小时之后,发现一个无情事实:数据是坏的,恢复不成功。客户已经把门都堵上了,it领导想死的心都有了。这就是所有企业要面对的现状。
备份系统消耗存储、不断烧钱,对备份数据做恢复验证还需要花更大的代价,目的只是为了一个永远也不想用到的救命药丸。如果您是企业的cio,您会对这样的备份系统满意吗?企业花钱买备份的心态,就好比我们买一个意外伤害保险,你愿意花大价钱去买一个意外伤害保险吗?无非是出于尊重生命或合规监管的要求而已,企业忽视数据备份的建设,除了认知误区,缺乏敬畏心,其实还有背后的技术问题。
第二个问题是数据备份的出路和方向。2016年全球知名的it研究分析机构gartner给了一个答案,5个字,盘活暗数据。什么是暗数据呢?备份数据就是暗数据,平时不用,沉默在那,消耗企业的成本。事实上企业暗数据的数量要远远大于生产。
idc做过一个统计,一个中型企业的生产数据会分成8~10份副本,供不同的人在不同的场景使用。打个比方,备份是一份,容灾要一份,查询统计要一份,开发测试要一份等等。一方面造成了存储的重复、浪费,另一方面数据的使用效率是不高的。企业目前没有很好的管理办法。
cdm创新备份技术,打穿了备份和数据使用
暗数据的技术和逻辑的特征是副本数据,也就是非原生数据,从生产系统复制出来的数据。所以gartner在2016年定义了一种新的技术,叫副本数据管理,或者叫复制数据管理,英文名字叫copy data management,简称cdm。
gartner定义了cdm三个特征:一、原格式拷贝;二、活跃黄金副本;三、虚拟副本服务。原格式拷贝得到的是活跃黄金副本,不同于传统备份的映像文件,是可以直接打开使用的。不过黄金副本是不会直接拿来用的,它是生产数据的权威的、基本的备份,是不能篡改的。因此以黄金命名。但是黄金副本可以通过一种数据虚拟化技术,可以提供虚拟副本服务。虚拟副本,第一它不占用存储空间,第二数量不限,第三可以追溯到任何时间点,第四可读可写。以上特征打穿了备份和数据使用,是一种端到端的跨界技术。
备份,传统上是运维的范畴,数据使用是业务的范畴。跨界的威力是巨大的,本来传统备份对企业来说是鸡肋,cdm现在是以终为始,把单纯面向恢复的数据备份变成了面向数据使用的备份。也就是,你备份完了,对cdm来讲才刚刚开始。运维的工具就变成了一个业务平台。备份从运维工具变成一个业务平台,数据备份这个古老的行当,就犹如凤凰涅槃浴火重生了。因此,盘活暗数据是数据备份的唯一的出路和方向,而cdm是一个理想的技术。
用户不愿意在老备份上花很多钱投资,因此会出现很多人会对备份意识不够,备份技术缺失等问题。自2016年以后,gartner定义了cdm之后掀起了一番热潮。2018年,gartner的备份恢复研究室的5个分析师,全体跳槽到了几家cdm初创企业,导致当年gartner业务停滞,年度报告空缺了一年。其中最知名是一个美国的cdm初创企业叫rubrik,它不仅挖了gartner的人,还公开叫板,打出一个新的概念,叫cloud data management,简称也叫cdm。
所以从2018年开始,复制数据管理进入了云数据管理的时代。简言之,cdm备份云也把备份数据的存储和使用通过云来展开,把复制数据管理从数据中心扩展到各种云,公有云、私有云等等。请大家一定要清楚,云数据管理cdm是基于复制数据管理的云数据管理,不是云里雾里的泛化的概念。在短短的2-3年,数据备份经历了两次升华,旧的玩家岌岌可危,新的玩家冉冉升起。
2016年gartner初次定义cdm的文章的题目是《复制数据管理加速双态it》。所谓的“双态”是稳态和敏态。稳态是决定企业存续的生产交易等核心业务系统,是求稳的;敏态是在企业数字化转型过程中,产生了大量的探索型、创新型的业务,追求的是敏捷性。大多数企业一般会采用一种新的技术,分布式、微服务架构,wm既有稳态也有敏态。
大企业客户会把稳态交给公云吗?不会。公有云是中小企业的归宿,大企业的归宿是双态。为什么cdm会加速双态it?重要的原因是敏态业务的数据来自于稳态,cdm是端到端的跨界的技术,所以可以打通稳态和敏态,打通企业数据中心,私有云、公有云,加速数据流转。
wm事件的深度解读
回到wm事件,wm的it本来是云上云下都有的。客户应用在腾讯云上面,客户的信息和账单放在一个线下数据库里,结果都被人为地破坏了。wm在3月1日晚上11点多发了一个公告。从wm的事后公告,可以得到如下几个信息:
第一,wm承认自己没有做好备份。以后线下的部分也要迁到云上,好像有腾讯云的加持就安全了;第二,腾讯云宣称帮助wm找回了数据,但没有用恢复数据的字眼;第三,从2月23日发生灾难到3月3日恢复数据,整整花了9天的时间,而且3月2日花了一天的时间做恢复演练,做恢复演练的过程中停止业务。
我想问,是不是全上云就不会发生类似灾难了?前两天我看云头条带节奏发了一个文章,说wm事件的解决是很完美的,最佳的方案是全上云,不要半上云。你们觉得这个是理智的理性的一个分析吗?
其实wm这个事情它的根本原因是它是一个信息安全的事件,是人为地突破了防御,就干掉了数据。但是我们知道,做安全是七分管理,三分技术。管理里面有很多要素,里面有一个要素就是人,人是最不可琢磨的。一个高级的运维主管,突破了所有的堡垒机,所有的安全的防御,完全合理地删除了这些数据,你怎么防?所以放弃幻想吧。我再问9天时间,才全面恢复业务,能够接受吗?
关于云信达
我们云信达公司是从2016年开始就专注于cdm技术的研发,主打产品ecloud data master是真正意义上的采用cdm技术的产品,从gartner所定义的原格式的备份,到虚拟副本服务到多云的扩展。目前我们已经发展起了全技术栈的cdm的技术,是国内具有领先技术的cdm厂商,有兴趣的朋友欢迎来洽谈业务投资。
主持人:
张兵总:因为我们是立足于本土发展起来的,是一个中国本土的cdm厂商,所以我们对本土的生态的支持,是优先的任务。刚才主持人提到了,我们支持了华为的鲲鹏的平台,它是基于arm芯片的自主的平台。不仅是鲲鹏,包括国产的几大芯片厂商、各种数据库,包括阿里的数据,我们都是支持的。也就是我们的国产系统首先做到优先的支持,包括国产的操作系统麒麟。
有一个问题我希望澄清一下,您第一个问题问的是是一体机还是个软件,其实cdm它是一个软件体系,只不过它承载的载体软件,它一定要跑在硬件上面的。这个一体机是我们对于有一些企业用户,他自己没有这样的存储平台,我可以给他提供一体机交付的方式。如果用户自己有自己的一个私云的平台,或者是一个私云的存储,那我也可以只部署软件。事实上就是我们可以看到软件交付或者说一体机交付在中国和美国市场上都是并存的一种现象。美国我刚才提到的那家rubrik,它其实它比较鼓励用硬件交付,你这样他可以做大他的revenue,那么如果给他提供的一体机,其实就是一个超融合的一体机。他的名字叫rubrik,他这个产品叫brik,砖块的意思,它可以堆叠式地、可以用分布式的方法扩展我的cdm的空间。主持人。
主持人:
好的。谢谢,我再请教一个问题,现在一个大的趋势是公有云,像腾讯、阿里云这些上得非常多,那么他们是不是有可能也会提供cdm服务,这种趋势你怎么看?同时我也观察到了咱们有跟ucloud联合推出产品,也跟公有云有一些合作,咱们定位是怎么样的,谢谢!
嘉宾1:
假如wm有一些数据存储在本地,又没有备份的话,腾讯怎么样可以做到一个修复?公告里面是说数据基本上实现完全的一个恢复吗?
张兵总:他如果存储在本地就跟腾讯没关系的,他如果是业务放在腾讯云上,腾讯云可以帮他修复。完全的恢复是这样,他线下的数据他是不是以前拷过一份到云上,或者说是他曾经手工拷了一份在旁边,有可能是很多天前的数据了,但是还是可以找回来的。
另外还有一些磁盘修复技术,因为他花了这么长的时间,首先它没有一个备份系统,这是肯定的,如果这些系统任何一个备份系统恢复也不可能长于9天的时间。那么其次就是说他数据找回来的技术其实有很多种,打个比方,他把数据逻辑上删了,但是我们知道磁盘数据删了之后,有些是可以通过盘头或者是磁盘修复技术,它还能够一定程度找回,但就是要去复原那个磁道,那些上面的磁记录了,这个就更麻烦,所以时间非常长。所以现在给出来的信息不是特别的清晰,我也不能确定他怎么找回来的线下的数据,有可能他以前曾经手工拷贝过一份。我是这么理解的。
他没有一个自动的备份系统,他如果有这种备份系统,他恢复起来应该很快的,就是传统备份系统,你再恢复一天时间肯定还是能搞定的。
嘉宾2:
为什么说先删逻辑、再删数据才有效,光删数据是删不掉?第二个是腾讯恢复9天,可能没有恢复成功,还是什么意思?
张兵总:wm是个逻辑灾难,它不是物理灾难,它硬件什么都没坏。就是人为地把它删掉了。删数据就是逻辑灾难,删库删除是一个逻辑。机器坏了它会造成物理的错误。而他删除的是这个复杂系统,不仅数据库里面结构很复杂,而且与之关联的一系列微服务互相之间构成了千丝万缕的联系,如果把他的所有信息打乱了,他就完全陷入了混乱,分不清哪些数据是正确的业务操作,哪些是错误的,数据在他都读不懂了,就相当于你把一个文件的索引给删掉了,如果你的电脑,你自己的手机或者电脑的操作系统盘头坏了,你肯定恢复不了。
嘉宾2:腾讯肯定也没有备份,还是说可以不备份?
张兵总:我其实中间讲了一个故事,就是说我在一年多前我碰到一个人他说我们现在互联网的技术都是多副本,不需要备份了,你那备份过时了。听完之后,我真的很无奈。这其实从一个侧面折射出来。现在业内很多大厂的数据都在裸奔,it的运管人员都没有意识到备份这个逻辑是永远不会消失的。托付性命的大厂居然存在巨大的认知误区!为什么我们这次沙龙的主题叫敬畏数据?这基本的逻辑上有认知误区,这是最可怕的。
嘉宾2:
明白,大家都没干备份这个事,就是说备份的成本很高?要费很多存储还是别的什么,成本高在哪里?
张兵总:成本高,我刚才也讲了,第一个就是说它消耗存储,你刚才也讲到了;还有一个就是说旧的备份方式恢复起来时间比较长,这是第二点,恢复麻烦;第三个就是说备份了,耗存储了,备份数据平时也不用。你把这个数据备份下来放那儿不用,还消耗你的存储。企业是要赚钱的,都要有roi的,我投资下去,其实也不用,一辈子可能都不用他。我就在备份建设上我就麻痹了,这是大多数企业现状嘛。70%企业的cio对现有的备份系统不满意,就这个原因。
银行为什么要备份?因为它有监管,所以他是被迫做的。所以我们讲gartner说的唯一出路就是盘活暗数据,备份数据如果还能够发挥更大的价值,大家就愿意备份了。
嘉宾3:
张总您好,第一个我想问一下我觉得cdm是不是把原来属于备份系统盘活成数据资源中心,相当于它把这个数据原来的存储方式变成永久存储,永远加数据,永远浪费一些存储空间?现在就除了成本之外,他又能把这些基础的东西来进行一些开发或者其他的使用。是这个原理吗?
然后第二个我想问一下,这种方式相对cdm是指针对一些数据存储,比如说一些软件代码,它也可能会发生一些错误,可能需要重装,他能把整个系统来进行一个映像或者存储吗?谢谢你。
张兵总:问得非常好,我觉得您的问题说明您已经get到了,首先cdm确实是我们讲盘活暗数据,企业原来备份下的数据副本,平时基本不使用就变成鸡肋了。cdm激活暗数据,找到它存在的价值,打通数据端到端流转,从一个运维的工具变成了一个业务的平台,由此驱动业务。我们现在碰到最多的是开发测试场景,很多企业它的业务上线、开发测试,它是需要先拿数据跑一遍,要做测试的。
再加上现在我们有一个新的技术的趋势,要讲一些技术术语,就devops,不知道大家有没有听说过,就是讲我们传统的开发,我们叫development,运维我们叫operation。这两个结合起来叫devops,开发运维一体化,这是一个敏态it里面的一个新的名词。就是说我把我的开发和运维结合在一起了,一边开发一边上线,所谓的就是说持续集成、灰度测试、灰度发布,这是现在企业it正在走向敏捷化。
在这个过程中间,测试需要拿生产业务的数据仿真跑一遍,才知道这个业务是不是能发布。这个时候cdm就可以把备份的这份副本直接拿来驱动我的开发,这不是很好的一个概念模型吗?所以前一段我们跟gartner的分析师在讨论的时候,他们提出来一个概念叫 cdm给devops赋能,这是一个开发方面的场景,也就是所谓的盘活暗数据。
您的第二个问题,主流的备份系统它必须要涵盖这几点,除了用户的数据,数据有几种:就是结构化的数据,像这些数据库;还有一些非结构化的数据,就是像文件,我们可以看到大量的文件,例如我们做的一些做人工智能的企业,它有大量的这种语音识别的文件,都是小碎片的文件,海量几十个亿,存储下来的空间也巨大,那几十亿个文件它不保护,如果丢了,也挺可怕,那么这个就是说非结构化的数据文件你也要保护。
还有就是一些环境信息,我开始讲了wm这个事件,它不但干掉了数据,他把数据运行的软环境也破坏了,什么叫软环境?例如操作系统、数据库、虚拟机、云平台、微服务,像容器这些东西,这都是环境信息,所以现在一个完整的备份平台,除了备份这些结构化非结构化数据,还包括这些环境信息,包括物理机操作系统、虚拟机操作系统、云操作系统,初始信息、补丁信息、配置信息、用户信息等等你丢了之后重建的时候你还要找回来,那备份系统可以裸金属重建你的系统,包括上面我们讲虚拟机的环境也可以重建,你的微服务的环境、容器也可以重建。所以他不但备份数据,还备份数据运行的环境。
cdm在提供数据服务的时候,不单是把数据给你恢复起来,快速挂载给你用,还可以连数据使用环境一起给你建立起来。我会在一些云计算或者是像微服务的架构里面,通过你按一个键自动化的全部给你重建起来,你直接用就是了,所以它是一个端到端的自动化的过程。
嘉宾4:
张总您好,从 wm删库跑路这件事上来看,听完演讲以后,结合之前对于云信达的了解,我充分地明白我们这方面的优势没有问题,但是我们回到今天的主题,就是wm删库跑路这件事上来看,我作为一个高级运维主管,其实是可以把备份全部删掉,所以有这样一种观点,就是说针对wm删库跑路这件事,其实我们更多的应该强调itsm的范畴,而非数据安全。想听一下张总就这种观点的看法。
张兵总:你好,挺好挺专业的问题,其实wm这个事件说到底是两个问题,因为今天主要讲数据安全,我就没有谈信息安全问题。讲信息安全首先是管理,管理里面就是人的因素,人恰恰是最不可控的因素。你可以把信息安全的堤坝筑高一点,打个比方,他用了删全库的这种命令,会不会有一个数据安全的审计?对吧?就是这种删全库的这种命令,当你敲下去的时候,我是不允许你执行的,还需要分角色另外一个人来确认,才能执行。就像我们去银行办业务,也要授权的,对吧?要主管授权,你有些事情才能办,要三权分立,要分权。
那么您提到就是说cdm,cdm的数据,如果我是cdm的管理员,我是不是可以干掉他?是的没问题,但是这是一个信息安全的基本问题,就是你的系统管理员和备份管理员也要分权,不能是一个人。
说到备份系统,按照我们国家保密系统的要求,他要“三员”,就是什么?操作员、管理员和审计员,三权分立,这些都是要符合国家的相关的规范的。所以我们的备份系统本身是有三权分立的,另外就是说备份系统本身和生产系统本身也要分权,这其实是一个信息安全的问题。
嘉宾4:
张总我非常同意这个观点,所以其实从我角度来看,就是在面对wm删库跑路事件来说,中央企业特别多,包括这种安全的一个设计,所以在这个角度上来看,我其实针对这个事件会更关注itsm。
张兵总:但是我想说的就是百密一疏,就是想做到100%的防止错误,实际上是做不到,这个世界本来就没有100%的事情。大家会说我的数据中心的安全,99.9999%,再多的9他也有可能会发生事故,而且人为的错误有时候是很难避免的。我昨天也参加了一个研讨会,我是听,我没有发言,然后主办方也是列举了中外近些年来所有发生的删库事件,非常多,很惨痛,都是大企业。但是我相信这些企业它的itsm应该做的标准也是比较高的,但是照样发生了删库的事件。
嘉宾4:对,没错,所以这是两个层面。
张兵总:所以数据备份是我们讲是救命的最后一根稻草, itsm堤坝要筑高,防止这种意外事故发生,就防之外你还有救的手段,对吧?救的手段就是你的备份。
嘉宾5:
你好,张总。我有个问题想了解一下,您刚才说很多企业,有些包括一些大企业上市公司数据都在做裸奔,对数据没有那么重视,很容易出现问题。那我想请问一下,目前我们cdm的核心的这些东西完全都是自研的吗?
张兵总:现在的it系统,完全没有开源是不可能的。你说华为鲲鹏芯片设计底层也依赖很多东西,它的操作系统也是在linux上改。我认为这几年最近新科技出来,这一波新科技全球的,我们讲互联网科技或者讲新技术不断的爆发,有一个很底层的因素,就是开源化,最大的一个开源是什么?是linux。对吧?
虽然现在中美存在不同层面的科技战,但我们国家在搞的所有的这种it革命,新技术的创新,已经从欧洲得利了,因为linux发端在欧洲,北欧的一帮技术发烧友,他看不惯美国这些unix的闭源化,我搞出个开源,我搞出来很牛逼的一个操作系统,但是我不要钱,开源,大家都可以用。于是这个平台星火燎原,大家可以看到所有现在it科技的创新的base与开源linux有关。
嘉宾5:
是的。我为什么问这个问题?因为我担心有些东西如果它是基于美国的一些东西,会不会以后会受到影响,包括如果以后我们要进一些大企业,或者是一些银行金融的机构,或者军方,对这种我们的底层技术的自主研发还是很关注的,会不会很容易被卡住脖子?
张兵总:我们用的最多的就是linux,底层的东西代码还是可以开源化的。cdm他是一个全技术栈的,肯定要用到linux的一些组件,但是核心的备份功能、存储功能、数据服务的等一系列业务功能,都是要靠自己去开发的。有的数据源没有提供很好的永久增量接口,那么我们就必须从操作系统底层去定期侦听他的块变化来做永久增量和原格式备份,这些业务逻辑需要各种各样的技术,大部分关键业务模块都是我们自己原创研发的。
嘉宾5:
明白。我最后还有一个问题,张总,就是我看到比如说veritas跟华为这种合作,现在是已经终止合作了吧?我不知道行业里面是不是以前用这种国外的备份软件,现在国产的备份,包括咱们的产品,能在什么样的程度上能够替代原来美国这些公司的产品?
张兵总:我们最近跟国家级的一些机构,包括像央行都在探讨这个事情,我们现在的结论就是cdm完全可以替代国外的,包括veritas、commvault,以及大型厂商ibm、惠普、emc都有自己的备份软件。美国独立的第三方的软件公司,上市的备份企业就有3-4家。cdm出来之后,旧的玩家岌岌可危,新的玩家冉冉升起。
因为现在这些老备份厂家,他们向cdm转型的过程非常慢,到现在为止都还没推出自己的cdm产品,传统和惯性,阻碍了技术创新, 守旧的利益决定了他们不可能自己革自己的命。据18年的数据不完全统计,国内的备份市场,我们的大客户大b企业,80%在用国外的备份软件,大约20%的大b用户数产生80%的revenue;而我们国内80%的中小企业,仅仅产生了20%的市场价值的,然后又被低质低价的国内小的传统备份产品。国内的备份软件公司有多少呢?多如牛毛,但是都是传统备份为主。cdm领域,我觉得我们的技术现在是非常领先的。
嘉宾5:明白。
张兵总:对中国最有价值的就是那些20%用户产生的80%的revenue市场,目前还在国外巨头的手上,我们现在干的事情就是要到各个大的行业去论证,就是说我们已经可以实现国产化替代,事实上我们已经干了好几个规模非常庞大的替代案例,我们的一个大客户,300多套业务系统,然后5pb的数据备份全部转移到cdm这里了,而原来用的veritas的那种旧式备份,已经全部下架了。
嘉宾5:对,我觉得国内以后需求会很大。
张兵总:是的。而且还有很多企业,刚才您开始说的有些还在裸奔的,真的有。因为他有一些没备份现在没备份的大企业少,很多企业是有备份,它的备份覆盖不全。还有一些就是说它的备份放在那里,他基本上不演练,有可能用的时候发现又不能用。这种情况是比较多的。
嘉宾5:明白ok好的,谢谢您张总。谢谢。
嘉宾6:
张总您好,我是想就对cdm这块的话比较好奇,就是我们知道国外的话也有这样cdm的独角兽,我想问就是说国外市场对于我们投资人看国内市场有哪些参考价值,以及目前国内跟国外的差异点主要在哪里?然后第2个问题的话就是关于竞争的问题,国内市场在cdm这块现在竞争态势是什么?然后国外这些独角兽在国内的业务的发展情况又是怎么样的?然后我们一般会从哪些指标或者维度上,像比如说哪些公司做的好?主要就是这几个问题,谢谢。
张兵总:ok我记一下!我相信您是关注这个行业的,可能都注意到了国外的那几家独角兽吗!我刚才也提到了一个rubrik,还有像cohesity,actifio这些都是美国做cdm的厂家。国外市场跟国内市场,国外像我们主要指的美国市场,跟中国市场差别还比较大,我们可以看到这三家比较大的就是rubrik,它现在是属于市值最高的一家,他30多亿美元的市值,他进中国一年又撤出去了,为什么撤出去?水土不服,原因是什么?
我们可以看到美国市场的格局是这样的,大b客户目前还在用传统的备份,行动的不多,只有一家独角兽大家可以看一下,像actifio拿了一些大客户,因为他在大客户的技术储备的足一点。那么像这些美国新科技的厂商,像rubrik、cohesity,这些新的独角兽,他们就扮演了在中国的中小市场的小备份厂家的角色。
我研究过rubrik在国外的客户,北美的客户,他基本上我们定义的恐怕是中小企业,但是美国的中小商业是非常的发达的,这跟中国完全不一样,我们的市场是什么?中国的tob市场是大b主宰,大量的投资就是大b拿出来的,而小b在it建设上面他们不愿意掏钱,他们自己活得都不好,你让他去掏钱买it,所以如果他进中国之后,他就发现它的产品非常适合做小b。然后他去做小b的时候发现平均客单价是20万人民币,然后在美国是20万美金,他的ceo都不干了,赶紧跑,他就撤出去了。为什么他做不了大b,因为它的技术储备它不是面向大b的。所以他在中国水土不服。
对我们来讲的话,情况相反,在中国的cdm市场上,我们其实还是要关注大b。因为什么?中国的小b市场,就像我刚才讲的中小型企业,它的归宿可能是公云。他很多事情他就自己不办了,我就交给你了。那么这几个云厂商,他们的做法都是大树底下寸草不生,要么你就变成他的跟班,你被他吃掉嘛,你到那里打工帮他做,这个可以。也有大云厂商也曾经想收购我们。
不过我觉得数据保护这个行当,我看到在美国做的好的基本上都是独立的第三方厂商,否则的话如果我变成a的话,那么b就肯定不兼容我。
在中国这个情况,你要是跟阿里合作的话,那么腾讯说你不要理我了,我也不会理你,对不对?他们都是排他性的,这是很大的一个问题。但是如果说我每个人我只给你适配,我保护你,但是我并不变成你的一份子,独立第三方,我是认为今后中国的it的发展,第三方的力量大家不要忽视,不要认为非此即彼,我从来都不认为他们能够吃掉所有的it。对大企业来讲,他是自己来主导这个规则的。所以我们现在的市场策略更多是关注大企业,而对于中小企业市场,我们也做了充足的技术储备。
2019年以前,云信达cdm有两个版本,一个是cdm企业版,面向企业内部数据中心的核心关键的、重型复杂的稳态业务,整合copy,改善it运维的效率,另一个是cdm saas版,比较轻量级的在云端运行的多租户按需付费的cdm服务平台,讲究客户体验,一键上云。我们这两个版本都做得可圈可点,但是分开两个版本,功能不能完全拉齐,不完美。因此我们花了大半年的时间进行产品融合。
到2020年2月,我们新推出3.0版本,已经实现了saas版和企业版的并轨。内部计划叫cdm one,就是数据中心和云服务all in one,正式的版本叫云信达ecloud data master 3.0,作为我们全新的统一的主打版本,不管是面对公云市场、中小企业的市场,还是面对企业大b客户的市场,我都是一个高度融合,功能齐备,方案灵活的产品。
所以您最后一个问题就是讲如何衡量对吧?我觉得国内的市场有一个问题,因为毕竟我们是大b主宰的市场,行业壁垒会比较严重,行业壁垒比较严重,导致很多tob的企业在早期非常艰难,他会有一个瓶颈期。
所以我们tob的企业成长,大家看到都比较慢,就中国这个问题,企业它是不是能够跑出来这个赛道,我是觉得一方面我认为这是一个跨界的新技术,我刚才通篇讲到的这些方向性的东西,如果这个企业它的他的vision,我们讲他对市场和技术未来发展的方向看得不准的话,哪怕他现在没问题,他以后有问题,因为你的产品一开始架构就是这么搭的,你到了某一天,你发现我要改的时候,你改不动了,这就很麻烦。所以一定要看这个公司它的方向性,还有它现在的产品的架构是不是有延展性和先进性。
这个产品的能力非常重要,另一方面就是说在中国你要成长,一定要看他的市场能力,就是他有没有清晰的市场战略,就是很多企业我就讲了,中国很多小的备份企业,瞄准的就是小b客户,吃来吃去人家的20%,所以在中国,市场策略一定要很清晰,你什么时候做大b什么时候做小b?
我认为我们大b市场站稳脚跟的时候,我会大举进攻小b,但是现在我要养活自己,我要拿到最有钱的富人手上的钱,我必须找大b,我市场策略是很清晰的,然后你还要有执行力。第二就是你的市场覆盖,你对这些大的主要的这些行业,面对他们很高的这种壁垒,行业壁垒和客户内部的这种各种形形色色的壁垒,你怎么突破?你能不能有效地拿到订单,让企业生存和发展下去?这是我的观点。
嘉宾6:
好的,谢谢张总。还有我们现在现有用户的话,他一个画像大概是怎样的?然后我们是应用最广泛的行业有哪几个?
张兵总:我们现在80%大b,20%小b就是符合我的战略。大b客户基本上就是我们可以看到电信、金融和大政府、500强大企业,我们瞄准的就是这四波客户群,包括你像大企业,包括电力这种国有企业。
因为怎么说,我是认为我们国家大b企业很多都是央企国企,央企、国企有个特点,它基本上都是资源垄断型的企业,那么它的用户数基本上就是跟人口差不多,那么所以它的数据量是非常大的。这些企业的话你必须服务好他,让他把数据用好,数据保护好,我们要满足他们的需求。现在为止我们主要涉足的,像我们在电信运营商行业,目前它还是我们产出最大的一个,但是我定义下来我第一大目标客户群,就是金融,金融包括银行、证券、保险这些。
为什么呢?因为金融企业的客户,他的数据的数量可能他没有电信企业大,但是它单位数据价值是最高的,他也有意愿为他的数据买单。所以我的销售资源,绝大多数瞄准了金融行业在做的。对销售的kpi的考核要求也是这样的,我最近在中国金融杂志上我写了一篇文章,就是cdm助力金融企业的数据数据管理,助力金融企业的数据管理这篇文章大家有兴趣可以点击查看-,大家可以看一下,我回头再跟主办方也会发一发链接,大家可以去看一看。对金融目前是我们定义的第一大客户群。
嘉宾6:好的。明白,谢谢张总解答。
嘉宾7:
你好,张总。因为您刚才提到说很多企业其实在裸奔,就没有搞数据库备份或者各方面原因,银行是因为被迫对吧?有监管。我就想问,如果大部分企业在wm事件之后就要开始干这个事情的话,在硬件投资上面哪些东西是有机会的?他要添加什么硬件?比如说我举个例子,存储方面应该主要是一些硬盘相比存量的硬盘而言,是一个多大比例的需求增量,谢谢!
张兵总:ok,关注到具体的项目了,是这样,wm这个事件不是第一天出现的,实际上历史上大家去找找这种惨痛的事件发生得非常的多!我搞数据管理这个行业20年了,20年里从来就没有间断过,大家永远有不怕死的人,就是搞完之后大家还是这样的,都在裸奔。但是它会有一定的促进,我以前在外企管市场的时候,我有一个感触,每次用户出大事故了,我们就来大单,好灵的!所有存储厂家都跟我讲,都是这样的一个感觉。
所以你讲的对,就是wm事件发生以后,一定会促进大家提高这方面意识,加强这方面的建设。对存储的促进,我觉得多大的量我就不敢说了,因为怎么说呢?之前中国市场做备份研究的数据很乱,有人说中国传统这种市场就30个亿人民币,也有人说80-100个亿,我看到两种数据,我不知道哪个是真,但是据我的估计,我觉得可能也就在这中间,也就是几十个亿,说明大家在备份上的投入其实真的不大。
原因就是我这次从头到脚就在讲这个事情,老备份技术就是一个鸡肋。其实大家都不愿意多投资,很多人都是在所有的项目预算做完了之后,边边角角给你一点,用户在it投资上1%给到备份就不错了,现在的问题就是这样一个现状。有些企业是没有办法,行业监管,必须考虑进去的。但是有时候他对厂家能赖就赖,能蹭就蹭,能压价就压价,这也是一个普遍现象,备份系统卖不出价钱。所以刚才你讲了磁盘那也是个问题,就是说你可以看到今天我想把备份的数据激活、盘活,把纯粹是面向恢复的备份,改成是一个面向数据使用的备份,这就会变得很有意思。
2018年gartner备份和数据保护的分析师都跳槽去了硅谷的几家第二存储初创公司。2019年7月深受感触的gartner对存储市场的分类定义做了很大改变。在2019年之前,garnter对存储的分类是以存储技术划分为高端存储、中低端存储,全闪存储,nas存储,以及pbba(purpose building backup appliance)备份专用一体机设备。
2019年之后改成了以数据使用场景为中心的划分,分了三类,首先是primary storage,就是主生产业务,你的交易,你的营业关键的生产数据、管理数据放在上面的,叫主存储。然后是第二存储,secondary storage,这是以前没有的词,是什么概念?就是上主存储派生出来的copydata,是副本数据,它不是原生的,他是一个派生出来的数据,所以它以数据为中心来划分存储了。然后第二存储是现在在美国很热的一个概念,在中国现在还没热起来。
第三叫b&r一体机,backup and restore,即备份和恢复一体化设备。也就是说他在2018年还叫pbba备份一体机,那么他不要了,为什么不要?gartner认为凡是只做备份不能就地恢复的一体机都是耍流氓。老的备份技术不能就地恢复,只是备份就很简单,你随便搞一些很便宜的硬盘,数据写进来就行了吗?但是现在你要就地恢复了,恢复之后就会有人用这个数据。要读要写,对吧?从带库这种流式存储发展出来的旧式的pbba几乎谈不上存储技术,存储副本数据,提供随机读写,都是现代化软件定义存储的技术。
所以cdm技术为备份的副本数据打开了一闪全新的大门,对第二存储产生了极大的促进。同时也极大的促进了存储产业链上下游的变化,比如促进闪存等一系列产品的销售,而我们备份的副本数据,可以更多的跑到更高速的磁盘上和闪存上面。一个物理副本,我可以派生出几十个虚拟副本,那么几十个用户同时用这一个物理空间,你还是省了,你本来要几十份的,拷贝出几十份,现在就一份。但是我通过一个高速的存储,我实现了几十个人并发来访问。
所以从总体上来讲的话,我还是帮用户去提高了性价比。所以他对磁盘的促进,如果用户只是意识到他要一个备份,他还是用传统备份的话,他用低端的磁盘带来不了多少市场的价值的,但是如果说他会用高速磁盘的话,价值还是比较大的。我是这么看的。
另外我补充一个概念,所有的备份系统它必须具备一个特征,就是他要作全生命周期的管理,就是我的数据备份下来之后,我什么时候丢掉它?什么时候数据过期?我是跟中国银行一个老的数据中心的领导聊过,他也退休了,他就讲他说我们从建行之初的所有的数据我们全备份了,而且这个备份我们都不丢的,我们是永久保存的。那么以前是用磁带备份的,磁带它是有寿命的,它要防磁、防尘、防潮,对吧?过了一段时间,哪怕你放在专用的保管箱里面,到了一定的时间,就是10年,你还是要把它数据倒一遍,换到新的介质上面去。那么他们是坚持不懈的,就是说到期了就转储,所以它的数据到现在为止都是可以访问的。
他讲前一段他们恢复过八几年的一份业务数据,什么数据?就是一些以前外汇交易的那些报文数据。美国人你跟伊朗发生交易了,我要查,你举证,把你原来的数据拿出来,对吧?我们拿出来了,一看都是你美国批准过的,你没话说了,但是如果你找不出来怎么办?你找不出来,他法庭宣布开庭时候你不来,一天罚款10万美元,这就是损失,所以你的数据是不是要永久保留,跟你的数据的属性有关系,这是什么样的数据?如果你要永久保留,那就出现一个问题了,在线的磁盘很贵,副本大家都在用,对吧?我是变成一个温数据,如果说生产上是很热的数据,我这个数据是有一定温度的,它访问频率还比较高的,但三个月之后,它慢慢的访问频率低了之后怎么办?
我们说cdm的备份存储,它一定是分级的。三个月半年以后,可以调配到更便宜的廉价的磁盘上去,或者加密之后在公云存储上长期归档,公云上的云存储就是它的分布式存储,一般是对象存储,一个tb一年的租金还不到1000块钱。或者说是我在自己本地的私云里面,我建一个分布式存储,用那种廉价的磁盘,我也可以去对这个数据去做一个低廉的长期的这种保存。因为访问频度低了,我对读写的性能要求不是很高了,我就到下一级的冷存储上去。
现在又出来基于蓝光光盘构建的存储系统,它基本上把原来的磁带的位置给替代掉了。我们讲光盘的读写他也比较慢,因为它也是一个离线的介质,有时候你要找一个历史数据进光盘,他有可能光盘拿出来了,你要把它加载到光头上才能读出来这个数据,它可能会有一段的响应时间,会比较慢。
但是毕竟光盘它读起来比磁带肯定要快,磁带要转的对吧?所以光盘还有一个很大的特点,就是蓝光现在新的蓝光介质可以保留50年,现在松下、索尼的生产盘片,他现在不是原来化学方法记录的,它是一个物理方法保存的更稳定。50年,那就比磁带的10年提升了5倍。所以就是你的超冷数据你把它放到蓝光上面,你可以50年不用动它。而且蓝光有一点,它省电,平时不读它的时候它是静默的,不耗电,但是磁盘不一样,你哪怕是云存储分布式存储,我们知道现在机房最大的成本是什么?是电能。这就是我讲的数据生命周期的概念。
任何一个备份,包括cdm技术,也一定要有全生命周期管理的能力。就是这个数据能不能丢弃?不能丢弃,我就要分级把它往下一个个降级,而且还要随时能够把它找出来,如果需要的话,例如有人要找八几年的数据,你要给我找出来。所以现在我们跟很多大银行在谈什么呢?你几十年那些磁带你找起来烦不烦?它虽然能恢复它恢复起来很麻烦。那么很多大的行在跟我们谈,就是说我把原来磁带,你看我堆的仓库,全部给我转到现在一个云存储上面,我买一些便宜的盘放在上面,我可以保留10年,是吧?以后翻找起来就很方便了,因为磁盘很容易定位,它是一个在线介质。如果用户有这样数据生命周期的意识,会倒到cdm做长期的保存的话,那么cdm对磁盘的市场会有一个很大的促进。
还有我提到另外一个场景,我们最近不是新冠疫情吗?我们碰到了很多的药企,药企有一个特点,就是它一个新药的研制,它大概经历十几二十年,还有大量的实验数据,大量的临床数据,这些数据他已经沉默了十几年了,但是一点都不能丢,当然要过食药监检验的时候,要过fda的时候,他一定要把这个拿出来,而且人家让你给他什么,你就得给什么,想找什么就找什么。这其实也是一个副本数据的生命周期管理的一个概念,而且还要方便去做可视化的检索,这都是cdm未来要发展的一个方向。
嘉宾7:
我还有个问题,就是像如果用cdm代替之前的存储,大概我们的产品替换成本大概是多少?
张兵总:替换成本是现在是这样的,就是说传统的备份一体机,老备份的东西,刚才我讲了,他都是用的是普通的磁盘吗?对吧?所以如果我们是用cdm的方式去替代传统备份,如果用户只是用到这个备份能够快速的挂载,快速使用验证,那么我也可以用这种就是便宜的磁盘来替代他,这样的话硬件成本大家其实是差不多的,无非就是软件,因为我cdm的软件比较新,我有新的功能,那么比起传统备份软件价值,我会比他们高,我大概是它两倍。这就是现在的,如果从替换成本上来讲,我们略高一些。
我们有一些客户,像有一些我们做的银行客户,不仅有现代化备份的需求,还要把数据副本好好的用起来,也是驱动他的开发测试的敏捷化等等,这样的用户他们对cdm的估值就比较高了。所以我有一个例子,就是我们在一个银行卖的cdm的单价,就是一般来讲备份大家都会以数据量来做定价的,我单tb的单价,我是传统备份的5倍。这个用户买了,因为在cdm系统我派生出了20份副本,它有20个开发测试小组同时在用。他觉得他赚了,省了20倍。
嘉宾8:请问一下,比如说如果我们是小机,类似于ibm系列的,cdm对银行用的比较多吗?我看您提到过小机备份,是把小机的系统也能备过来,还是说只能将数据库这方面备过来?
张兵总:可能是这样的,您讲的这个问题其实是很有意思的一个问题,为什么你看rubrik进中国他就跑了?他不支持小机,不支持光纤阵列,他也不支持oracle,它到2019年下半年才勉勉强强支持,中国的大b客户看到他肯定不跟你玩,对不对?这些我们都支持,因为我瞄准大b的,我今天要支持这些unix,fcsan这些我都支持,这就是我们的强项,我们专注这一块。
嘉宾9:张总,我想问一问,我们现在是做定时备份,如果是做融资支持的这种容灾的话,风险比较大,我想问一下,可是实际上现在很多一些大型或者和很大的系统里面是不是容灾相对更重要一些。我个人觉得实时的这种容灾是不是也是挺重要的,应该也是很市场以后需求也是挺大的,您是怎么考虑这个问题的?
张兵总:你这个问题是比较典型,因为我前面的演讲最开始一直在区分备份和容灾的不同,事实上可以看到就是说wm这次事故跟容灾半毛钱关系都没有。我们讲生产系统和容灾系统它是紧耦合的,你生产系统变化,容灾我必须跟着你变化。否则也容不了你的灾,所以你本地删除了,容灾端也删除了,理解了吗?
所以容灾和备份是两种,完全不一类的技术,他们不在一个维度里,不在一个频道上,所以这是很多企业说我都做了容灾了,我还要备份吗?你不做你试试看,这个事情就是血淋淋的放在这儿,容灾做了,照样要做备份。备份做了要不要做容灾,就看这个企业它要达到多高的等级保护了,对吧?就是说rto恢复时间的目标是多少?如果说我业务损失了,我主生产系统坏了,我的容灾系统是在几分钟的就能接管,还是几小时就能接管,还是几秒钟就能接管。这是rto的一个指标,越低越难。很多用户花了几个亿建的容灾,会要求到秒级或者分钟级。
然后事实上我跟大家再普及一个概念,“双活”,真正能做到的“双活”其实是很少的,花费的代价非常高,丢了几秒钟的数据,对于大多数企业是无关紧要的。所以容灾系统的建设和备份系统是平行的,它一定不是可以交叉的。
那么对我来讲,我的术业有专攻,我不可能既做备份又做容灾,容灾市场很大,但是容灾的技术非常复杂,它是一系列技术的组合。它不是一种技术,它是很多技术的组合,容灾本质上是什么?是一个全it基础架构、环境的一个全面的一个管理,刚才有人也提到itsm,就是你的it环境的整体的一个管理,就是包括你的数据,这是一方面,你的主机、你的存储、你的网络链路,包括上面的应用,那都要一股脑地飘到容灾那边,对不对?要一起接管。这个中间就是你整体的itsm整个it架构的你的总体管理能力,所以你可以看到这里面有多少技术啊!
通讯链路的技术,数据保护、数据复制的技术、存储高可用的技术,服务器的高可用的技术,以及这些资源的控制技术,对吧?它不是一个点的技术,在里面至少可以包装进去几十个上百个技术,它不是一种技术,它是一类组合,所以容灾是很大的体系。我也看到国内也有一些初创型的公司,帮用户干什么?做总体容灾。我觉得这是一个很好的方向,但是这个更多的是一种咨询加管理,其实这里面涉及到的技术,不可能样样精通,怎么可能,ibm都做不到,对不对?你只能说数据复制的技术那家最强,服务器接管的技术是那家最强,对吧?你肯定是管他们,而不是说你自己做这些技术。ok这个可以吗?
嘉宾9:好。好的,谢谢您张总。没问题了,谢谢。
主持人:
感谢今天大家踊跃提问,我简单做个总结,非常感谢云信达的张兵总,从技术,行业发展趋势,应用领域,给我们详细的解读了cdm这块技术,包括他们公司产品的应用里面,我们也是期望公司的产品能够在更多的行业得到落地和推广。最后还是由我们张兵总给今天会做一个结尾,谢谢!
张兵总:今天与大家分享了许多,聊了许多大家认知上的容易发生的误区,作为一个it行业的一个老兵,我一直专注数据管理这个领域,20多年。今天不仅仅是谈技术,因为谈技术有可能太专业了,有些也怕大家理解上有障碍,也聊了一些备份保护意识,一些基本逻辑。我欢迎大家多多交流,也欢迎大家线下来参观访问,我们公司的总部,在南京江北新区的核心产业区,大家都可以关注凯发真人手机版的网站,我们的网站是ecloudtech.com,在此感谢长江证券,感谢主办方,也感谢清泉石资本,谢谢大家。
主持人:
好的感谢张总,我希望您咱们尽早在科创板上市这样,大家还会经常再联系这样,谢谢张总。到时联系会越来越多咱们公司,谢谢各位投资者,祝大家身体健康,复工顺利!