返回目录:金融新闻
写在前面
采访王东临,是一个蛮机缘巧合的事,王东临是我们微信群的一个群友,去年11月30号,他在群里发了一篇文章《这八个趋势都会颠覆未来IT基础架构》,文中不乏犀利的观点。
书生在我印象里是一家做电子文档的企业,为什么一家做电子文档的企业,对IT基础架构这么感兴趣?
出于好奇,我搜了一下王东临的背景,结果更是让我惊讶,对于王东临,如其说他是一个企业家,不如说他是一个科学家。
2008年,书生倡导的UOML标准成为第一个获得到国际认可的中国软件标准;
2010年,他也因此被中国科协授予青年科学家的称号,由中央政治局委员王兆国亲自颁奖。
2016年,当王东临率领书生杀入超融合一体机市场时,面对行业巨头,他保持了科学家一贯的犀利 与自信,“Nutanix只能算半融合,书生才是真正的超融合”,“书生的自有存储系统比Google的性能更领先”….
2016年,超融合火了,当然另外一方面,对于CIO、CTO来说,选型难度无疑增加了,家家都说自己超融合,书生到底有什么不一样,改变了什么?他们的这些改变,对我们理解什么是真正的超融合,又有怎样的帮助?带着这些问题,我们开始了这次对王东临的专访:
访谈实录
Q
我们印象中书生一直是做电子文档的,想请王总回顾一下,书生集团的简要历史?
A
好,很高兴在这里跟大家交流。关于书生公司,是中关村的一家老牌企业了。我们现在有20年了,书生也是一家有技术基因的公司。在早期的时候,电子文档在行业里还是一种比较前沿的技术,我们做电子文档的那个时候比较早,也有一定的成绩。
中央的各部委,省政府,所有的央企,所有的银行,100%全都是我们的电子文档产品的客户。
随着时代的发展,从软件时代,IT的行业,到互联网时代,到云、移动互联网 都在不断地发展,我们书生也是在与时俱进地不断发展。现在,我们的重点是在做书生云,而且是侧重于云的基础架构领域。其实要说起来跟之前做文档也有相通之处的,小的点来说,就是对安全都是比较共同的。更大点来说,我们做基础架构是从存储开始做的,都是做数据载体。
Q
我在前段时间,看了您的一些文章,其中有个观点:您说IT基础架构要变天了! 我想问下,您是如何理解这个问题的?
A
从我个人来看,目前至少有八个趋势,是行业里已经发生、正在发生或即将发生的,比较要命的是,这八个趋势中任何一个足以整个颠覆行业。八个叠加起来,行业铁定变天。
第一个,就是现在的烟囱式的物理架构都要变成云的架构,因为云架构他有非常多的优势,包括虚拟化、资源池化、扩展性、弹性、容错性、低成本、自助服务、可度量等很多方面,总有一款是你需要的。
第二,比较专用的、昂贵的企业级设备,将来都要被分布式系统所代替。现在很多东西,只要加上“企业级”三个字,就身价百倍。意味着更可靠,性能更高。实际上分布式他也能够做到,靠冗余,能够实现同样的可靠性,应该说是更高的可靠性,以及更高的性能。而且“更高的可靠性”可能还不是高百分之几十,有可能会做到几百倍、几千倍。
第三个的话,就是开源! 开源这个潮流,在原来还是小众的。但现在开源跟商业结合之后,他的势头现在是越来越大,而且大得足以改变整个行业。现在往往必须开源才能建立生态,当年Windows闭源软件也能建立强大生态的日子是一去不复返了。
第四个就是 闪存成为常规存储。闪存的价格在一个快速下降的通道上,而且是数量级的下降,大体上将来闪存价格会跟硬盘一个数量级。那么这种差别会导致什么情况呢?海量冷数据可能还是硬盘,但是常规存储已经变成闪存了,这种冲击相当于当年蒸汽机带来的工业革命可以相比,属于划时代的。因为闪存比硬盘可以快几千倍,一个蒸汽机可以相当于几十几百人这样的人力,或者马力吧,就带来了一场工业革命,那几千倍的性能提升也必然带来一场革命。例如现有的存储系统,基本上全部都要被淘汰,他们跟闪存的性能已经严重不匹配了。然后,网络计算,今后都会受到冲击。所以他的冲击可以按蒸汽机的冲击去想象一下。
第五个,就是软件定义一切,软件定义网络,软件定义存储,软件定义数据中心,甚至软件定义SSD,这里面的概念非常多,简单说硬件只需要负责基本的性能和联通,剩下的事情都是软件来做,这是一个比较朴素的理解。如今不管是软件定义网络还是软件定义存储都已经被很多人接受要颠覆网络和存储行业了,软件定义一切要颠覆整个IT基础架构行业也是问题不大了。
第六个趋势,随着硬件性能的快速提高,软件已经成了制约性能的瓶颈,我们今后需要重构整个软件体系,来释放硬件的性能。可以预期将来,软件架构里面努力做减法,将会成为一个主流的趋势。如果今天还在做加法,不断地增加一层一层的协议栈的方法去做的话,可能不会在未来可以生存下来。这里面也包括了今天很多做软件定义存储的。我个人观点对不对,大家可以讨论,我觉得他们方向可能做反了,做了一层一层的抽象,很灵活,很好用,很全面,都很好。就是有一点,性能更差了,而这一点是致命的。
第七个趋势,有一句话叫CITE,企业级IT要消费品化,说的再通俗一点,2B产品要2C化。
就是说做企业级的产品不能再傻大粗了,我们现在要变成2C化,要讲用户体验,讲操作的便捷性,最好也不要看厚厚的用户手册就能上手就用。
最后一个(第八个趋势),也是跟今天主题相关的,超融合。以后我们在交付企业级设备的时候,会不会还是像今天似的,一台一台的服务器上架,加交换机,再连线,调通以后再部署软件,再调试。还是说我们整个一个超融合机柜整体交付。超融合机柜整体交付带来的价值,绝不仅仅是说节约了交付时间(这个也很有价值哦),更大价值的是把一个个的项目工程变成标准化的产品。
另一个关键点是超融合机柜中的软硬件可以整体优化设计,从而达到最好的性价比,并率先甩开历史兼容性的包袱而使用新技术,符合新趋势的技术。从技术上来说,机柜才是机箱,一个超融合机柜应该是分布式系统组成的一台高性能计算机。
所以我认为这八个趋势足以颠覆整个行业,这八个加起来整个行业肯定要变天的。而且从市场趋势来说,IT渗透力提高,各个企业内部的IT需求是越来越大,再加上大数据、AI、VR/AR等需求,IT基础架构行业内部要重新洗牌,规模也要再上层楼。
Q
为什么选择超融合一体机作为转型的抓手?超融合一体机在未来整个基础架构里面会承载一个什么样的角色?从您的观点来看?
A
从这里面讲,我可以分享一下,我们是怎么走上这条路上来的。原来我们是做存储的,我们沉淀开发了6年时间,我们经过试错,才发现,做OpenStack的存储后端,这是我们最好的一个市场机会。然后我就发现,做OpenStack是一个项目,是一个工程。我们的一个客户从接触到最后能签合同,可能要一年时间。从签合同,到交付、验收、回款,又要一年时间,这个过程中不仅仅是我们乙方,对甲方也要付出很多心血,也很折磨。后来,我认为超融合一体机是一种很好的模式,就像我刚讲的,他能够把一个工程项目变成一个标准化的产品。
Q
您觉得从CIO的角度上来说的话,什么样规模的企业已经到了可以建私有云的阶段?您是怎么去区分的?
A
我认为基本上是中型以上的企业都可以。
Q
中型一般是什么样的概念,多少人的规模?
A
中型规模一般是几百人,上千人,大概是这样。简单说,有单独内部机房的就差不多了。小微企业还是公有云比较好,比较省事。一个创业公司,十几二十人,自己弄个私有云来没必要。因为我们就算入门级的最便宜的,大概也得50万左右,提供租赁方式的话,每个月也得花一两万。小微企业话,花几千块钱用个像阿里云那样的就挺好了。但中型企业就需要了,大型企业就更不用说了。
Q
接下来一个问题,就是如果我是一家公司的CIO、CTO,打算把公司的数据中心云化,当然有两条路径,一个是VMWARE这个路径,另一个是OpenStack这个路径?两条路径分别适合怎样类型的企业?这两条路径各自的选择理由是什么?优劣势是什么?从您的角度看一下?
A
这个问题是这样,其实这两个各有优势,各有各的思考。我打个比方来说,VMware就像苹果手机,OpenStack就像安卓手机,今天安卓的市场足够大,但苹果也有他的用户。
VMware像苹果一样,好用,封闭,贵。OpenStack像安卓一样便宜、开放,也比较散乱,基本上就跟苹果和安卓很相似。一般说来,应该是OpenStack比较好,因为它是开源的构造的生态,这个生态链已经起来了,所以它本身发展会越来越快。现在基本上每半年一个大版本迭代,不断迭代下来后,力量是非常惊人的。
从目前来说,OpenStack已经过了一个成熟的拐点了。以前它也确实不够成熟,比如说再倒退两年前,生产系统使用OpenStack基本上都很少。那么现在它已经到中国移动这样的客户的生产系统上大规模使用了,预期未来它的加速度会越来越大。
所以,加入到开源生态中里面来,你可以用一个更低的成本获取更多的资源。总体说来,这个应该会比较好一点。但是呢,对于一些客户来说,我现在需要一个比较好的解决方案来,我今天现在就不用操那么多心,把特殊的要求,比如说,高可靠性的热迁移,VMware上会有一定的优势,而且又不差钱,这个时候也可以考虑用VMware。
Q
继续站在CIO的角度,如果选择OpenStack的方案,在考察超融合一体机的时候,一般会从哪些角度来看?来进行比较?
A
做OpenStack的话,首先你要知道是按项目工程来做,还是按照超融合一体机的方式来做?这里有两种不同的方式来做。
从刚才讲的,从你部署实施的方便,包括从品质来说话,超融合一体机都会好些的。因为部署实施都在一个盒子里面了,开箱即可使用。品质上来说,因为它是标准化的产品,它的质量品质更有保证。
那么衡量一个IT系统的基础架构的话,基本的评价点,是5个指标:性能、成本、可靠性、可用度、可扩展性,这是最基本的。
具体到超融合一体机,首先,实际上它的稳定性、成熟度现在也是比较重要的,你是要选择从OpenStack方面,比较领先的这样一个系统来,国内、国外还有几家公司做的不错,OpenStack那可真不是谁都能玩的转的,很复杂。跟大家打个预防针,这是第一。
第二的话,它本身你要去考虑一下性能上的这样一个问题,现有的云平台的话,尤其是OpenStack云平台的话 往往它的性能上不如企业级设备,所以的话,大家用了它,可能带来更低成本,或者更好更廉价设备的扩展性各方面的优势来。 但是在性能上说,有很多云平台可能达不到传统企业级设备的这个需求。那么,至于这方面的,需要关注一下,选型在性能上是否能够达到甚至超过企业的需求,如果需求不是很高,这方面大家也可以忽略;
第三,可靠性和可用度。比如说,一个比较典型的,它是不是有虚拟机的高可用,因为现在,OpenStack比较前沿的高可用是讲的它的服务,如果坏掉了,它的控制节点能够高可用,可以接管过来,但是不一定提供了虚拟机的高可用。我这虚拟机坏了,我能够在另一台设备上自动的重建,自动运行,只是相当于重启了一下设备而已。其实现在实践中大部分OpenStack系统,甚至是绝大部分,是没有提供的。但这一点现在实际上是,做的好的系统它现在是可以有的,它对你的可用度非常关键。那么从可靠性来说,主要是指数据可靠性。
想必大家都会很关心,你的服务器不能用,停一秒钟也好,停10分钟也好,哪怕停10天也好,那是一个问题。如果你的数据丢了,那是大问题。所以可靠性问题是非常关键的。我们来看,数据可靠性他本身能够到一个什么量的级别来,我们业内的标杆,是从亚马逊出的标杆,就是11个9的数据可靠性,基本上成熟系统都会朝着这个标准去提供出来。那么,如果你是用OpenStack的话,本身可靠性先天就有保证的,这个应该是问题不大。
Q
影响这些指标最关键的、最核心的一个点是什么?
A
那是存储。我们真正在一线做IT的,不管是厂商还是CIO,都知道IT基础架构最核心的就是存储,存储对整个性能、整个架构,包括你存储的网络流量里面,都是最关键、最核心的。
Q
提到存储系统,您有一句话就是说:书生的分布式存储系统SurFS,号称比Google、Microsoft的架构更领先,相对于目前的HDHS、Ceph 、GFS这样的一些分布式存储系统,您的存储系统有什么不一样的地方?
A
是这样的,我们应该讲是第一个叫分布式共享存储系统的,架构上是很特殊的,而且很有可能会成为将来的主流,因为他有巨大的优势,所以这是我们能够吹点牛的底气。
Q
这是你们超融合一体机最核心一个地方吧?
A
对,还有我们针对SSD来做优化。其实今天做OpenStack最热门的、提的最多的是Ceph,Ceph是一个有十几年的老系统了,今天突然红起来了,主要是因为它做OpenStack的存储后端,是比较好的一个搭配。
但Ceph有他先天的问题,一个问题是它基于硬盘来设计的,它本身的架构其实很复杂、很重。它的每一个硬盘就有一个OSD,里面的协议栈非常多,非常厚,非常重。所以对闪存来说它是不适应的。另一个就是它的存储网络用的是以太网,是基于TCP/IP来做的,这个将来都会是致命的问题。
那么我们的SurFS会有几点是不一样的,除了SurFS以外,今天的分布式存储都是固定的一个模式,是什么架构呢?存储服务器有很多台,他们带很多本地盘,相互之间通过以太网连接起来,用TCP/IP协议来传输,全都是这个架构。我们做了一个革命,做了什么呢?后端的存储网络我们不是用的以太网,用的是SAS网络,尤其是我们把TCP/IP协议干掉了。
Q
TCP/IP协议?协议层面干掉了?
A
对,我们是在常规数据路径(也就是in-band)上干掉了,在某些异常情况下还是会用到TCP/IP,因为它的适用性是最宽广的。这里面以太网会有什么问题呀?它有一个很致命的问题,它的二层是不能保证数据包不丢包的,这样的话,它就在三层靠TCP来去实现传输的可靠性,那么,这里的overhead是非常高的,高到什么地步呢,一个网络专家曾经跟我讲过,这个丢包导致的性能损耗大概是一万倍,非常高了。
相反的话,像SAS在二层是可以保证它可靠性的,所以它就不需要靠TCP这种三次握手四次关闭的非常冗余、非常重的传输来去保证可靠性。再有一点SAS本身的延时非常低,然后它的带宽也非常宽,它可以到48个Gb,几十微秒的延时。还有一点,它很成熟,量很大,所以很便宜,48个G的带宽的交换芯片和接口芯片的成本是非常低的,不像InfiniBand非常小众所以价格居高不下。 所以的话,这几个原因,导致了它实际上是更好的一个后端存储网络。
除刚刚讲的这些架构之外,我们把存储控制节点跟存储介质分离了,然后存储控制节点跟计算节点融合起来了。这样可以达到每一个存储控制节点它是可以直接访问所有的存储介质,可以理解成整个存储池都是本地盘,都是共享的,都可以实现本地读写。
另一个方面,在存储控制节点和计算节点融合之后呢,又会带来整个路径的缩短,因为从计算节点到存储控制节点之间它是同一个物理机之间的通讯,通讯的话我们通过一个OpenStack插件使它可以直接走API调用,而不用走性能低下的iSCSI。
后续还会再做PCI-E来配SSD,这个时候它的性能就会非常之高。而且以后,我个人预言以后可能在本地局域网里面,PCI-E网络会代替以太网,这个未来的技术选型,这可能要好几年时间。我只是预测,但它需要我们现在企业做一些前沿的研究,可能几年以后才能够成规模。
Q
因为您用SaS替代了TCP/IP,包括分布式共享存储这样一个设计。对于我们刚才说的那几个指标:成本、性能、可用性,可靠性、可扩展性,它会带来什么样的变化?
A
从性能来说,因为它延时更低了,因为带宽更高了,那么性能肯定是大幅度提升,是毫无疑问的。那么从成本来说的话因为像SaS这个东西,包括PCI-E,它本身适合大规模使用的,可能比以太网用的还要广泛,导致它的成本很低。其实,这是个生态,相关的这个硬件生态规模很大里面的成本就很低。
对成本来说还有很重要一点,就是分布式共享,因为共享的特点,导致我们可以用纠删码来代替三副本,那么传统上分布存储的话,都用三副本,因为三副本可以达到11个9的可靠性,两副本是不够的。三副本会带来什么,就是你每一个写,都要写三份。而且都是跨网络,远程写,那么在性能上,在各个方面,在成本上都有很大的冗余,冗余率是300%的, 而且带来一个很大的写的开销。那么我们说这种共享式,会带来什么呢?
就是我们用纠删码,因为纠删码,在分布式存储里面原来也有过设计。但是呢,基本上它不实用,块设备上他是没法用的,因为跨网络去做纠删码的话,那个带来的性能开销是远远大于那个三副本的开销,那个算法之复杂,通过网络去读写开销是非常大的,大到根本承受不了的,性能敏感的块设备你是没法用纠删码的。但是呢,用我们这种分布式共享存储呢,那它就可以用RAID或纠删码技术去实现它的数据可靠性。那么在相同数据可靠性下,它的成本大幅下降。我们是仔细地算过这个数据,可靠性同样做到11个9。但是,它的冗余率会降低至少一半,这就意味着你的存储成本基本上能下降一半。
从HA来说啊,其实这种分布式共享呢,也有它的这种优势,为什么呢?因为所有的服务器都是没有本地存储的,像无状态的,你所有的这些数据,包括虚拟机的镜像,你的所有东西都是共享存储里面来的,就意味着的你的HA会很方便,因为你服务器挂了,应用服务器就很容易接管过来,我直接就launch一个虚拟机就好啦。所以这样的话就比传统的要做虚拟高可用,我们要省了很多的事。而且,他还更简单了,可靠性也更高了。
那么可扩展性呢,经常有人会去质疑这个问题,其实可扩展性反而是更好了,为什么呢?因为我相当于是存储控制节点和存储介质都是分布式的,然后两边可以分别扩展,比如说我可以只扩展存储控制节点,我也可以只扩展存储介质,从这点来说,他是更好了,可以分别扩展,就是你的容量和那个存储控制节点。这样的话,应该讲,分布式共享系统,有更多的优点。我觉得将来应该会成为一种存储的主流架构。
Q
从可靠性和成本上,您是怎样做一个平衡?
A
首先我们做存储的对用户数据要负一个很高的责任。从可靠性上我们对标的是,能达到像亚马逊一样的可靠性,11个9. 然后在另一方面,我们做企业级系统来使用,那么它的这种可靠性,可用度,本身也要去保证的。怎么去保证?
就是说所有的东西全都是冗余的,全冗余我们做到了极致,服务器冗余,交换机冗余,不管是SAS网络还是传统网络,全都是冗余,网卡,包括所有的盘,都是双端口的,它要保证两个链路同时通。包括我们现在为了高性能,为了数据库,用了SSD盘,用了现在最高的NVMe盘。NVMe是比较少见了,很少人用。书生云不仅用了它,而且是双端口的NVMe,40个盘位的双端口NVMe的这样的一个服务器,全世界第一台可能就在我们这,没有别人生产过。
所以这个非常贵,但是呢,为了保证用户的品质的话,该花钱的地方绝对不能省,有些地方能省钱的,尽量替用户省。但是省钱不能降低品质。
Q
省钱的地方是因为一种新的技术方案,使得它在相同可靠性的情况下能够降低成本,是技术带来的提升。
A
对,就像硬盘,为什么越来越便宜了,是因为它的密度越来越高了,同样盘片可以存更多的数据,是技术进步得来的单位价格下降。绝对不能以降低盘的质量去省钱。
Q
服务器不带存储本身,这块对成本上有没有什么影响?
A
会有一定的降低,因为服务器的芯片会有一个节省,原来负责存储相关的芯片就可以减少了,而且没有本地盘密度提高了,也会带来一定的空间节省。
Q
通过这些设计,相对于目前主流的一些超融合一体机,您这种架构综合评定以后,从性能上从成本上,能改善到一个什么样的量级?
A
这个量级是这样的,我们在宣传中,会说相当于其他操作平台的70%,是其他云平台50%,这是我们一个宣传,其实这是一个不是那么严谨的说法,因为你要对比的话,要看具体的配置,具体对标的产品的才能够精确对比出来。我们主要是存储上对成本的节约比较大一点,如果是计算密集,差异就比较小,如果是存储密集,差异就比较大,跟具体的配置有关系。也跟对标产品相关。像Nutanix比较贵,价格差异就大一些。
Q
接下来一个问题,您刚才提到的Nutanix,应该是超融合领域里一个炙手可热的明星啊,去年9月份也上市了,我看您的观点,说他只是半融合,您的才是全融合,您有什么不一样?
A
是这样的,Nutanix应该是超融合概念的开创者,是我们的行业标杆,没问题。从它的产品来说,它只融合了存储,没有融合网络,所以我说它是一个半融合。为什么这么说呢,从用户的角度,我们交付的时候是一个一体机,直接就整体交付,开箱就用。
Nutanix至少需要3个节点,用户自己去组网,还要去配置,这是一个外表差别。从本质上来说呢,他们虽然解决了存储,它只是通过它非常精巧的设计,它把读流量集成到本地读,然后它再通过闪存,很好地利用了闪存,读的性能会比较高,但是,它没有解决什么呢?没有解决写的问题,它写的时候还是需要用三副本。还是需要跨以太网,用一个非常缓慢的TCP/IP来做跨网络,做三副本的写。
我们的超融合一体机实际上是一个高速本地总线连接的分布式系统构成的高性能计算机,既相当于一台计算机又是分布式的,我们这种架构应该是真正的超融合,Nutanix只是做了一半,没有做到全部。
Q
既然您对您的架构这么有信心,那Nutanix,包括华为他们为什么要采用这样一个架构来设计他们的超融合系统呢?
A
可能是我们作为创业公司,这个步子迈的比较前瞻性一点,如果我跟现有的一样,肯定我们就没价值了。
还有另一方面呢,我们也考虑到现在这种大公司,它每年这个传统模式下,他的收入都是很高的,那么这个时候你要他做东西出来,把自己的东西颠覆掉,很难的。今年你的收入有200亿美元,明年就变成了50亿美元,哪个CEO敢冒这种风险啊,对自己下刀子是很难的,你明知道自己要断臂求生,真的要砍自己胳膊,99%的都是下不了手的。最典型的例子就是柯达,大家知道现在柯达沉沦了,可能很多人都不知道,全世界的第一个数码相机就是柯达去做的,十多年前CEO就下决心要全力推动数字化,但仍然是这个下场,自我颠覆很难!
Q
那么接下来这个问题就来了,如果我作为一个CIO,我听到您说这么多,其实是蛮有风险,感觉蛮担心的一件事情,因为创新,它不光是意味着一个新东西出来,他的另一面其实是风险,对吧? 那么从安全的角度您能怎样说服我,打消我决定选择你们的顾虑?
A
嗯,这是一个非常现实的问题,我刚才强调过,我们做存储的一定要对用户的数据负责任,这是职业道德,就像航空公司宁愿亏损破产也要对航空安全负责。从架构上讲,我们对数据路径上的技术选型还是非常保守的,就因为数据的东西实在是太宝贵了,稍微有点不成熟,我们都不敢轻易拿出来给用户。
在涉及到数据读写可靠性上,我们一定是非常之保守。我们现在出货的产品中,我们自己的软件只做控制流,数据路径上用的ZFS,这是SUN公司的主力文件系统,被一些专家称为最好的本地文件系统,后来开源出来了。即便如此,我们也是在自己的生产环境用了超过3年,而且是比较大的级别上来使用,大概在10个PB这个量级,1000多万互联网用户,用了几年时间才敢放给客户使用
ZFS也有一些问题,例如跟SSD也不是很匹配,HA时import时间较长等。我们一方面用其它方法来规避这些问题,另一方面也开发了新的技术。目前,涉及数据流的新技术只在实验室测试,没敢放给客户,这些实验大概做了一年多时间,基本上要在生产环境能够用一两年时间,没有什么问题,我们才会放给用户。
这里提到关于可用度、可靠性两个概念,很多人两个词分不清楚。我给他解释区别在哪儿呢? 你今天去银行,银行说,不好意思,我主机坏了,已经取不了钱。这叫可用度有问题。什么叫可靠性,你账户上的钱少了,这叫可靠性有问题。我宁愿半天时间取不了钱,不能让我的账户的钱变少了,数据的可靠性一定是要保障的。
这就相当于航空公司,可以不给乘客食物,不给他发水,这些都可以,廉价航空公司也是这么做的,但是飞行安全必须要保证,是绝对要保障的。
Q
提到安全,您有个观点,我印象挺深刻的,是说用您的产品,即使美国中央情报局收买了书生的关键员工,您的数据还是安全的!书生本身是做安全起家,我想问下,您这块有什么独到之处?
A
应该讲,我们做存储现在做了6年,但是做数据安全,我们做了将近20年,这个经验还是足够深厚的。而且呢,我们都是非常顶级的需求,中国的顶级涉密机构。安全文档这块是书生做的比较早的一块有名的业务。我们作为一个民营企业,能够做到国办中办、所有中央部委、所有银行、所有央企都用我的涉密产品做关键应用,靠的是什么呢?
从开始设计的时候,就假设所有的人都信不过的,在它基础之上来做设计。第一,我们所有的数据都要加密,全程加密,这里面就有很多门道,加密看似简单,用一个开源算法,谁都可以做加密。真正加密做的靠谱,这里面有很多专业门道,不管是加密算法,所有最流行的加密算法都是不靠谱的,还是密钥生成,你什么样的加密方式?会不会是一段加密一段明文?中间各个环节之间是不是无缝连接?假设你的网络被人攻破了,假设你的服务器被人给控制了,假设你的每一个人都被买通了,假设对方是全世界最牛的黑客,一个军团一起来进攻。这种情况下我们要保障它的可靠性,我们只相信数学公式,你任何人都不能去破解它。
数据安全主要是靠加密和密钥管理,即使做出一个全程无缝的很专业级的加密来,真正的核心其实是密钥管理,密钥管理是一个很专业的领域,有非常多的密钥,存储密钥、工作密钥、会话密钥、交换密钥、主密钥等,有的密钥是对数据加密的,有的密钥是对密钥加密的,有的密钥不是做加密而是做认证用的,这里我就不展开细说了。
Q
接下来,我看您有个观点,书生云超融合一体机“志在填平OpenStack系统的各种坑”,对于CIO来说,哪些坑会坑到他?从填坑的角度,您是怎样去帮助他?
A
是这样的,OpenStack现在已经成熟到企业用户能够使用了,但还没有成熟到随便折腾都能用,离这块还有很大的距离。非专业人去用的话,肯定是玩不转的。从安装部署来说,即使你是有很多经验的人,安装部署都不见的能弄的好,它的服务、配置安装过程中一个小地方没有弄好,系统用着,就会出现各种各样奇怪的问题。
我们自己是专业的,都没敢用自己的来,都是用OEM几个领头羊公司的和我们的去做集成,做性能测试、调优,前后花了差不多半年时间。原来我们以为三个月基本上弄的差不多了,结果后面又弄了三个月,加起来将近半年时间。当然我们是为了做成一个产品化的,要求比较高,前后重装都超过一百次。
Q
所以您是觉得,要使用OpenStack最好的方式就是使用超融合一体机 ?
A
对,已经做好了,把它固化起来,机柜只能厂家工程师才能打开,这是一个比较好的方式来。 从维护来说,把它的UI做成一个2C化的,也就是消费品化,我的目标就是让一个普通的网管就能玩转。,你要找OpenStack的运维人员,一般的用户很难招到,网管还是能找到的。网管只需要具备一般的IT技术基础,运维界面是很直观的,出问题会报警,你给我们工程师打电话就可以了,哪个地方出问题,我们去更换出问题的故障部件。通过高可用机制,出问题也不影响使用,但有故障部件后可能就没有冗余性了,需要尽快把它换掉。
Q
我们注意到书生超融合一体机在9月份推出,目前已经有东风汽车、贵州电网等试用客户,也有一些教育行业的签约客户,你们在做市场的时候,主要对标的竞争对手有哪些? 您是怎么打动用户的?
A
是这样的,每家需求不一样,东风自己上了一个车联网,一个新的应用,它需要加基础架构,他们也知道云和OpenStack,本身用户有足够的专业知识,然后说选一个性价比 比较好的拿去用,而且东风之前就是我们的客户了,对我们也有认可。像贵州电网,它需要做灾备,它灾备机房留的面积很小,它原来机房大概一千多平米吧,现在灾备机房只有几百平米,我告诉他们 其实不需要,有可能一个机柜就够了,最多几个机柜几十平米。现在我们的一个卖点就是从机房节约的面积上就赚回来了。几十个机柜上云了之后,加上虚拟化和复用率因素,一般的可能就变成了三五个机柜,而我的一个机柜就相当于别人的三五个云机柜,也就是说我们一个机柜就相当于过去整个机房了。我们一个机柜的存储可以到冗余后的1个PB多,一台设备用户一个办公楼就够用了,或者大企业全国都有分支机构,每个办公区一台也够用了,所以,它的适用性是非常广的。今天讲的这些大客户的目的不是为了省钱,但是我们确实能帮客户省钱。
然后有一些客户是从渠道来的,产品有很高的性价比,渠道就有动力帮我们卖,他们卖了之后还有很好的利润。还有一些更大的客户,像超融合数据中心。其中有一个最大的意向客户,要建全世界最大的数据中心,用我们的建和用别人的建相比 至少要省几个亿。基本上说吧,全做下来,包括它的机房,包括它的供电、UPS全加起来,只要两三千平米,但我们的竞品需要一万多平米。然后,我们的方案的电费每年只需要一千多万,我们的竞品要好几千万,奔一个亿。
Q
回到现在这个问题,假设一位CIO现在已经被您说服了,需要向老板递交选型报告,从哪些方面评估选用你们的方案为企业带来的价值?
A
从几个方面,看你们老板未来的喜好吧,一个关键,说清楚肯定是要上云的,而且云里面OpenStack是比较好的,上云之后,我们用超融合一体机的方式,能够更快捷的实施,能够更好地保证它的质量,能够降低成本。看不同的企业,如果是比较小的,几百人、一千人的中型企业,也没有专有的维护人员,而且价格在控制预算范围内,直接使用超融合一体机是比较好的一个方向。
再就是,对于比较大型的企业来说,可以先对一些比较边缘的应用,试试云的架构会怎么样,如果用的好了,再逐渐地把系统迁移过来,因为原来的基础架构用了5年也基本上要更换了,如果要换了就换个新的来,这是一种比较稳妥的迁移路径。
还有一种就是做容灾,都知道容灾的重要性,但真正做到的很少,做容灾化的开支很大,你要做一个完全一样大的机房只是为了想象中的一场灾难, 这就是为什么该做,但很多企业没有做的原因吧。 现在呢,你不用花很多的钱,也不用占很大的面积,就可以做容灾了。容灾系统如果很好,我就可以把它转到正式系统了。
Q
我只是一个几百人的公司,几十万也是一笔不小的开支,有什么模式,能够让我用到你们的服务?
A
我们可以给他提供一个租赁服务,一个月一两万就可以提供租赁服务,也可以分期付,我们已经跟金融机构合作。按月去租,机器还放到你这里,性能更高,更安全可控。这样算下来 比你租公有云可能还便宜。如果你租公有云,一个月几千块钱,小企业那就不用了。如果你一个月花一两万了,还不如租我们一个设备过来。
Q
从渠道合作政策上,跟什么样的公司来合作?因为我们用户里面也有很多对您的产品感兴趣,想听一下从渠道里面跟什么样的公司合作,合作政策是怎么样的?
A
我们是这样的,因为我们的标准化、易用性、低门槛,会导致我们的用户面非常宽广,我们的销售主要是渠道销售为主,只要你有客户资源的,都可以成为我们的销售代理,不需要你有什么专业能力。就是给客户讲讲概念,几个文档、几个PPT就可以了。
我们需要大量的能有客户的渠道,能带来大型客户就更好了。但一般大型客户还是需要我们工程师上去给客户出方案,一般的渠道可能搞不定,他也希望接触到原厂。
从我们公司本身的销售策略上,我们是希望走量,我们自己的利润可能不会太高,大量地让利于销售渠道,这样的话,让更多的朋友来跟我们一起做,让更多的用户能享受到新技术的价值。