在钛媒体在线课“钛坦白”第39期,我们请来了三位钛客,解读《三年行动计划》发布后,云计算的机遇、挑战、新格局。本期钛客之一、联通云数据公司云计算与大数据研发部副总经理朱子凡,是ITIL V3 EXPERT/ ISO 20000主任审核员。拥有14年电信运营商工作经验,8年数据中心运维管理经验和5年规划建设经验,2年云计算运维管理经验。早年曾任上海联通数据中心产品线运维负责人,主持管理多个大型/超大型数据中心。之后致力于数据中心规划设计,主持设计建造机房总面积超过5万平米,IT负载超过20MW。目前任联通云计算产品线全国运维负责人,主持管理全国近70个云资源池节点。
本文节选自朱子凡在钛坦白的分享。如果您还不是钛媒体Pro用户,希望查看钛坦白所有干货,进入钛坦白九个专业群交流,并查看更丰富的专业数据和信息,可点击:https://www.tmtpost.com/pro 注册。
以下根据朱子凡在钛坦白的分享实录整理:
大家晚上好,我是来自联通的朱子凡,今天跟大家分享的主题是《云计算业务的机遇和挑战》。
首先要感谢一下昨天阿里云在钛坦白的精彩分享,对行业形势做了透彻的分析。今天借着钛媒体的这个平台,我也来分享一下有关联通沃云,以及我个人对云计算的一些理解。
首先介绍一下我任职的联通云数据公司,联通是国内唯一从事云计算自主研发,并大规模商用的基础电信运营商,联通的云计算品牌为沃云,由于是基于openstack进行开发,因此也称为wostack.
云计算业务的前景
左边这张图表是Gartner在2014年对云计算市场的分析。2014年时的数据显示全球云计算市场规模达到730亿美元,当时的年均复合增长率是17%,远远高于全球的传统IT市场增长率。由此可以看出,云计算业务的兴起其实是改变了原先传统IT架构演进和发展的速度。同时当时数据显示,中国的云计算业务发展的复合增长率是达到26%,远高于全球的平均水平。
我们今天来分析云计算的市场为什么要首先展示一张2014年的图呢?目的是说明在2014年,当时业界对于云计算市场的分析已经预测出前景一片大好,但是历史的分析跟今天的实际情况相比,又发生了变化。我们再来看一看Gartner在2016年的统计数据(右侧图标),2015年全球的云计算市场规模达到1780亿,2016年超过了2000亿。和左侧这张图中相比,在2014年,Gartner预测2016年的云计算的全球市场规模在1300亿左右,但实际达到的值是2086亿。
通过这个简单的分析大家就可以看出,云计算市场的前景是非常美好和广阔的。
云计算业务所面临的问题
云计算业务面临着一些共性问题,包括:
- 资源出售性的云产品导致同质化严重,不同的厂商所推出的云产品在功能上大同小异;
- 软件产品的快速迭代虽然实现了灵活的功能提升,但是很多仓促的上线往往会导致无穷的bug;
- 云计算由多个专业集成,导致对于云服务商的要求也更高,人才稀缺成为瓶颈;
- 部分传统应用或数据库还不是特别适合云场景,仓促上云可能出现水土不服。
针对这些问题,我们有三个方面的思考:
- 既然资源出售型产品导致同质化严重,对于云服务商来说,我们不卖资源卖什么?
- 敏捷开发是否就意味着可以压缩测试环境,仓促的上线和交付?
- devops是否就意味着既然研维一体了,开发就不必那么重视产品的质量,因为所有的问题都可以由运维来解决?
针对这三个问题我先谈谈我个人的观点:
首先,不卖资源我们卖什么?我想方向可能有两个,一个是卖服务,另外一个是卖应用。基于IaaS的云产品,建议在服务侧多花精力,否则就通过PaaS或者是SaaS,用平台或应用去捆绑用户的需求。
第二个,如何敏捷开发?敏捷开发实现的是灵活的功能的提升和修复,它的出发点在于客户上云之后,对平台的要求更高了,这时更要求云服务商在快速迭代的同时一定要经过充分的验证和方案的审核,确保优势发挥,扬长避短。
第三,如何将devops功能发挥到极致?
说到devops,大家来看看这张图,devops提出的初衷是为了打破部门墙,改变原先部署、开发、运维之间相互看不惯和相互推诿的问题。那么如果要将devops的功能发挥到极致,扬长避短,我想可能要关注于以下六个方面:
- 找到问题的瓶颈之后,不止是做局部的优化,更要做全面的优化。举个例子,如果我们在软件的功能上发现了一个bug,我们并不能仅仅要求研发去做bug的修复,这时候运维也要思考,未来在遇到同类型问题的时候,我们有没有临时解决方案可以快速恢复业务。
- Devops强调端到端的交付,从开发、部署、实施到运维,这整个一连串的是一个链条,我们最终以产品的方式向用户进行交付。Devops就是要求各个部门、各个模块能够相互团结,以产品交付使用作为一致目标,而非仅关注单个模块的成败。
- 采用devops的模式之后,由于研维一体了,所以我们可以得到更多需求的反馈。因为大家知道,运维对于客户的实际使用需求了解是最为透彻的,研维一体之后,研发可以更加便捷地了解到用户在使用已上线的产品之后有哪些感知,以及问题需要去解决。
- 很多公司在采用devops模式之后,会要求开发去做一个新的软件或者是新上线功能的短期运维,这也就是要求研发在功能上线之后,能够更好地去了解运维人员的痛点,感同身受的知道他们的痛苦所在。
- 研维一体之后,可以使得双方更加统一语言、监控数据,和原始信息,这样更加有利于产品的优化。
- devops中最为重要的核心精髓,就是我们应该更加关注如何去改进而不是如何去追责。
为何要使用云计算?
我记得有一次新员工面试,我问一位应聘者:“你如何向一家企业推销云计算的产品?”他的回答是:“我会告诉客户云计算是一种趋势,它代表了当前的热点。”我想对于这个回答,不管是企业还是客户,都不会满意。因为他并没有说清楚云计算的优势和特点。
在这里我还想解释一个认知误区。就是现在大家都在说我们要求政府、服务行业来构建公共服务平台,这个公共服务平台包括医疗、教育、旅游、环境监测等等各行各业,我们希望通过互联网的方式去得到更为公开、透明的信息。但是政府或者是服务行业的这个公共服务平台是否就代表了云平台呢?答案是否定的。因为这些公共服务平台也同样完全可以构建在传统的IT架构上,并不一定要使用云平台。有一些政府机构,或者是行业在对自己的门户的网站做了一次优质的改版之后,就号称我们已经上云了,其实这也是一种误区,网站做得好与坏,我想应该找的是美工而不是云服务商。
那么下面我来谈一谈我个人对于云计算的优势的一些理解:
- 云计算让灵活扩容成为可能。众所周知,任何一个应用或者是平台的部署都不可能在一开始就一步到位地知道这个平台5-10年内所需要的设备性能、容量和规模数量。这时传统的IT架构在扩容的时候就会遭遇瓶颈,但云计算却可以让灵活扩容成为可能。大家可以看一看上面这张图的左侧,沃云使用超融合的服务器,将计算、网络、存储三者都进行了虚拟化,这种全面的虚拟化就确保了我们的云平台在扩容的时候是可以以模块化的方式,非常灵活地进行扩容。另外,大家可以设想一下,如果我们刚开始部署的一台服务器,当它性能和容量达不到我们的软件应用新要求的时候,如果在传统的IT架构中进行扩容,那么这个宕机时间可能是以天来计算,但是在云平台中是秒级的。
- 云计算可以让数据更安全。在云平台中,我们不再将数据存放在一个单一的物理设备中,因此不会因为单一的节点故障造成数据的全部丢失和损坏。大家可以看一下上面这张图的右侧,是沃云分布式存储的架构图,在沃云的架构中我们会做数据的三副本,也就是说对用户的每一份数据都在平台中保留三个副本,分布式存储通过优化算法确保数据读取优先在就近节点首先进行,确保了性能要求。三个副本的设置是基于长期的运维经验得到得,当数据的一个副本所在物理节点出现故障的时候,我们的云平台分布式存储会自动选择一个新的节点进行第三个副本的复制。那么这个新的数据的均衡的过程,大概需要一到两天的时间,具体的时间根据应用在平时的日常的读取读写的量来评估。所以这个时候,两副本就不是那么安全了,因为一旦副本尚未恢复,主数据再出现一次极端的故障情况,客户的数据可能就会全部丢失。这就是沃云要做数据的三副本的原因。
- 云计算可以让部署更便捷。大家可以想象,在传统的IT架构中,我们装机的过程是非常缓慢的,我们可能需要一台一台地进行设备的部署。但是在云平台中,操作系统通过镜像的方式上传到镜像库,我们可以通过一个镜像去批量地创建几十台虚机。在虚机创建完成之后,我们可能还会对它进行安全组的设置,在上面加装一些个性化的软件。在所有这些个性化的设置完成之后,云平台还支持快照的功能,我们也可以使用快照来进行批量地业务部署。所以镜像和快照的方式可以让部署更便捷。
- 云计算让业务的恢复更快速。这是由两点决定的,首先,在进行软件虚拟化之后,前面也说了,因为计算存储和网络都通过虚拟化的方式实现了,所以网络的冗余是很容易实现的,而且是低成本的。在沃云的架构里,我们所有的网络节点都会做HA高可用。另外,如果一台虚拟机所在的物理节点出现了故障,我们可以很便捷地进行虚机热迁移,而这个热迁移的过程对业务几乎是无感知的,我们进行无数次的实验,热迁移的过程,业务的感知仅仅是丢几个数据包。
- 云计算使用统一的管理平台。在传统的IT架构中,我们可能各个专业都会有自己的网关,各个厂商也有自己的管理工具。但是到了云平台之后,这一切的管理工具都得到了统一,我们可以在一个统一的平台上去同时管理网络、存储和计算,这大大提高了运维的效率,同时也保证了各方面的数据能够得以共享。更为可贵的是,云平台、云计算的管理平台是允许客户进行自服务的,所以客户能够更加可视化地使用自己的云平台。
如何让云产品更有优势?
说到这个话题,我有一个共识需要和大家达成,就是到目前为止,国内没有任何一个云服务商可以透彻了解所有行业的诉求,满足所有客户的需求。就如同阿里云可能在公有云方面是首屈一指,同时联通在私有云、政务云方面极具优势,可能没有一家公司是包罗万象的。
基于这个共识,我有以下建议:
- 建议1:细分市场,聚焦行业。通过在一个或者两个行业内的成功的项目案例,将之转化为解决方案,并且通过这个固化的解决方案,不断的优化和补充,并在行业内进行复制,从而达到最优的效果
我们可以看到,有很多云服务商其实正是在专注于单一的行业,例如有些服务商关注游戏,有些关注税务,有些关注公安,那这其中可能有客情关系的原因,但是同时也是一种正常的客户诉求。
这种情况的出现其实不难理解,因为对于任何一家上云的企业来说,虽然云计算这个热点已经出现了多年,但是很多企业改变传统的IT架构上云也只是第一次。那么对于企业来说,选择云服务商他们更希望云服务商是了解这个行业的需求和特性,并且在这个行业已经有过多次的成熟案例可以复制。那么在一个经验丰富的,了解行业的云服务商和一个综合性很强的云服务商之间选择时,大多数企业会选择前者。
- 建议2:从有限的卖资源到无限的卖服务
传统的云服务商可能在平台建设完成,云化资源开通交付之后,就认为服务已经结束,但其实这个时候恰恰是服务的开始,因为客户拿到了云化的资源之后,如何上云、用云和管云其实他们并没有经验,他们需要云服务商对他们进行贴身的服务和指导。在这个时候云服务商对客户的上云进行了帮助,解决了客户的痛点,同时也是为云服务商找到了商机,改变了原先被动等待的局面。
- 建议3:找到自己产品差异化的特点
举一个例子,联通作为基础电信运营商,他来发展云服务优势是什么?最大的优势可能就是网络,因为基础运营商有遍及全国的网络和机房,这个时候我们做云网融合,联通现在在全国的十大基地会做公有云,在全国的31个省会都部署了虚拟私有云,同时应对客户的诉求,还在全国构建了30到40个专享私有云,这就是使用了运营商机房的优势。
大家看一下这张图,云网融合我们理解分为三个阶段,分别是云网对接,云网协同和云网融合,那么对于最传统的云网对接,其实就是客户从云服务商和基础电信运营商这里同时购买云和网络两种资源,自行进行组合。那么云网协同呢?可能我们有一些云服务商已经迈前一步去帮助客户申请网络资源,但是这前面的两者都没有办法达到云网融合的程度,云网融合是真正的将云和网络融合成为一种产品,提供多种解决方案。前面做了介绍,联通在全国有十大基地,31个省会虚拟私有云和遍及全国的客户端的专享私有云,我们将这些资源池通过DCI的方式连接起来,就可以构建一个遍布全国的沃云,在这个云网融合的解决方案中,我们可以给客户提供同城灾备、双活,异地灾备等多种云网融合的产品。
如何打造混合云?
混合云的这个概念也是这些年一直被热炒的,很多人说,公有云、私有云都代表不了趋势,混合云才是国内云计算市场发展的未来,这是由于很多传统的IT架构短期内还不能够被抛弃,它如何和云化的场景相结合,这就推出了混合云。其实混合云有各种不同的解释,公有云和私有云的混合,云和传统IT架构的混合,不同云服务商的混合,都可以称为混合云。
正是由于客户同时抱有对公有云私密性的心存恐惧,但是又对其灵活性和低价格心存向往,才催生了混合云的产生,这也是联通在31个省会城市构建的虚拟混合私有云的初衷。虚拟私有云对客户来说,是通过AZ和VPC的设置给每一个客户提供逻辑隔离的私有云的环境。但是从整个资源池节点来看,仍然具备公有云灵活调度的优势,因此虚拟私有云本身就是一种混合云的产品。
第二个场景是联通沃云会通过一个省内的虚拟私有云节点和多个客户专享私有云节点之间构建主备,我们通过云网融合的方案,实现客户可以将专享私有云中的关键数据灾备到省会城市的虚拟私有云的独立专区,这是我们混合云的第二个应用案例。
第三个案例,就是我们在专享私有云和虚拟私有云场景中都支持客户自带或者是租赁传统物理设备和云之间进行打通的方式,这种混合云的组网方式在政务、医疗、环保、司法等多个行业得到了应用。
混合云的场景可以鼓励客户将快速和灵活扩展的应用放在公有云上,将传统应用不兼容云场景以及性能要求特别高的应用仍旧放在传统的物理IT架构上,正是因为混合云的产生,使得我们的企业、用户可以循序渐进地逐步上云,避免了仓促的抉择和之后所造成的水土不服。
如何让用云更安全?
这里强调的重点是用云,所以在这里我们不谈云服务商所能提供的安全解决方案,而是想重点的去谈一谈客户理念的转变,因为客户建立信息安全和自我保护意识比云服务商所能提供的安全的措施更加有效。
- 谨慎评估
企业在上云之前,必须要经过谨慎的评估,包括自身应用对于性能、容量以及安全性各方面的要求,如果有一些应用并不是非常适合云场景,那么就需要对这些应用提前进行优化和改造,这一点是很多企业上云之前的漏项,正是因为这些漏项会造成了上云之后的各种不适应,这同时也是云服务商可以协助和发挥作用的关键重点。
预先评估和防范风险往往比暴露风险之后去依靠云服务商的安全防御的工具更加行之有效。很多年以前,我曾经遇到过一个我的同事,IT方面的专家,有一天我发现他在自己的笔记本的前置摄像头上贴了一块黑胶布,用于防止偷拍,当时我觉得很可笑,但他告诉我有时候最简单、最直接的方法反而是最有效的。这个案例并不是想说,只有物理的方式才是安全的,逻辑的隔离、安全的工具都是有效的,但希望强调的是预先的防范措施,而非事后的补救,所以说客户的安全理念其实很重要。
另外举一个例子,大多数的云服务商在自己的云化的环境里都提供了安全组的功能,我们可以通过安全组的功能去屏蔽无用的端口,最近这几天所发生的永恒之蓝的这个风波,没有影响联通沃云在全国的任何一台虚拟机,这得益于我们在客户业务部署的时候,反复的通知和告诫用户,一定要关闭无用的端口,不要将自己的应用赤裸裸的暴露在公网上,正是因为我们反复宣传的这个理念,客户接受了,才最后导致这次的风波没有影响业务的使用。
- 网络层次化
建议我们的企业和用户能够通过源地址防护策略或者是VPN和专线接入的方式去确保只有有限的、特定的源IP可以访问企业云平台,这种限制源地址的方式往往比我们使用防攻击或者是防暴力破解的工具更加行之有效。
此外,要尽量减少核心数据的对外发布。在政务云的场景中,我们会构建三个区——互联网区、电子政务外网区和电子政务内网区。大家都知道,政府政务云对于安全的要求是很高的,那么我们抛开安全的工具不说,单说一下这个网络的架构。互联网区是为公众提供服务的,所以它有互联网出口,以便民众查阅公共信息。但是互联网区和政务外网区之间必须通过网闸进行沟通,互联网区不允许访问政务内网区。
在电子政务外网区我们提供的是政府各种行政机构、办事机构所使用的专区。例如我们去行政大厅办理业务的时候,办公人员所使用的就是电子政务外网,电子政务外网同时通过网闸可以跟互联网进行沟通,也可以通过网闸和电子政务内网进行沟通。但是电子政务内网是没有公网出口的,只能用于政府内部。正是这种网络的层次化的架构确保了政务网的相对安全。
- 遵守规则,建立流程
熟悉Itil的人都知道:“没有变更的环境是最稳定的”。但是在迭代研发的云平台的环境里,没有变更恰恰是不可能的。这个时候就需要我们的用户和云服务商都能够更加加强对于变更前的方案的验证、测试、审核以及变更的通知,严格按照方案操作和回退,以及完成变更之后的验证和闭环。只有遵守规则,遵守流程,我们才能让用云更加安全。
今天很高兴和大家一起分享了云的优势和痛点以及云的方向和趋势,最后欢迎大家都尝试上云、用云,也欢迎大家了解和使用联通自主研发的沃云的产品。谢谢各位。
(本文独家首发钛媒体,根据联通云数据公司云计算与大数据研发部副总经理朱子凡在钛坦白上的分享整理)
……………………………………………………
钛坦白第39期:《三年行动计划》发布后,云计算的机遇、挑战、新格局
今晚7点分享、交流继续~
报名听课、交流:
钛坦白目前有医疗健康、人工智能、文娱社交、VR/AR、区块链、支付创新、体育、云计算、SaaS等九个专业群。
1、钛媒体Pro专业版用户,可以点击链接https://www.tmtpost.com/pro ,登录账号,进入“在线课堂”,在线免费、任意选择自己要进入的群,按提示操作;
2、非钛媒体Pro专业版用户,可以添加微信号taitanbai0,在通过好友后,发99元红包给小钛,你将有权利从九个群中任选一个群进入,长期听课、交流。请告诉小钛你要进入哪一个群,然后等待小钛拉你入群~
推荐钛客、赞助、合作:
请与钛坦白负责人佳音联系,邮箱jiayinge@tmtpost.com
根据《网络安全法》实名制要求,请绑定手机号后发表评论