“数据库正在经历一场划时代的体验式变革。”
这是数据库厂商PingCAP创始人兼CEO刘奇的最新判断,他以燃油车到电动车的变革相类比,“新一代汽车在大屏的可视化交互、强劲动力、自动驾驶、自我管理等众多创新功能方面带来了全新的体验,新一代的云数据库在资源扩展能力、自动伸缩、可管理、自服务方面也正在发生类似的体验变革。”
PingCAP成立于2015年,是一家企业级开源分布式数据库厂商,其主要产品是一款分布式关系型数据库“TiDB”。据GitHub,截至2021年3月,TiDB 项目在 GitHub 上已总计获得超过 27000 颗星,超1400位开源代码贡献者,参与企业包括美团、知乎、小米、微众银行等众多企业。
云原生和开源是PingCAP身上的两大最显著标签。
云原生是指软件应用的运行不再基于本地服务器,而是在设计应用时就以云环境为考虑,以利用云服务的灵活、弹性和分布式优势;开源,即开放源代码,代码创作者在遵循相关开源协议的基础上,将自己开发的软件源代码向全世界公开,允许其他开发者进行自主学习、测试、修改、二次开发和传播等,以协同方式改善软件产品的质量和优化软件功能等。
今年3月,开源首次正式被列入了十四五规划发展纲要,这一原本局限于极客圈的词汇写入了国家未来经济社会发展的主要目标和重大任务,“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码,硬件设计与应用服务”。
随之而来,国产数据库行业按下了开源加速键——5月,腾讯云发布首款全自研分布式分析型数据库TDSQL-A;6月,蚂蚁集团自主研发的分布式数据库OceanBase宣布开源,并成立OceanBase开源社区,阿里云紧接着宣布开源PolarDB for PostgreSQL。
根据全球数据库管理系统排名网站DB-Engines的数据,开源数据库的流行度逐年上升,从2013年1月的35.53%上升到目前2021年7月的51.35%,并在2021年1月首次超过了商业数据库。与此同时,截至2021年7月,开源数据库的种类数量达到了193个,超过商业数据库的180个。
近日,钛媒体采访了PingCAP CEO创始人刘奇,高级副总裁朱巍。主要聚焦在以下几个话题:开源为什么越来越火、如何解决开源的商业化难题,以及作为PingCAP的主要客户群,金融行业发生了怎样的变化?
以下为钛媒体采访PingCAP两位负责人的采访速记,略经钛媒体编辑:
带着KPI去做开源,大概率是搞不成的
问:开源为什么越来越火?阿里和华为都已经入局开源,巨头做开源和Pingcap从原生的第三方起步有什么差异?
刘奇:开源是我们的起点,可能在另外一些地方,开源是他们的KPI,这个差别我想我不用展开太多,大家自己能感受到。
很久以前,我们内部有一个说法,“开源是我们坚持的长期战略”。战略和KPI有什么区别,举个例子,今天我有一笔预算,预算不太够,我可能一部分选择用来做开源,另外一部分选择做客户。这个时候你在内部就会遇到挑战,这个预算到底怎么花呢?
如果开源是战略,不好意思,所有其他东西通通为开源让路,但是如果是KPI,不好意思,开源一边站。随着时间的积累,一天,两天,一年,两年,长时间下来差别就很大了。所以外面有一个说法挺有意思,说PingCAP是真开源,真开放。大家可能也听过另外一种开源,叫KPI开源,KPI开放。
到底什么是开源,开源的本质到底是什么。很多的理解认为开源就是把代码往那一放(Source Open不等于Open Source),就觉得这就是开源,实际上来说,这个代码只是一个载体,今天可以看到我们整个运营的体系,整个开发的体系完全建立在开源上面。
举个例子,比如刚才我们提到了一些别的开源项目,这些开源项目一天有多少个PR在合并,一天又多少个讨论在上面进行,它只是一个代码同步工具,还是说它真的是一个代码的协作平台,是一个人和人之间的连接和协作平台,我觉得这个是它非常本质的一个差别,就是我们到底把开源放在什么样的位置。
我们也知道业界里面有一些厂商常常说:“这一次开源我们是认真的”。
问:国内此前鲜有成功的开源案例,PingCAP为什么坚持开源?
刘奇:一路走过来坎坷辛酸也挺多,现在的开源环境是越来越好,国内的大厂做的也越来越好,这一点我们也是非常认同,我们也希望这个趋势能够很好的维持下去。我们确实是经历了过去六年多,前面四年也没人信,可能也就是到第五年有一部分开始信,到第六年有很多人信。因为以前在中国没有成功的开源案例,大家对于这个事情总是会带着各种各样的有色眼镜或者带着一定的疑问去看。
我觉得我们一路走下来有几个事情挺重要,第一个创始人是真的信仰,进而我们吸引的员工也都是信仰的员工,你不信仰这件事情100%搞不成。我为什么说KPI开源是不靠谱的,因为这个需要很长时间的坚持。通常如果一个开源项目只是说我希望这个开源项目带来多少流量,今年产生多少收入,到明年的时候这个项目至少有50%的概率要拜拜,后面再换新的一任,一看这个ROI不太行,这个项目就彻底拜拜了。
所以在一些大厂的里面做开源项目的时候,我们都能看到大概活不过三年,因为每年都有KPI考核,不满足,后面就换领导了,换了一任新领导,又是一个新的想法,再换一任,又是一个新的想法,它不具备可持续性。
只有真正的信仰和坚持才能够把这件事情做好,如果大家在做开源这件事情的都是带着KPI去做,我觉得这个事大概率是搞不成的,方向是不太对的。一定时候早期的开源项目,有一点点公益性质,因为开始的时候它跟商业结合没有那么快,也没有那么紧,到后期才创造商业价值。
开源的商业模式,我觉得是一个比较伟大的商业模式,它是优先创造社会价值。当一个开源项目被广泛使用的时候,被那么多公司使用的时候,它其实已经创造了很多的社会价值,进而我们在商业上面提供我们自己的商业服务,然后在广大的社会价值里面萃取了一部分商业价值,所以我觉得它对于人类来说是一个非常伟大的模式。
云是开源实现商业化的基础设施
问:开源和商业化之间您认为它的关系到底是什么,为什么云是一个开源商业化非常好的依托方式?
刘奇:其实在云之前,或者更早一点在RedHat之前,大家对于开源的商业模式能不能成功,一直是存疑的。在RedHat之前,如果我们想定义一个成功的开源,比如我们希望做到以百亿美金为基本单位,在RedHat之前是没有找到这样的公司的。
为什么今天开源会有更多成功案例的出现?我觉得关于云的基础设施很重要。
举个例子,我们如果想要免费的水,你可以自己挖一个井,无非是挖多深的问题,怎么去做消毒的问题,怎么去做水的治理的问题。但实际上,有了云之后就没有人再愿意为这些基础设施自己去维护,自己去造一个水,自己去挖一个水井,大家更倾向于订阅和租赁的方式,就像今天我们的SAAS系统和SAAS软件,都是用服务的形式交付的。
RedHat最早的时候推出来的订阅服务本身就是一个服务,有一个词SaaS,Software as a Service,我觉得这句话讲的非常本质,软件的本质是服务。Cloud本身的好处是什么呢?可以让大家使用这个软件的时候做到真正的Self Service,我们可以很轻松地自己去做服务,我可能点两下就能开通一个数据库服务,我自己就直接充值了,就直接消费了。
这里面跟开源到底有什么关系呢?其实是这样的,对于一个服务或者一个软件来说,我们需要跟用户建立非常深刻的连接,建立连接的前提是说我们要能够满足他未来对于需求的理解,甚至是当用户对自己未来需求的理解还不是那么清晰的时候,他就可以自己去改一部分开源的代码,看看这个东西改完之后到底是不是满足我未来的需求。
这对于传统的闭源软件来说是非常困难的,很多时候客户因为他自己也需要创新,他并不能够完全很清晰地知道我这个创新是不是一定能成功,是不是一定走到哪一步。这个时候有没有一个方式可以帮助客户实现一些更加快速的验证和试验?开源天然就有这个优势,它在连接、协作、快速透明的高效沟通都有明显的优势。
另外,当我们熟悉了一个东西的时候,天然是很有依赖感和安全感的,特别对于开源软件,因为我能看到一切,我能透明看到所有东西的时候,我是很有安全感和信任感的,接下来在云上面去做,我这种安全感和信任感是可以传递、延续的,就是一个很自然的过程。所以开源在云端一定程度上相当于把信任和连接传递过来了,很自然的完成了一个开源到商业的转化。
大型金融机构离云非常近
问:作为TiDB的主要客户群,国内现在金融行业的数字化转型发生了怎样的变化?
朱巍:国内的金融行业,大家以前觉得比较传统,但是现在金融行业也在发生一些变革,比如说很多金融行业都开始讲智能获客,实时变现。比如我们的客户银联就用了TiDB,把24天到30天的交易数据做实时的分析、处理。这些需求就是数字化转型在金融行业推动的一个验证。
过去我们有一个印象,金融机构,特别是大型金融机构离云是很远的,但是今天实际接触采访一些金融机构,他们云的规划已经是完全完备,而且有些已经走的很坚决,很扎实,他们现在的问题更多是怎么能够上云,上的更安全,更加方便,更加轻松。还有能不能有一些云中实在的解决方案,因为云现在都是带品牌的,所以他们一方面在适用各种品牌,考虑多云战略。
另外他们也想说能不能有云中立,比如数据库,因为数据是最容易发生绑定的。比如我的数据上了某一朵云,我想再撤下来就比较难,他们现在关心的是这些问题。为什么会跟我们探讨比较多?一个因为我们是云原生,另外一个我们是云中立,在美国证明了我们可以跑在三朵不同的云上,客户的数据不依赖任何一朵云,我们在中国也可以做更多的事,尤其是在借助云原生提供多云的能力方面。
(本文首发钛媒体App,作者|蔡鹏程)
根据《网络安全法》实名制要求,请绑定手机号后发表评论