国内“百模大战”下,市场对于 AI 需求日趋强烈,作为大模型底座之一的数据库厂商也在探索如何适应新的技术趋势。
钛媒体App 11月24日消息,近日,国内开源商业化数据库公司镜舟科技在上海举行的StarRocks Summit 2023上发布了 AI 原生数据分析平台Deep Thought,充分利用 AI 大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据,用户可以使用其洞察数据并做出数据驱动的决策。从而展示了镜舟数据库最新的 AI 结合能力。
目前,这款镜舟数据库与开源项目Deep Thought AI结合的 AI 数据分析产品已正式上线。
镜舟科技CEO孙文现对钛媒体App等表示,基于StarRocks开源社区以及数据分析需求场景,镜舟数据库将以“DI+BI+AI”(数据智能+商业智能+人工智能)的模式,满足客户对于提升生产力的需求。
不过,“我们所有的行业合作都不依赖大模型。大模型不是镜舟的卖点,我们只是趁势而为。”孙文现表示。
孙文现透露,目前已有多家证券、资管类行业客户正在使用镜舟数据库,以此节约时间、增加效率。而镜舟科技整体业务收入正以每年约两倍多的速度在增长。
据悉,镜舟科技成立于2022年,致力于建立湖仓架构下的数据分析创新产品帮助企业提升效率。其研发的镜舟数据库,是基于开源StarRocks发展起来的国产企业级分布式数据库,在实时数仓、OLAP报表、数据湖分析等场景中满足客户多维复杂、实时、高并发的数据分析需求,帮助客户构建数据驱动的全新业务和管理模式。
目前,StarRocks产品已应用于金融、零售、物流、制造、互联网等行业的头部客户,服务超过 300家市值10亿美元以上的独角兽、大型企业,包括阿里云、腾讯云、金山办公、滴滴、小红书、联想、携程等。同时,StarRocks社区用户也已经突破1万人。
公司CEO孙文现曾在百度和金山云任职,联合创立了智云奇点(AbleCloud)并担任公司COO,在互联网、物联网、汽车、金融等行业领域有多年的经验积累和研究。镜舟科技之前,StarRocks又名鼎石纵横(此前叫DorisDB),是开源行业非常知名的企业级分布式数据库平台。
随着5G、云计算、大数据、 AI等技术的发展,全球数据量呈现爆发式增长。到2025年,全球的数据量将达到175ZB(Zettabyte,泽字节),其中近30%的数据需要被实时处理。据IDC统计,预计到2024年,中国数仓市场的规模是168.5亿元,中国大数据平台软件市场规模总体为352.9亿元,中国分析型数据库的整体市场将达到521.4亿元,复合增长率为27.7%。
因此,数据库技术对于企业的作用巨大。
现场演讲中,孙文现透露,StarRocks开源社区与镜舟科技的商业化发展关系是,开源社区催生制造场景、高效实现领先稳定的产品,并“加速”镜舟和上下游厂商等商业化主体,而商业化主体还会把客户反馈等“反哺”给开源社区。
简单来说,就是从开源中来,由商业化来进行孵化,最后商业化的公司再去回馈到开源社区里面去。
“首先,我们把开源用户和算法用户同等对待,所以那是‘两个拳头’,两个拳头就是‘两圈’,一个拳头是开源,一个拳头是商业化;第二,我们都是大用户和大客户策略,开源和商业化都做大客户。所以,我们是同一套思维,同一套模式把开源和商业化很好融合在一起。因此在公司不纠结,而且也不割裂,我们都是同样对待客户的。”孙文现对钛媒体App表示,随着开源社区活跃,最新产品版本大概需要打磨3到4个月时间就可以给所有商业化客户进行使用。
孙文现表示,2022年,StarRocks开源社区大概有70%的代码由镜舟科技贡献的,其中包括存算分离、数据湖分析、物化视图等功能,StarRocks现在所有的代码加起来总共170多万行。而且,StarRocks全年组织线上线下开源社区活动和运营社区和论坛,参与人数超过1.5万人。
谈及企业级服务的数字化改造面临的挑战,孙文现坦言,目前解决数字化改造的三个条件是:数据量要足够大、计算能力要强、计算成本要低。“目前大模型最差的一个体验是计算成本太高了,所以只能去租用算力资源,那就调API资源,而API接口又非常贵。当这三个鸿沟都跨越之后,我觉得技术可以去改变所有企业的经营模式、员工的工作模式等。”
谈到私有化模型,孙文现表示,私有化大模型的前景一定非常好。通过私有化大模型,可以把企业积累的所有的数据结构化、结构化、非结构化数据能够统一存储起来,而且让大模型给予一些决策能力。
“大模型时代我们肯定不是‘主角’,私有化大模型时代我们也不是’主角‘,做模型开发、算力提升的才是主角。如果说未来OpenAI所用的这套框架,还能符合‘摩尔定律’的话,我估计还得需要三年左右的时间,才能够使价格能降到能广泛使用程度。”孙文现认为,私有化大模型可能是未来最能够帮助企业发展的 AI 产品路径。
孙文现表示,中国和美国的数据库产品差距在于成熟度上。“技术沉淀来说,中国分布式数据库技术企业已经超越了海外传统厂商了。”
“如果说‘弯道超车’,这弯道我们已经找到,也已经超了。至于说目前是否中国的分布式数据库全都超过甲骨文(Oracle),现在不好说,需要整个产业来去共同决定。”孙文现强调。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论