2024ITValue-文章详情顶部

ChatBI加速旅游行业报表开发,生成SQL语句准确率达90% | 创新场景

德比软件为全球酒店和在线旅游服务商提供服务,如高效分销、内容管理、数字营销服务和商旅服务等。面向海外客户提供服务时,德比软件应用亚马逊云科技 Amazon Bedrock 等生成式 AI 服务,打造旅游与酒店行业智能 BI 报表解决方案 ChatBI,允许用户通过自然语言进行数据查询与分析,生成 SQL 语句准确率高达 90%,报表开发效率提升 50% 以上。

场景描述

德比软件处理全球超过 22.7 万家酒店数据,每月处理超过 1800 万酒店间夜数,致力于用领先技术为不同企业系统提供数据对接和数据集成,包括酒店供应商、分销商、垂直搜索引擎、旅游技术服务商等之间。德比软件让 BI 报表开发融入各产品业务中,成为不可或缺的工具和服务。

德比软件于 2020 年构建了 BI 系统,然而,不同酒店和 OTA(Online Travel Agency,在线旅游服务商)之间系统对接复杂,数据量庞大,数据瞬时变化多,各业务团队临时数据分析需求千变万化,跨业务团队的数据查询需求层出不穷,外部 BI 解决方案需求迸发,这些内部/外部的海量、个性化需求超出当前 BI 系统的处理能力,所以给德比软件的 BI 开发团队提出亟需解决的问题,如下:

  • 部分报表需求响应慢:部分报表分析为低频需求,在 BI 系统找不到相应的数据支撑;由于时差的原因,无法及时响应美国或欧洲团队提出的需求;
  • 数据分析门槛高:普通业务人员往往不懂 SQL 语言 (Structured Query Language,结构化查询语言),难以进行数据解读与分析;
  • 定制化数据分析耗时耗力:个性化的定制需求会越来越多,这些需求只能依靠有经验的数据分析师来开发,通常需要花费数天或数周;
  • 数据价值未被挖掘和利用:海量的数据未能盘活,如何从中挖掘、分析出对业务有启发的洞察,进而获得商业价值是长期难题。

解决方案

面向海外客户提供服务时,德比软件通过亚马逊云科技 Amazon Bedrock 访问业界领先 LLM(Large Language Model,大语言模型),基于此构建 ChatBI。首先,借助 LLM 优秀的归因能力与上下文理解能力,可根据用户输入的自然语言进行意图识别,判断是否属于 BI 问题;其次,基于 LLM 良好的推理与归因能力,ChatBI 可根据提示词自动生成对应的 SQL 语句,普通业务人员无需编码即可自动完成自然语言到 SQL 的转换,极大降低了数据分析门槛;第三,ChatBI 还支持可视化的展示分析结果,并为业务人员提供下一个阶段的运营建议。

基于 Amazon OpenSearch Service 构建向量数据库,让数据查询更快、搜索更准确要充分释放生成式 AI 技术优势,将 ChatBI 潜能充分应用于业务,建立一个坚实的端到端数据基座,既是基础也是决定性的差异化优势,亚马逊云科技助力德比软件实现这一目标。

  • 首先,在亚马逊云科技的支持下,德比软件开展了一系列数据准备工作,包括制定标准化 SQL 规范、预训练等;
  • 接着,应用 Amazon OpenSearch Service 构建向量数据库,让德比软件高效查询和匹配大规模和多维度向量数据,近乎实时的⽀持添加、更新和删除向量嵌⼊,不会影响查询性能或重新索引数据,极大提升了搜索准确性与检索效率。同时,德比软件还采用了 RAG(Retrieval-Augmented Generation,检索增强生成)技术,从历史数据和外部数据中检索相关示例,作为输入提示。例如,酒店数据中包含有大量的专有名词,若用户提问中使用的名词和系统中的专有名词不一致,原来的情况是,SQL 就无法匹配到正确信息,但借助 RAG 技术,通过与外部数据库建立映射,就能匹配到正确的专用名词,从而提升 SQL 语句生成的准确性;
  • 此外,采用 Amazon Titan Multimodal Embeddings 模型对大量的酒店数据进行向量化处理,将图像和短文本转换为 embedding 数字表示形式,业务实体、问答数据进行向量化匹配后,向量化数据库极大提高 BI 的数据检索速度,输出的结果更准确。亚马逊云科技强大专家团队提供 PE 和 RAG 工程化实施,让 ChatBI 发挥更大潜力、性能更优德比软件在亚马逊云科技大客户支持团队和行业解决方案架构师等团队的支持下,仅用 2 个月就完成了 ChatBI 的上线。期间,亚马逊云科技为德比软件提供了大语言模型的 PE(Prompt Engineering,提示工程)优化服务,更大限度地发挥 LLM 的潜力,使其生成更准确、和上下文相关的输出;还采用了 RAG 技术使大语言模型不再完全依赖训练数据,而是能够灵活利用外部知识,从而扩展其应用场景和能力范围。

成效

2 个月完成 ChatBI 高效落地,生成的 SQL 语句准确率高达 90%,BI 报表开发效率提升 50%

每到月底,旅游与酒店行业往往会有大量的 BI 需求提交到德比软件 BI 团队,部分复杂、高度定制化的查询需求每条均需要花数分钟或更长时间才能完成,常常导致需求堆积。亚马逊云科技的专家团队与德比软件业务团队、BI 团队深度合作,仅用两个月就完成了从项目范围确定、数据准备、开发概念验证、接入生产环境到最终上线的全部流程。应用 ChatBI 后,结合 PE 和 RAG 技术,SQL 语句生成准确率可高达 90%,使得一半的定制化需求通过 ChatBI 即可自动完成,开发效率提升 50%,开发 BI 报表时间相对以前缩短了一半,极大提升旅游与酒店行业客户的满意度。

降低数据分析门槛,从数据中产生对业务有价值的洞察

德比软件的部分业务团队或领导层并不精通 SQL 语言,往往需要 BI 人员根据需求编写 SQL 语句定制化开发来查询。采用 ChatBI 后,无需人工编码即可自动将自然语言转换为 SQL 语句,轻松进行数据查询,比如可以直接用自然语言提问“上个月的订单量多少”,ChatBI 会根据上下文识别对应月份中对应酒店对应房型的订单数据,生成 SQL 语句,并返回数据结果,还可以进行同比、环比、跨业务团队的数据对比,挖掘数据洞察。

提升数据质量,促进数据治理水平提升

要想 ChatBI 输出的结果达到较好的问答效果,首先得有高质量的数据基础,因此完备的元数据,业务口径、指标等数据都需要有清晰的定义,针对这些元数据进行数据收集、数据建模,以及数据全生命周期管理,为 Chat BI 的高效、准确输出奠定基础。ChatBI 的实施过程,也推进了德比软件全面建设和提升数据治理水平。

本文系作者 亚马逊云科技 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2024-09-19 23:00

景顺:今年美联储很可能再降息50个基点,相信美国经济可避免衰退

2024-09-19 22:44

沙特股指于美联储降息次日收涨超1.3%,本周累涨超2%

2024-09-19 22:39

远望谷:终止6.38%股份转让协议

2024-09-19 22:31

美国至9月13日当周EIA天然气库存580亿立方英尺,预期560亿立方英尺

2024-09-19 22:30

昆明支持住房公积金支付新建商品住房首付款

2024-09-19 22:26

上海顺城实业30%股权挂牌转让,底价约2亿元

2024-09-19 22:22

北京市算力互联互通和运行服务平台正式上线

2024-09-19 22:19

耶伦:美联储的行动对美国经济来说是“非常积极的”信号

2024-09-19 22:13

台风“普拉桑”来袭,江苏发布暴雨蓝色预警

2024-09-19 22:12

年内IPO在审企业降至314家,终止374家

2024-09-19 22:09

特斯拉涨幅扩大至5%,股价创7月23日以来最高水平

2024-09-19 22:02

美国8月成屋销售总数年化386万户,预期390万户,前值由395万户修正为396万户

2024-09-19 22:02

北京市丰台区:将对无人机、eVTOL、飞行汽车整机及关键部件研制等方面给予政策支持

2024-09-19 21:56

第14号台风“普拉桑”已于21时45分前后在上海奉贤沿海二次登陆

2024-09-19 21:55

欧盟8月新车销量下滑18.3%,跌至3年来最低

2024-09-19 21:50

标普500指数开盘飙升至盘中历史新高,业内人士:指数可以一直持续上涨到美国大选

2024-09-19 21:49

费城半导体指数涨超3%,Arm、英伟达均涨超5%

2024-09-19 21:49

北京明天气温骤降,降雨或影响早晚高峰出行

2024-09-19 21:38

燕东微:拟以4000万元至8000万元回购股份

2024-09-19 21:33

美股开盘:三大指数集体高开,阿斯麦涨逾5%

扫描下载App