RAG 架构+向量数据库，高效构建企业级智能知识库应用

为了打通西门子中国内部的知识孤岛，运用生成式 AI 推进组织数字化转型，西门子携手亚马逊云科技在3个月内轻松构建了基于 Amazon SageMaker、Amazon EKS、Amazon RDS、Amazon S3、Amazon OpenSearch Service 等产品开发的智能对话机器人“小禹”，为企业内部提供了更优秀的产品功能与体验，在生成式 AI 领域迈出可喜的一步。

场景描述

运用新兴科技更好地发掘数据价值，是西门子中国持续发力的方向。西门子中国大禹团队应用大数据技术、机器学习、云技术、低代码来组建数据分析系统，专注于创新领域，借助 AI 能力更好地发挥数据的价值。

在构建知识库的过程中，大禹团队通过调研认识到，长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。由于横跨多个不同领域、涉及多个不同业务单元，如若以传统方式打造知识库，这些问题将一直是横亘在部门间的长久之痛。因此，大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”，从根本上提升知识库的可用性。

解决方案

由于公司体量庞大，智能数据库的构建需面向多个不同业务部门，势必涉及大量的业务数据和文本数据。因此，智能知识库的存储架构，成为亚马逊云科技为西门子设计智能知识库时的首要考虑。

智能知识库的架构设计，实质上是大语言模型（LLM,Large Language Model）在知识检索领域如何得到充分利用的问题。亚马逊云科技决定采取检索增强生成（RAG,Retrieval Augment Generation）方式增强模型，使之具有来自存档知识源的增强上下文的模型架构。

最终亚马逊云科技为大禹团队提供的，是一个智能知识库暨智能会话机器人的解决方案指南，其中包括预训练大语言模型，Amazon OpenSearch Service 的向量数据服务，以及相关系统集成等。该解决方案指南具备自然语言处理能力、知识库检索能力、甚至是以数据去训练大语言模型的能力，这些核心关键能力让解决方案指南能实现目标知识库约 80% 功能，西门子中国根据企业内部需求再做 20% 定制化开发，最终形成完整的解决方案。

其中，最大的亮点在于“RAG 架构+向量数据库”设计：

•核心主体知识库以向量方式构建，能够存储超大规模的向量数据。通过对数据进行向量嵌入处理，跨部门、跨业务、跨场景的数据之间也能够进行关系考量。而 Amazon OpenSearch Service 的 k 近邻（kNN）插件为它提供了核心向量数据库功能，现在向量嵌入可以与单个混合请求中基于文本的关键字组合，查询时在几毫秒内就可获得数十亿向量的上下文相关响应。

•另一方面，RAG 架构极大地拓展了大模型的可用性。普通情况下当知识库新增内容时，相应的大模型必须进行微调，甚至是重新训练。而 RAG 允许对新增部分使用相同的模型处理，无需调整模型。这就相当于知识库在不影响访问速度的前提下，拥有了近乎无限的可扩展性。由向量数据库保障的杰出性能，再加上 RAG 架构提供的无限潜力，这就是智能会话机器人“小禹”能够在用户以简单语言进行提问的前提下，快速反馈生成式回答的秘密。

Amazon SageMaker 也为架构的伸缩性以及大语言模型持续迭代提供了很大帮助。借助 SageMaker Endpoint 的弹性伸缩能力，系统可以自动按照负载调整用于实时推理的资源，保证访问需求的同时提升整体性价比。Amazon SageMaker 上提供了丰富的模型开发和训练工具，保证客户可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

成效

相对于传统机器人，“小禹”智能会话机器人的回答内容不仅生成速度更快，其对搜索关键词的命中率也更高，整体使用体验远超传统机器人。西门子中国专属智能知识库上线后，首周就有超过 4000 位内部用户参与使用，超过 12000 个问题被提出并解答。作为智能知识库，它不但解决了各业务部门之间需求相似、重复开发的问题，更以云上弹性资源和托管的 Amazon OpenSearch Service 、Amazon SageMaker 等服务节约了系统在运维和扩展方面的投入成本。

RAG 架构+向量数据库，高效构建企业级智能知识库应用 | 创新场景

场景描述

解决方案

成效