摘要
Elasticsearch 是全球领先的搜索引擎。传统的词汇搜索不能满足当今智能时代的需求。当代企业针对搜索提出语义搜索,也就是根据文字的语义来进行搜索,而不是简单的词汇匹配。另外,我们也需要针对其它的数据类型,比如图片,语音及视频来进行搜索。Elasticsearch 自 8.0 开始提供向量搜索(密集向量,稀疏向量)。它可以完美地解决文字语义搜索及多媒体数据的搜索。此外,向量搜索也并非完美,特别是针对文字搜索。我们可以使用混合搜索(词汇搜索,向量搜索)进行多路召回并对最终结果进行排名。这种方法可以提供搜索的提高精度及召回率。在人工智能发展的今天,结合大模型,我们把搜索到的结果结合大模型,使用 GenAI 可以让我们得到推理的结果。由于企业数据或私有数据在每时每刻都在生成,而大模型的知识受限于在模型生成的时候,而且大模型的数据也只是网页数据训练而得到的。大模型在缺乏上下文的情况下使用大模型来对企业或者私有数据进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成).本议题将详细介绍 Elasticsearch 的向量搜索技术及如何使用它进行 RAG 的应用开发以及最新的 agentic RAG。