作者:来自 Elastic Kofi Bartlett

解释如何使用 terms queryenrich processor 来连接 Elasticsearch 中的两个索引。

更多有关连接两个索引的查询,请参阅文章 “Elastic:开发者上手指南” 中的 “丰富数据及 lookup” 章节。

Elasticsearch 拥有丰富的新功能,帮助你为自己的使用场景构建最佳搜索解决方案。深入阅读我们的示例笔记本,了解更多信息,开始免费云端试用,或立即在本地机器上尝试 Elastic。


在 Elasticsearch 中,连接两个索引不像传统 SQL 数据库那样直接。然而,可以通过 Elasticsearch 提供的一些技术和功能实现类似的效果。本文将深入介绍在 Elasticsearch 中连接两个索引的过程,重点讲解如何使用 terms queryenrich processor

 使用 terms query 连接两个索引

terms query 是在 Elasticsearch 中连接两个索引最有效的方法之一。这个查询用于检索某个字段中包含一个或多个精确值的文档。以下是使用它来连接两个索引的方法: 

  1. 首先,需要从第一个索引中获取所需的数据。这可以通过一个简单的 GET 请求完成。
  2. 获取到第一个索引中的数据后,可以使用这些数据去查询第二个索引。这通过 terms query 实现,你需要指定要匹配的字段和对应的值。

下面是一个示例:

  • # 第一步:查 index A,得到 id:
GET index_a/_search
{"query": {"match": {"user": "alice"}}
}
  • 第二步:根据 index A 的结果查询 index B
GET index_b/_search
{"query": {"terms": {"user_id": [ "123", "456" ]  # 从 index_a 拿到的 id}}
}

terms 查询还支持使用一种称为 terms lookup 的技术,在一次请求中执行上述两个步骤。Elasticsearch 会自动从另一个索引中检索匹配值。例如,你有一个名为 teams 的索引,里面包含球员列表:

PUT teams/_doc/team1
{"players":   ["john", "bill", "michael"]
}PUT teams/_doc/team2
{"players":   ["aaron", "joe", "donald"]
}

现在,可以查询 people 索引,获取所有在 team1 打球的人,如下所示:

GET people/_search?pretty
{"query": {"terms": {"name" : {"index" : "teams","id" : "team1","path" : "players"}}}
}

在上面的例子中,Elasticsearch 会透明地从 teams 索引中的 team1 文档中检索球员名字(即“john”,“bill”,“michael”),并找到所有在 people 文档中 name 字段包含这些值的文档。等效的 SQL 查询如下:

SELECT p.* FROM people p
INNER JOIN teams t ON p.name = t.players

更多阅读,请参阅 “Elasticsearch:Terms lookup query - 关联两个不同索引的搜索”。

使用 enrich 处理器连接两个索引

enrich 处理器是另一个强大的工具,可以用于在 Elasticsearch 中连接两个索引。此处理器通过从预定义的 enrich 索引中添加数据来丰富传入文档的数据。

以下是如何使用 enrich 处理器连接两个索引的步骤:

  1. 首先,你需要创建一个 enrich 策略。该策略定义了要用于丰富的索引以及要匹配的字段。下面是一个示例:

    PUT /_enrich/policy/my_enrich_policy
    {"match": {"indices": "first_index","match_field": "field_in_first_index","enrich_fields": ["field_to_enrich"]}
    }
  2.  一旦创建了策略,你需要执行它:  

    POST /_enrich/policy/my_enrich_policy/_execute
  3. 执行策略后,你可以在摄取管道中使用 enrich 处理器来丰富传入文档的数据:

PUT /_ingest/pipeline/my_pipeline
{"processors": [{"enrich": {"policy_name": "my_enrich_policy","field": "field_in_second_index","target_field": "enriched_field"}}]
}

在这个例子中,field_in_second_index 是第二个索引中你想要用第一个索引的数据来丰富的字段,enriched_field 是将包含丰富数据的新字段。

这种方法的一个缺点是,如果第一个索引中的数据发生变化,丰富策略需要重新执行,因为丰富索引不会自动从源索引同步或更新。然而,如果第一个索引相对稳定,那么这种方法效果很好。

更多阅读,请参阅文章 “Elasticsearch:如何使用 Elasticsearch ingest 节点来丰富日志和指标” 及 “Elasticsearch:使用 Elasticsearch ingest pipeline 丰富数据”。

结论

总之,虽然 Elasticsearch 不支持传统的连接操作,但它提供了像 terms 查询和 enrich 处理器这样的功能,可以用来实现类似的结果。需要注意的是,这些方法有其局限性,应该根据具体的需求和数据的性质谨慎使用。

原文:Joining two indexes in Elasticsearch - Elasticsearch Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/80412.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/80412.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/80412.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LabVIEW的PID参数自适应控制

在工业控制领域,PID 控制凭借结构简单、稳定性好、工作可靠等优点被广泛应用。然而,传统固定参数的 PID 控制在面对复杂多变的工况时,控制效果往往难以达到最优。基于 LabVIEW 实现 PID 控制根据情况选择参数(即参数自适应调整&am…

[redis进阶四]分布式系统之哨兵(2)

目录 一 利用docker搭建环境 板书: 一)准备⼯作: 板书: 解读docker配置文件: 1)安装docker和docker-compose 2) 停⽌之前的redis-server 3) 使⽤docker获取redis镜像 二)编排redis主从节点 板书:​编辑 1) 编写docker-compose.yml 2) 启动所有容器 3) 查看运⾏⽇志 …

spark-Schema 定义字段强类型和弱类型

在数据处理和存储中,Schema(模式)定义了数据的结构和字段属性,其中字段的强类型和弱类型是重要的概念,直接影响数据的验证、存储和处理方式。以下是详细解释: 1. 强类型(Strongly Typed&#x…

2024睿抗编程赛国赛-题解

2024睿抗编程赛国赛题解 RC-u1 大家一起查作弊 题目重述 我们需要从给定的多行字符串中提取出所有的关键词,并计算这些关键词的可疑分数总和、总长度以及关键词的数量。具体步骤如下: 关键词定义:由大写字母、小写字母、数字组成的字符串&a…

控制LED灯设备

本章分别使用C库和系统调用的文件操作方式控制开发板的LED灯,展示如何在应用层通过系统提供的设备文件控制相关硬件。 本章的示例代码目录为:base_code/linux_app/led/sys_class_leds。 9.1. LED子系统 在Linux系统中,绝大多数硬件设备都有…

SpringBoot学习(上) , SpringBoot项目的创建(IDEA2024版本)

目录 1. SpringBoot介绍 SpringBoot特点 2. SpringBoot入门 2.1 创建SpringBoot项目 Spring Initialize 第一步: 选择创建项目 第二步: 选择起步依赖 第三步: 查看启动类 2.2 springboot父项目 2.3 测试案例 2.3.1 数据库 2.3.2 生成代码 1. SpringBoot介绍 Spring B…

在 Ubuntu 中配置 Samba 实现「特定用户可写,其他用户只读」的共享目录

需求目标 所有认证用户可访问 Samba 共享目录 /path/to/home;**仅特定用户(如 developer)**拥有写权限;其他用户仅允许读取;禁止匿名访问。 配置步骤 1. 设置文件系统权限 将目录 /home3/guest 的所有权设为 develo…

ENSP-OSPF综合实验

AR4中通过ospf获取的其他区域路由信息,并且通过路由汇总后简化路由信息 实现全网通,以及单向重发布,以及通过缺省双向访问, 通过stub简化过滤四类五类lsa,简化ospf路由信息 通过nssa简化ospf信息 区域汇总简化R4路由信…

linux(centos)联网情况下部署

nginx部署 1.linux(centos)联网情况下部署 1.下载nginx所需依赖 # 安装开发工具组(若未安装) sudo yum groupinstall "Development Tools"# 安装 OpenSSL 开发包 sudo yum install openssl-devel# 安装 PCRE 开发包 sudo yum install pcre-…

LeetCode 1550.存在连续三个奇数的数组:遍历

【LetMeFly】1550.存在连续三个奇数的数组:遍历 力扣题目链接:https://leetcode.cn/problems/three-consecutive-odds/ 给你一个整数数组 arr,请你判断数组中是否存在连续三个元素都是奇数的情况:如果存在,请返回 tr…

Android Framework学习四:init进程实现

文章目录 init流程简介init源码执行顺序执行顺序 init进程的具体工作事项挂载文件系统设置 SELinuxSecondStageMaininit.rc启动zygote和serviceManager进程的重要性serviceManager工作原理 Framework学习之系列文章 init流程简介 下面图片主要围绕 Android 系统中init进程的运…

HTTP/3展望、我应该迁移到HTTP/2吗

1. HTTP/3展望 HTTP/3 基于 QUIC 协议,完全解决了“队头阻塞”问题,弱网环境下的表现会优于 HTTP/2;QUIC 是一个新的传输层协议,建立在 UDP 之上,实现了可靠传输;QUIC 内含了 TLS1.3,只能加密通…

【大模型面试每日一题】Day 15:流水线并行的Bubble问题及其缓解方法

【大模型面试每日一题】Day 15:流水线并行的Bubble问题及其缓解方法 📌 题目重现 🌟🌟 面试官:解释流水线并行(Pipeline Parallelism)的bubble问题及其缓解方法。 #mermaid-svg-Uz7WGsO8akW5F…

Windows环境下maven的安装与配置

1.检查JAVA_HOME环境变量 Maven是使用java开发的,所以必须知道当前系统环境中的JDK的安装目录。 搜索栏直接输入“cmd” 或者 WinR 输入cmd 在打开的终端窗口输入“echo %JAVA_HOME”,就可以看到jdk的位置了。 如果没有的话,请参考我的文章&a…

Kubernetes 集群部署应用

部署 Nginx 应用 命令行的方式 1. 创建 deployment 控制器的 pod # --imagenginx:这个会从 docker.io 中拉取,这个网站拉不下来 # kubectl create deployment mynginx --imagenginx# 使用国内镜像源拉取 kubectl create deployment mynginx --imaged…

如何使用依赖注入来实现依赖倒置原则?

依赖注入(Dependency Injection, DI)是实现依赖倒置原则(DIP)的具体技术手段,它通过将依赖对象的创建和管理交给外部容器,从而实现高层模块与低层模块的解耦。下面从原理、实现方式、框架应用及最佳实践四个方面详细解析: 一、依赖倒置原则(DIP)的核心思想 高层模块不…

python使用AES进行加密和解密

如果需要加密和解密功能,可以使用AES算法。以下是使用Python实现AES加密和解密的示例: from Crypto.Cipher import AES from Crypto.Util.Padding import pad, unpad from Crypto.Random import get_random_bytesdef aes_encrypt(data,

SaaS场快订首页的前端搭建【持续更新】

文章目录 一、创建页面二、配置路由三、写接口文件(api)1.定位的接口函数(腾讯地图api)实现代码: 2.获取场馆分类的数据3.获取附近场馆列表的数据 四、开发首页页面1.顶部区域2.搜索框3.场馆分类4.附近场馆列表 五、难…

深入解析 MQTT 协议:物联网通信的基石

在当今物联网蓬勃发展的时代,设备之间高效、可靠的通信变得至关重要。MQTT(Message Queuing Telemetry Transport)协议,作为一种轻量级的消息传输协议,正逐渐成为物联网通信的基石,广泛应用于各种场景中。 …

在Python中计算函数耗时并超时自动退出

更多内容请见: python3案例和总结-专栏介绍和目录 文章目录 方法1:使用装饰器结合信号模块(仅Unix-like系统)方法2:使用多线程(跨平台解决方案)方法3:使用concurrent.futures(Python 3.2+)方法4:使用 multiprocessing + Process(跨平台)​方法5:使用 time 手动计…