学习笔记:Elasticsearch 文档检索系统

1. 技术栈与核心组件

  • Node.js:后端运行环境,适合构建高性能 Web 服务。
  • Express:Node.js 的 Web 框架,简化 API 开发。
  • Elasticsearch:分布式全文检索引擎,支持高效的文本检索。
  • 原生 HTML+JS:前端页面实现,便于快速演示和交互。

2. 后端实现要点

  • API 设计

    • /import:导入本地 JSON 文档到 Elasticsearch,支持批量操作。
    • /search:根据关键词检索文档,支持多字段(标题、内容)全文检索。
  • Elasticsearch 客户端

    • 使用 @elastic/elasticsearch npm 包连接本地 ES 服务。
    • 索引管理:每次导入前先删除旧索引,保证数据一致性。
    • 字段映射(Mapping):定义文档结构,指定哪些字段可检索。
  • 批量导入

    • 通过 bulk API 一次性导入多条文档,提升效率。
  • CORS 跨域

    • 使用 cors 中间件,允许前端页面直接访问后端 API。
// =========================
// 导入文档到 Elasticsearch
// =========================
app.post('/import', async (req, res) => {try {// 1. 检查索引是否存在,存在则先删除(保证每次导入都是全新数据)const exists = await esClient.indices.exists({ index: esIndex });// exists.body 为 true 表示索引存在,需先删除if (exists.body) {await esClient.indices.delete({ index: esIndex });}// 2. 创建新索引,并定义字段映射await esClient.indices.create({index: esIndex,body: {mappings: {properties: {id: { type: 'integer' }, // 文档IDtitle: { type: 'text' }, // 标题,全文检索content: { type: 'text' } // 内容,全文检索}}}});// 3. 读取本地 docs.json 文件,获取10篇文档const docs = JSON.parse(fs.readFileSync(path.join(__dirname, 'docs.json'), 'utf-8'));// 4. 构造批量导入 bodyconst body = docs.flatMap(doc => [{ index: { _index: esIndex, _id: doc.id } }, doc]);// 5. 批量导入文档到 ESawait esClient.bulk({ refresh: true, body });res.json({ success: true, message: '导入成功', count: docs.length });} catch (err) {// 错误处理res.status(500).json({ success: false, error: err.message });}
});// =========================
// 查询接口:根据关键词检索文档
// =========================
app.get('/search', async (req, res) => {const q = req.query.q || ''; // 获取查询参数try {// 调用 ES 的 search API,multi_match 支持多个字段全文检索const result = await esClient.search({index: esIndex,body: {query: {multi_match: {query: q,fields: ['title', 'content'] // 在标题和内容中查找}}}});// 取出命中结果,提取需要的字段const hits = result.hits.hits.map(hit => ({id: hit._source.id,title: hit._source.title,content: hit._source.content,score: hit._score // 相关性分数}));res.json({ success: true, data: hits });} catch (err) {// 错误处理res.status(500).json({ success: false, error: err.message });}
});

3. 前端实现要点

  • 页面结构

    • 搜索输入框 + 按钮,用户输入关键词后触发检索。
    • 结果区域动态渲染检索到的文档列表。
  • 与后端交互

    • 使用 fetch 发送 GET 请求到 /search,获取 JSON 格式结果。
    • 处理异常和无结果情况,提升用户体验。
  • 界面美化

    • CSS 实现响应式布局和美观样式,适配不同屏幕。
      在这里插入图片描述

4. 数据结构与流程

  • 文档结构

    • 每条文档包含 idtitlecontent 字段。
    • 示例数据存储于 backend/docs.json
  • 检索流程

    1. 用户输入关键词,点击搜索。
    2. 前端调用后端 /search 接口。
    3. 后端在 ES 中检索,返回相关文档及分数。
    4. 前端展示检索结果。

5. 常见问题与调试

  • Elasticsearch 未启动:后端无法连接 ES,需先启动本地 ES 服务。
  • 端口冲突:确保 3001 端口未被占用。
  • 跨域问题:已通过 CORS 解决,前后端可分开运行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/90612.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/90612.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/90612.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何准确查看服务器网络的利用率?

在服务器运维与性能调优过程中,网络利用率是一个不容忽视的关键指标。它反映了服务器带宽资源的实际使用情况,是判断系统瓶颈、规划资源扩展、排查连接问题的重要依据。很多人误以为网络是否正常只要“能上网”或“Ping得通”就可以了,实际上…

掌握Spring声明式事务传播机制:AOP与ThreadLocal的协同工作

声明式事务的传播机制是解决多个事务方法嵌套调用时,事务如何创建、复用、挂起或隔离的核心逻辑。它的实现依赖于事务管理器、事务状态管理、线程上下文绑定等组件的协同,本质是通过一套 “规则判断 状态维护” 的逻辑,在方法调用时动态决定…

@Transactional事务注解的批量回滚机制

关键机制说明:1.​​事务注解生效​​:Transactional(rollbackFor Exception.class)Override Transactional(rollbackFor Exception.class) public Boolean saveUser(UserDTO userDto) {SysUser sysUser new SysUser();BeanUtils.copyProperties(user…

飞算 JavaAI 深度体验:开启 Java 开发智能化新纪元

个人主页:♡喜欢做梦 欢迎 👍点赞 ➕关注 ❤️收藏 💬评论 目录 一、引言 二、飞算 JavaAI 初印象与功能概览 (一)初识飞算 JavaAI (二)核心功能模块概览 三、智能代码生成功能深度体…

pandas销售数据分析

pandas销售数据分析 数据保存在data目录 消费者数据:customers.csv商品数据:products.csv交易数据:transactions.csv customers.csv数据结构:字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期produc…

访问Windows服务器备份SQL SERVER数据库

以前没有直接访问过Windows服务器,今天刚一看到的是时候有点懵,竟然下意识的使用SecureCRT远程工具去连了一下,然后领导说,看一下用户名,突然意识到,跟我们平时远程桌面是一样的。 一、 win + R 打开命令窗口 二、 输入 mstsc 三、 输入远程地址 四、点击连接,如果有弹…

C++ 面向对象 - 对象定义方法汇总

C对象定义方法汇总 1. 栈上定义方式 1.1 调用无参构造函数的定义方式 无参构造函数有两种: 默认无参构造函数Demo(){}默认值列表构造函数。Demo():a{1},b{2}{} // 使用初始化列表实现对象定义方式: Demo d; Demo d1{}; // 以下定义方式还调用了拷贝构造…

指尖上的魔法:优雅高效的Linux命令手册

一、Linux基础指令 1. ls ls:对于目录,列出该目录下的所有子目录与文件,对于文件,将列出文件名以及其他信息。 -a:列出目录下的所有文件,包含以.开头的隐藏文件 -l:列出文件的详细信息 -d:将目录…

《磁力下载工具实测:资源搜索+高速下载一站式解决方案》

嘿,朋友们!我是阿灿,今天给大家带来一个超实用的看片神器,特别适合老司机们使用,保证让你眼前一亮!推荐一款比某雷更好用的下载工具,搭配资源搜索神器,轻松获取资源不限速。超强磁力…

Go网络编程基础:网络模型与协议栈概述 - 从理论到实践的完整指南

1. 引言 在当今的互联网时代,网络编程已经成为后端开发的核心技能。Go语言以其出色的并发性能和简洁的语法,在网络编程领域展现出了强大的优势。从Docker、Kubernetes到众多微服务框架,Go已经成为构建高性能网络应用的首选语言之一。 你是否…

Web攻防-SSTI服务端模版注入利用分类语言引擎数据渲染项目工具挖掘思路

知识点: 1、WEB攻防-SSTI-利用分类&功能点 2、WEB攻防-SSTI-利用项目&挖掘思路 SSTI(Server Side Template Injection) 服务器模板注入, 服务端接收了用户的输入,将其作为 Web 应用模板内容的一部分,在进行目标编译渲染的过程中&…

李沐动手学深度学习Pytorch-v2笔记【07自动求导代码实现】

文章目录前言自动求导实现非标量变量的反向传播分离计算Python控制流的梯度计算前言 关于走动求导的理论知识个人有点难以理解,推荐大家去看https://blog.csdn.net/weixin_42831564/article/details/135658138这篇文章,讲的很好。 自动求导实现 impor…

strchr 与 strstr 函数详解

一.strchr - 字符查找函数1.函数原型char *strchr(const char *str, int c);2.核心功能在字符串中查找特定字符的第一次出现位置3.参数说明参数 类型 说明str const char* 要搜索的字符串c int 要查找的字符(自动转换为char)4.返回值…

jakes信道模型

Jakes 模型 前面我们介绍了多径信道合成信号可表示为: r(t)Re{∑i0N(t)−1ai(t)u(t−τi(t))ej2πfc(t−τi(t))ϕDi(t)} r(t)Re \left\{\sum_{i0}^{N(t)-1}a_{i}(t)u(t-\tau_{i}(t))e^{j2\pi f_{c}(t-\tau_{i}(t))\phi_{D_{i}}(t)} \right\} r(t)…

JVM类加载机制解析

什么是类加载器? 类加载器是JVM的核心组件之一,负责将Java字节码文件(.class文件)加载到JVM内存中。由于JVM只能执行二进制字节码,类加载器的作用就是将编译后的.class文件转换为JVM可以理解和执行的格式,使…

用Python和OpenCV从零搭建一个完整的双目视觉系统(二)

本系列文章旨在系统性地阐述如何利用 Python 与 OpenCV 库,从零开始构建一个完整的双目立体视觉系统。 本项目github地址:https://github.com/present-cjn/stereo-vision-python.git 项目架构设计:蓝图、分工与工作流 在上一篇文章中&#…

亿级流量下的缓存架构设计:Redis+Caffeine多级缓存实战

亿级流量下的缓存架构设计:RedisCaffeine多级缓存实战 一、为什么需要多级缓存? 在亿级流量场景下,单纯依赖Redis会遇到三大瓶颈:网络延迟:Redis远程访问通常需要1-5ms,QPS超过10万时成为瓶颈资源成本&…

AI基建还能投多久?高盛:2-3年不是问题,回报窗口才刚开启

高盛表示,尽管AI商业化变现仍处早期阶段,但基于成本削减的第一阶段回报已经显现。预测到2030年AI自动化可为财富500强企业节省约9350亿美元成本。分析师认为,这一早期收益足以支撑当前AI基础设施投资水平,尽管增长率可能放缓。虽然…

【mac】快捷键使用指南

在Mac上,根据选择对象的不同,在选择时移动的方法也有所不同,以下是具体介绍: 移动文件或文件夹:可通过拖放操作移动。打开“访达”(Finder),找到要移动的文件或文件夹,按…

CS144 lab2 tcp_receiver

1. 实验目的 lab2 的目的是实现tcp的接收端。 主要包括两方面 (1) 从发送端接收消息,使用Reassembler聚合字节流(Bytestream) (2)将确认号(ackno)和window size发回对端 …