前言

随着越来越多的大数据网站崛起,特别是一些私人网站都提供了站内搜索,有些人会用elastsearch来实现站内搜索的目的,但是一些小站并没有那么大的数据提供搜索,在安装一个 elastsearch 服务未免有点浪费?

因此,为了解决以上问题,本文章特意将 elastsearch 中的 IKAnalyzer分词插件 提取出来单独使用,不需要依赖 elastsearch 就可以使用,

使用方法也很简单,下面附上代码:

先引入pom依赖

<!--分词插件--><dependency><groupId>com.janeluo</groupId><artifactId>ikanalyzer</artifactId><version>2012_u6</version></dependency>

java代码:

package com.xd.core.common.utils;import com.google.common.collect.Lists;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.List;/*** <分词工具>** @className AnalyzerUtils* @Date 2019/1/19 17:17**/
public class AnalyzerUtils {/**** <分词>** @param content 需要分词的文章* @return java.lang.String[]*/public static List<String> participle(String content) throws IOException {//独立Lucene实现StringReader re = new StringReader(content);IKSegmenter ik = new IKSegmenter(re,true);Lexeme lex = null;List<String> words = new ArrayList<>();try {while((lex=ik.next())!=null){words.add(lex.getLexemeText());}}catch (Exception e) {e.printStackTrace();throw e;}return words;}public static void main(String[] args) throws IOException {List<String> participle = participle("如何成为一个高情商的人,心理学家玛莎.莱恩博士曾经创建了高情商训练课,从这四个方面帮助了无数人提升情商");System.out.println(participle);}}

运行结果:
[如何, 成为, 一个, 高, 情商, 的人, 心理学家, 玛莎, 莱, 恩, 博士, 曾经, 创, 建了, 高, 情商, 训练课, 从这, 四个, 方面, 帮助, 了无, 数人, 提升, 情商]

另外,如果有条件的话还是使用elastsearch 用作搜索引擎较好

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91154.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91154.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/91154.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ESB 在零售,物流,制造,保险,医疗行业的应用方式

企业服务总线&#xff08;Enterprise Service Bus, ESB&#xff09;是一种基于中间件的集成模式&#xff0c;用于实现不同系统之间的集成与通信。ESB通过标准化接口、消息路由、协议转换和数据转换等功能&#xff0c;帮助企业实现系统间的无缝对接&#xff0c;提高业务敏捷性。…

vcsa6.7-重置root密码

客户反馈vc无法登录了&#xff0c;登录环境一看&#xff0c;报错如下首先想到是证书到期了&#xff0c;浏览器确认&#xff0c;确实是证书到期了准备ssh登录才发现root密码忘记了&#xff0c;那就先重置root密码&#xff0c;1、登录esxi主机找到vcsa6.7机器关机做快照2、开机到…

C++ 赋值与交换法则

在C中&#xff0c;赋值与交换法则&#xff08;Assignment and Swap Idiom&#xff09;通常指的是在实现类的赋值操作符&#xff08;operator&#xff09;时&#xff0c;结合拷贝构造和交换操作来确保强异常安全保证&#xff08;Strong Exception Safety Guarantee&#xff09;的…

Ambari中文汉化

Ambari-ZH 当前Ambari的汉化版本为2.7.4,汉化采用对该版本的ambari源码直接修改的方式进行,如有翻译不当之处,请批评指正 一、使用方法如下&#xff1a; 方式一&#xff1a;直接下载 下载地址&#xff1a;https://github.com/ukayunnuo/Ambari-2.7.x-zh/releases/download/…

表格之固定列和表头

说明 利用粘性定位实现 列固定 td.fixed {position: sticky;left: 0;z-index: 5;/* 最好指定背景&#xff0c;否则滑动时会显示下面的列 */background-color: #f8f9fa; }表头固定 <head><style>.table-container {position: relative;display: flex;overflow: hidd…

React 图标库发布到 npm 仓库

将搭建的 React 图标库发布到 npm 仓库需要经过一系列步骤&#xff0c;包括配置 package.json、构建代码、注册 npm 账号、测试和发布。以下是详细流程&#xff1a; 1. 准备工作 (1) 确保项目结构完整 图标库的典型结构&#xff08;以 Rollup 构建为例&#xff09;&#xff1…

Java学习第八十四部分——HttpClient

目录 一、前言介绍 二、主要特点 三、功能用法 四、应用场景 五、最佳实践 六、总结归纳 一、前言介绍 HttpClient 是一个用于发送 HTTP 请求和接收 HTTP 响应的客户端库&#xff0c;广泛应用于 Web 开发、API 调用、微服务通信等场景。 二、主要特点 支持多种HTTP方…

学习笔记-中华心法问答系统的性能提升

1.简介本周主要任务是自行查找文献&#xff0c;针对源代码进行性能提升&#xff0c;主要包括三个方面&#xff1a;预处理&#xff1a;分词、关键词提取、词向量生成&#xff1b;文本分析&#xff1a;从多个关键词的词向量&#xff0c;如何到一句话的语义理解&#xff1b;问题分…

Python爬虫03_Requests破解百度翻译

爬取百度翻译页面信息 以POST方法发送JSON数据&#xff0c;爬取响应信息&#xff0c;并且需要对响应信息对象类型进行区分。 import requests import json#1.指定url post_url https://fanyi.baidu.com/sug#2.进行UA封装 headers {User-Agent:Mozilla/5.0 (Windows NT 10.0; …

【C++进阶】第8课—红黑树封装map和set

文章目录1. map和set的源码及框架分析2. 模拟实现map和set2.1 实现可以复用红黑树的框架&#xff0c;支持insert操作2.2 实现迭代器iterator2.2.1 实现迭代器2.2.2 实现迭代器 - -2.2.3 解决key不能修改的问题2.2.4 重载operator[ ]3. 完整代码3.1 红黑树头文件RBTree.h3.2 mym…

【机器学习深度学习】DeepSpeed框架:高效分布式训练的开源利器

目录 前言 一、DeepSpeed 简介 1.1 定位与目标 1.2 集成生态 二、核心技术解析 2.1 ZeRO&#xff08;Zero Redundancy Optimizer&#xff09; 2.2 显存优化技术 2.3 推理优化与通信机制 三、DeepSpeed 的优势与特性总结 四、 典型应用场景 &#x1f9e0; 大模型训练…

从视觉到现实:掌握计算机视觉技术学习路线的十大步骤

成长路上不孤单&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;【14后&#x1f60a;///计算机爱好者&#x1f60a;///持续分享所学&#x1f60a;///如有需要欢迎收藏转发///&#x1f60a;】今日分享关于计算机视觉技术学习路线方面的相关内容…

DeepSeek MoE 技术解析:模型架构、通信优化与负载均衡

1. MoE 简介 MoE&#xff08;Mixed Expert Models&#xff09;&#xff0c;混合专家模型。在 Transformer 的 FFN 中&#xff0c;有一个重要的观察是&#xff0c;其计算过程中的神经元激活是非常稀疏的&#xff0c;在一次计算中只有 90%的输入激活不到 5%的神经元&#xff0c;…

【Linux】pthread学习笔记

1. 线程基础(1) 线程创建与终止#include <pthread.h> // 创建线程 int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void*), void *arg); // 终止当前线程 void pthread_exit(void *retval); // 等待线程结束 int pthread_joi…

p5.js 从零开始创建 3D 模型,createModel入门指南

点赞 关注 收藏 学会了 如果你已经开始探索 p5.js 的 3D 世界&#xff0c;那么createModel()这个 API 绝对是你需要掌握的强大工具。它允许你创建自定义的 3D 几何模型&#xff0c;为你的创意提供无限可能。 什么是 createModel ()&#xff1f; createModel() 用于从一个…

react 的 useTransition 、useDeferredValue

useTransition 用于 管理状态更新的过渡&#xff08;pending&#xff09;状态&#xff0c;避免因高优先级任务&#xff08;如用户输入&#xff09;被低优先级任务&#xff08;如数据获取或复杂计算&#xff09;阻塞而导致的界面卡顿。 它特别适用于&#xff0c;需要 区分紧急更…

Unity的GameObject.Instantiate的使用

在Unity游戏引擎中&#xff0c;GameObject.Instantiate 是一个核心方法&#xff0c;用于在运行时动态创建游戏对象的副本。它常用于实例化预制体&#xff08;Prefab&#xff09;&#xff0c;例如生成敌人、子弹或场景元素。以下是其使用方法的详细说明&#xff0c;包括语法、参…

【CSS】盒子类型

CSS盒子模型是网页布局的核心基础&#xff0c;每个HTML元素都被视为一个矩形盒子&#xff0c;由​​内容&#xff08;Content&#xff09;、内边距&#xff08;Padding&#xff09;、边框&#xff08;Border&#xff09;、外边距&#xff08;Margin&#xff09;​​四部分组成。…

《嵌入式C语言笔记(十五):字符串操作与多维指针深度解析》

1.字符串与指针安全操作核心函数与陷阱函数功能安全替代功能strcpy字符串拷贝strncpy复制前n个&#xff0c;最多strlen个&#xff0c;超出有效长度&#xff0c;按原样复制strcat字符串拼接strncatdest只连接src的前n个&#xff0c;如果n超过有效长度&#xff0c;按原样链接strc…

每日学习笔记记录(分享更新版-凌乱)

函数和变量都需要满足&#xff1a;先声明后使用&#xff08;重要&#xff09;在 函数的声明中&#xff0c;形参的名字可以省略函数的定义是一种特殊的是声明&#xff0c;比声明更加强大&#xff1b;函数使用前必须进行声明&#xff0c;但不必要声明具体定义.h——函数的声明.c—…