Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

Elasticsearch 和 analysis-ik 的安装使用

Elasticsearch 和 analysis-ik 的安装使用

2018-08-31 Comments 0 Comment

安装配置 Elasticsearch

任务时间:5min ~ 10min

安装JDK

elasticsearch 需要 java8 以上;
这里安装最新版的 java10 ;
下载 jdk

wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http:%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/10.0.2+13/19aef61b38124481863b1413dce1855f/jdk-10.0.2_linux-x64_bin.rpm"

因为版本会一直升级;
如果执行上面这段代码返回了 ERROR 404: Not Found ;
那说明有新版本了;
那就自己去官网复制最新的下载链接;
http://www.oracle.com/technetwork/java/javase/downloads/jdk10-downloads-4416644.html ;

image

选中 Accept License Agreement 然后在 jdk-10.0.2_linux-x64_bin.rpm 上右键复制链接地址;
替换上面命令中的下载链接;

因为从国外下载比较慢;
为了方便实验;
我这里把 10.0.2 版本的先下载下来上传到腾讯云了;
可以用下面的链接代替;

wget https://study-1251254015.cos.ap-beijing.myqcloud.com/jdk-10.0.2_linux-x64_bin.rpm

安装 jdk 注意文件名要跟链接中的保持一致;

sudo rpm -ivh jdk-10.0.2_linux-x64_bin.rpm

能查看到版本号则表示安装成功;

java -version

安装 Elasticsearch

下载 elasticsearch ;

官网的下载链接是: https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.4.rpm 因为从国外下载比较慢;
为了方便实验我给先下载下来上传到腾讯云了;
可以使用下面的命令代替官网链接;

wget https://study-1251254015.cos.ap-beijing.myqcloud.com/elasticsearch-6.2.4.rpm

安装 elasticsearch ;

sudo rpm -ivh elasticsearch-6.2.4.rpm

安装完成后编辑配置项;

vim /etc/elasticsearch/elasticsearch.yml

去掉下面三行的注释;

bootstrap.memory_lock: true
network.host: 192.168.0.1
http.port: 9200

然后把 network.host 改成 localhost

image

启动 elasticsearch ;

sudo systemctl daemon-reload
sudo systemctl enable elasticsearch.service
sudo systemctl start elasticsearch

稍等片刻给 elasticsearch 个启动的时间;
因为 elasticsearch 启动的略慢;
后续涉及到重启 elasticsearch 的时候也都记得稍等片刻;
然后查看 9200 端口检查是否成功启动;

netstat -plntu

image

如果半天过后仍然没有启动起来;
可能是内存不够出错;

vim /etc/elasticsearch/jvm.options

把内存改为自己服务器内存的一半以下;
比如说这里改为 512M ;

image

尝试启动;

sudo systemctl restart elasticsearch

然后查看 9200 端口检查是否成功启动;

netstat -plntu

查看状态是否正常;

curl 'localhost:9200'

image

至此 elasticsearch 算是安装完成了;

安装配置中文分词

任务时间:时间未知

安装 ik-analyzer

但是如果想用来搜索中文;
还需要安装中文分词;
怎么算分词呢?
全文搜索和中文分词 文章中已经简单介绍过了;
这里我们从 elasticsearch 实战一遍;
比如说 白俊遥技术博客 这句话;
elasticsearch 内置的分词器对中文相当不友好;
只会一个只一个字的分;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"text":"白俊遥技术博客"}'

image

所以我们需要一个中文分词器;
这里选择和 elasticsearch 配套的 ik-analyzer ;
安装 ik-analyzer ;

/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip

如果报下面这种错误的话可能是网络不好;

Exception in thread "main" java.net.ConnectException: Connection timed out (Connection timed out)
at java.base/jdk.internal.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)

沐浴更衣大念帅白最帅;
再试几次即可;
实在不行;
那还是用我下载好的链接吧;

/usr/share/elasticsearch/bin/elasticsearch-plugin install https://study-1251254015.cos.ap-beijing.myqcloud.com/elasticsearch-analysis-ik-6.2.4.zip

然后重新启动下服务;

sudo systemctl restart elasticsearch

然后查看 9200 端口检查是否成功启动;

netstat -plntu

看下 ik-analyzer 的效果;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遥技术博客"}'

image我们可以看到 技术 和 博客 两个词语已经成功组合到了一起;
然而本博主 白俊遥 的名字被硬生生的拆成了3个字这怎么忍;
还好强大的 analysis-ik 支持自定义词库;
增加自定义词库;

vim /etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml

在 ext_dict 中自定义一个词库文件 baijunyao.dic ;

image 增加一个 白俊遥 到词库;

echo '白俊遥' > /etc/elasticsearch/analysis-ik/baijunyao.dic

重新启动下服务;

sudo systemctl restart elasticsearch

然后查看 9200 端口检查是否成功启动;

netstat -plntu

再看下分词效果 ;

curl -H 'Content-Type: application/json'  -XGET 'localhost:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"白俊遥技术博客"}'

image

完工;

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可分享至 Skype(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


Linux資訊

Post navigation

PREVIOUS
VPS性能测试:CPU内存,硬盘IO读写,带宽速度,UnixBench和压力测试
NEXT
Install Elasticsearch with RPM

發表迴響 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
ESET NOD32
WINDOWS 10 &11 INSIDER PREVIEW
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
金融資訊
WhatsApp Stickers教學
WordPress資訊
WeChat資訊
PHP資訊
Plesk資訊
TensorFlow
教學資源
開源程序
網頁工具
SEO工具
醫療健康
旅遊及消閒
其他資訊
Content from
Content to
2018 年 8 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 7 月   9 月 »

分類

  • 網站公告
  • 限時免費
  • ESET NOD32
  • WINDOWS 10 &11 INSIDER PREVIEW
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WhatsApp Stickers教學
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • Plesk資訊
  • TensorFlow
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 旅遊及消閒
  • 其他資訊

彙整

近期文章

  • 體驗了微軟的ChatGPT後我覺得谷歌、百度麻煩了 2023-02-09
  • 新版必應比ChatGPT牛?實測:更有人情味兒 2023-02-09
  • 蘋果任命首位首席人力官管理16萬員工大軍 2023-02-09
  • 迪士尼宣布裁員7000人股價盤後大漲 2023-02-09
  • SpaceX明天將嘗試進行創紀錄的火箭測試33個引擎一齊點火 2023-02-09
  • 任天堂:當前沒計劃對硬件和軟件降價 2023-02-09
  • 可用陽光激活的”絲瓜水凝膠”在淨化水方面表現出色 2023-02-09
  • NASA成功完成RS-25火箭發動機的全長熱火測試 2023-02-09
  • 一種新的鋰-空氣電池設計有望實現前所未有的能量密度 2023-02-09
  • 現在Twitter Blue用戶可以寫4000字的推文 2023-02-09

熱門文章與頁面︰

  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • ESET NOD32 LICENSE KEY (UPDATED 2023-01-17)
  • Explorer Patcher:讓Windows 11恢復Windows 10的行為特徵
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • 舊機福音:極限精簡Windows 10系統Tiny10升級C盤僅佔4.3GB
  • Autodesk AutoCAD 2021 正式版註冊版-簡體/繁體中文/英文版
  • 移動版RTX 3050與3050 Ti跑分曝光較RTX 1650 Ti提升顯著
  • Google Chrome瀏覽器意外出現Status_Access_Violation錯誤而崩潰
  • 微軟強化Game Bar:可顯示Xbox手柄剩餘電量
  • Office 2013-2021 C2R Install v7.3.1 正式版-Office 2013/2016/2019/2021自定義組件安裝工具

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.
X