使用logstash同步mysql数据到elasticsearch实现
作者:大数据技术派 时间:2024-01-26 17:40:59
mysql建表test;
安装logstash(跟es版本一致)
# 下载
wget https://repo.huaweicloud.com/logstash/7.14.2/logstash-7.14.2-linux-x86_64.tar.gz
# 解压
tar -zxvf logstash-7.14.2-linux-x86_64.tar.gz
# 需要mysql-connector-java-5.1.40.jar,随便放到比如目录
# /var/lib/hadoop-hdfs/logstash-7.14.2/lib/mysql-connector-java-5.1.40.jar
新建es索引test
curl -u elastic:changeme -X PUT http://192.168.20.130:9200/test -H 'Content-Type: application/json' -d'
{
"settings" : {
"number_of_shards" : 1,
"number_of_replicas" : 1
},
"mappings" : {
"properties": {
"id": {
"type" : "long"
},
"type": {
"type": "keyword"
},
"keyword_1": {
"type": "text",
"analyzer" : "ik_smart"
},
"keyword_2": {
"type": "text",
"analyzer" : "ik_smart"
},
"keyword_3": {
"type": "text",
"analyzer" : "ik_smart"
},
"data": {
"type": "keyword"
},
"created_at": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd"
},
"updated_at": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd"
}
}
}
}'
编辑配置文件
vim ~/script/logstash/logstash_mysql2es.conf
input {
stdin{
}
jdbc{
# 连接的数据库地址和数据库,指定编码格式,禁用ssl协议,设定自动重连
# 此处10.112.103.2为MySQL所在IP地址,也是elastic search所在IP地址
jdbc_connection_string => "jdbc:mysql://192.168.13.28:3306/test?characterEncoding=UTF-8&useSSL=FALSE&autoReconnect=true"
#数据库用户名
jdbc_user => "root"
# 数据库用户名对应的密码
jdbc_password => "root"
# jar包存放位置
jdbc_driver_library => "/var/lib/hadoop-hdfs/logstash-7.14.2/lib/mysql-connector-java-5.1.40.jar"
jdbc_driver_class => "com.mysql.jdbc.Driver"
jdbc_default_timezone => "Asia/Shanghai"
jdbc_paging_enabled => "true"
jdbc_page_size => "320000"
lowercase_column_names => false
statement => "select id, type, tags, title from test"
}
}
filter {
# 移除无关的字段
mutate {
remove_field => ["@version", "@timestamp"]
}
}
output {
elasticsearch {
hosts => ["http://192.168.20.130:9200"]
user => "elastic"
password => "changeme"
index => "test"
document_type => "_doc"
# 将字段type和id作为文档id
document_id => "%{type}_%{id}"
}
stdout {
codec => json_lines
}
}
重要配置参数说明:
remove_field => ["@version", "@timestamp"]
: 默认logstash
会添加这两个字段,这里去掉;document_id => "%{type}_%{id}"
: 将两个字段拼接作为es的文档id;
启动任务
./logstash-7.14.2/bin/logstash -f script/logstash/logstash_mysql2es.conf
参考资料
Jdbc input plugin
Elasticsearch output plugin
通过logstash将mysql数据同步到elastic search
来源:https://juejin.cn/post/7176826365059006525
标签:logstash,mysql,数据同步,elasticsearch
0
投稿
猜你喜欢
python函数局部变量、全局变量、递归知识点总结
2023-08-03 14:49:41
pythotn条件分支与循环详解
2021-12-02 12:20:08
Bootstrap复选框和单选按钮美化插件(推荐)
2023-07-02 05:24:53
VS CODE 使用SVN插件的方法步骤
2023-05-22 10:39:33
python中的decorator的作用详解
2021-05-24 16:44:40
JavaScript+html实现前端页面随机二维码验证
2024-04-19 09:48:59
Pain 全世界最小最简单的PHP模板引擎 (普通版)
2023-11-18 09:12:06
Django Admin后台模型列表页面如何添加自定义操作按钮
2021-02-24 18:57:15
Go语言单例模式详解
2024-01-30 08:42:41
MybatisPlus BaseMapper 实现对数据库增删改查源码
2024-01-26 10:03:57
vue el-table中使用el-select选中后无效的解决
2024-04-26 17:37:54
python类和继承用法实例
2021-07-24 17:31:30
Python实现字符串逆序输出功能示例
2023-10-14 04:59:17
Python基于当前时间批量创建文件
2022-05-26 22:46:34
Ajax标签导航效果
2013-07-17 02:02:16
asp如何连接MYSQL数据库?
2010-01-01 15:49:00
vue使用微信JS-SDK实现分享功能
2023-07-02 16:59:46
SQL Server 性能调优之查询从20秒至2秒的处理方法
2024-01-24 14:01:56
浅谈Python 的枚举 Enum
2021-02-01 16:42:15
关于Pytorch的MNIST数据集的预处理详解
2021-09-16 21:09:47