千家信息网

好程序员大数据学习路线分享ELK技术

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,好程序员大数据学习路线分享ELK技术,bin存放elasticSearch 运行命令config 存放配置文件lib 存放elasticSearch运行依赖jar包modules 存放elasticS
千家信息网最后更新 2025年01月23日好程序员大数据学习路线分享ELK技术

好程序员大数据学习路线分享ELK技术,bin存放elasticSearch 运行命令

config 存放配置文件

lib 存放elasticSearch运行依赖jar

modules 存放elasticSearch 模块

plugins 存放插件

1.1 ElasticsearchMysql对比

Elasticsearch 集群可以包含多个索引(Index),每个索引可以包含多个类型(Type),每个类型可以包含多个文档(Document),每个文档可以包含多个字段(Field)。以下是 MySQL 和 Elasticsearch 的术语类比图,帮助理解:


就像使用 MySQL 必须指定 Database 一样,要使用 Elasticsearch 首先需要创建 Index:

client.indices.create({index : 'blog'});

这样就创建了一个名为 blog的 Index。Type 不用单独创建,在创建 Mapping 时指定就可以。Mapping 用来定义 Document 中每个字段的类型,即所使用的 analyzer、是否索引等属性,非常关键等。

索引对象(blob): 存储数据的表结构 ,任何搜索数据,存放在索引对象上 。

映射(mapping): 数据如何存放到索引对象上,需要有一个映射配置, 包括:数据类型、是否存储、是否分词 … 等。

文档(document): 一条数据记录, 存在索引对象上

文档类型(type): 一个索引对象 存放多种类型数据,数据用文档类型进行标识

【后续编程】:

第一步:建立索引对象

第二步:建立映射

第三步:存储数据【文档】

第四步:指定文档类型进行搜索数据【文档】

1.1 创建一个索引

Elasticsearch 命令的一般格式是:REST VERBHOST:9200/index/doc-type- 其中 REST VERB 是 PUT、GET 或DELETE。(使用 curlL -X 动词前缀来明确指定 HTTP 方法。)

要创建一个索引,可在你的 shell 中运行以下命令:

curl -XPUT "http://localhost:9200/blog01/"

查看

1.1 插入一个文档

要在 /blog01 索引下创建一个类型,可插入一个文档。

要将包含 "Deck the Halls" 的文档插入索引中,可运行以下命令(将该命令和本教程的其他 CURL 命令都键入到一行中):

curl -XPUT "http://localhost:9200/blog01/article/1" -d "{"""id""": """1""", """title""": """Whatiselasticsearch"""}"


前面的命令使用 PUT 动词将一个文档添加到 /article文档类型,并为该文档分配 ID 为1。URL 路径显示为index/doctype/ID(索引/文档类型/ID)。

1.2 查看文档

要查看该文档,可使用简单的 GET 命令:

curl -XGET "http://localhost:9200/blog01/article/1"


Elasticsearch 使用你之前 PUT 进索引中的 JSON 内容作为响应:

1.3 更新文档

如果你认识到title字段写错了,并想将它更改为 Whatislucene 怎么办?可运行以下命令来更新文档:

curl -XPUT "http://localhost:9200/blog01/article/1" -d "{"""id""": """1""", """title""": """Whatislucene"""}"


因为此命令使用了相同的唯一 ID为1,所以该文档会被更新。

1.4 搜索文档

是时候运行一次基本查询了,此查询比你运行来查找 "Get the Halls" 文档的简单 GET 要复杂一些。文档 URL 有一个内置的 _search 端点用于此用途。在标题中找到所有包含单词 lucene 的数据:

curl -XGET "http://localhost:9200/blog01/article/_search?q=title:'Whatislucene'"


参数表示一个查询。

1.5 检查搜索返回对象

上图中给出了 Elasticsearch 从前面的查询返回的数据。

在结果中,Elasticsearch 提供了多个 JSON 对象。第一个对象包含请求的元数据:看看该请求花了多少毫秒 (took) 和它是否超时 (timed_out)_shards 字段需要考虑 Elasticsearch 是一个集群化服务的事实。甚至在这个单节点本地部署中,Elasticsearch 也在逻辑上被集群化为分片。在往后看可以观察到 hits 对象包含:

· total 字段,它会告诉你获得了多少个结果

· max_score,用于全文搜索

· 实际结果

实际结果包含 fields 属性,因为你将 fields 参数添加到了查询中。否则,结果中会包含 source,而且包含完整的匹配文档。_index_type _id 分别表示索引、文档类型、ID_score 指的是全文搜索命中长度。这 4 个字段始终会在结果中返回。

1.6 删除文档

暂时不要删除该文档,知道如何删除它就行了:

curl -XDELETE "http://localhost:9200/blog01/article/1"


1.7 删除索引

暂时不要删除该文档,知道如何删除它就行了:

curl -XDELETE "http://localhost:9200/blog01"


1.要使用 Elasticsearch 首先需要创建 Index:client.indices.create({index : 'blog'});创建了一个名为 blog的 Index

2.Type 不用单独创建,在创建 Mapping 时指定就可以。

3.Mapping 用来定义 Document 中每个字段的类型,即所使用的 analyzer、是否索引等属性,非常关键等

URL 路径显示为index/doctype/ID(索引/文档类型/ID)

创建文档(插入一条数据),自动创建索引和映射

======================================================

import org.elasticsearch.action.index.IndexResponse;

import org.elasticsearch.client.Client;

import org.elasticsearch.client.transport.TransportClient;

import org.elasticsearch.common.transport.InetSocketTransportAddress;

import org.elasticsearch.common.xcontent.XContentBuilder;

import org.elasticsearch.common.xcontent.XContentFactory;

import org.junit.Before;

import org.junit.Test;

import java.net.InetAddress;

import java.util.HashMap;

import java.util.Map;

public class ESTest {

//创建连接

private Client client;

/**

* 通过TransportClient获取ES连接

*/

@Before

public void getClient() throws Exception {

//ES服务的JavaAPI的port为9300

//注意:如果请求一个ES集群,可以考虑多添加几个节点,

//为了避免在一个节点出现网络问题导致的请求失败问题,可以自动切换另外一个节点

client = TransportClient.builder().build()

.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("localhost"), 9300));

}

@Test

/**

* 1.使用json来创建文档(插入一条数据),自动创建索引和映射

*/

public void creatDocument() {

//jason格式的数据创建文档(插入一条数据),自动创建索引和映射

String source = "{" +

"\"id\":\"1\"," +

"\"title\":\"woshishui\"," +

"\"content\":\"wozaina\"" +

"}";

//创建文档:定义索引名称,文档类型,主键唯一标识id

//execute().actionGet()==get() 代码马上执行

IndexResponse indexResponse =

client.prepareIndex("blog", "article", "1").setSource(source).get();

//获取响应信息

this.loadResponse(indexResponse);

client.close();

}

public void loadResponse(IndexResponse indexResponse){

System.out.println("索引名称" + indexResponse.getIndex());

System.out.println("文档类型" + indexResponse.getType());

System.out.println("ID" + indexResponse.getId());

System.out.println("版本" + indexResponse.getVersion());

System.out.println("是否创建成功" + indexResponse.isCreated());

}

/**

* 2.使用mao创建文档.自动创建索引和映射

*/

public void creatDocument2(){

//map类型的数据

Map source = new HashMap();

source.put("id","2");

source.put("title","我是谁");

source.put("content","我在哪");

//创建文档

IndexResponse indexResponse =

client.prepareIndex("blog","article","2")

.setSource(source).get();

this.loadResponse(indexResponse);

client.close();

}

/**

* 3.使用ES帮助类(执行类),创建文档

*/

@Test

public void creatDocument3() throws Exception{

XContentBuilder source = XContentFactory.jsonBuilder()

.startObject()

.field("id",3)

.field("title","whoami")

.field("content","whereami")

.endObject();

System.out.println(source.toString());

//创建文档

IndexResponse indexResponse = client.prepareIndex("blog", "article", "3").setSource(source).get();

this.loadResponse(indexResponse);

client.close();

}

}

======================================================================================

搜索文档数据

1.单个索引

2.多个索引


更新数据

方式一:


方式二:


方式三


删除数据


查询

queryStringQuery:


es默认的分词器并没有中文进行分词,需要我们按照一个比默认屌很多的分词器(Ik分词器)

创建映射



0