ElasticSearch的Mapping之字段类型-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

ElasticSearch的Mapping之字段类型

阅读量：6897 次

发布时间：2019-06-27

本文共 2552 字，大约阅读时间需要 8 分钟。

ElasticSearch的Mapping之字段类型博客分类：搜索引擎，爬虫

es支持大多数java里面的数据类型：

（一）核心数据类型：

（1）string：默认会被分词，一个完整示例如下

Java代码

收藏代码

"status": {

"type": "string", //字符串类型

"index": "analyzed"//分词，不分词是：not_analyzed ，设置成no，字段将不会被索引

"analyzer":"ik"//指定分词器

"boost":1.23//字段级别的分数加权

"doc_values":false//对not_analyzed字段，默认都是开启，分词字段不能使用，对排序和聚合能提升较大性能，节约内存

"fielddata":{
"format":"disabled"}//针对分词字段，参与排序或聚合时能提高性能，不分词字段统一建议使用doc_value

"fields":{
"raw":{
"type":"string","index":"not_analyzed"}} //可以对一个字段提供多种索引模式，同一个字段的值，一个分词，一个不分词

"ignore_above":100 //超过100个字符的文本，将会被忽略，不被索引

"include_in_all":ture//设置是否此字段包含在_all字段中，默认是true，除非index设置成no选项

"index_options":"docs"//4个可选参数docs（索引文档号） ,freqs（文档号+词频），positions（文档号+词频+位置，通常用来距离查询），offsets（文档号+词频+位置+偏移量，通常被使用在高亮字段）分词字段默认是position，其他的默认是docs

"norms":{
"enable":true,"loading":"lazy"}//分词字段默认配置，不分词字段：默认{"enable":false}，存储长度因子和索引时boost，建议对需要参与评分字段使用，会额外增加内存消耗量

"null_value":"NULL"//设置一些缺失字段的初始化值，只有string可以使用，分词字段的null值也会被分词

"position_increament_gap":0//影响距离查询或近似查询，可以设置在多值字段的数据上火分词字段上，查询时可指定slop间隔，默认值是100

"store":false//是否单独设置此字段的是否存储而从_source字段中分离，默认是false，只能搜索，不能获取值

"search_analyzer":"ik"//设置搜索时的分词器，默认跟ananlyzer是一致的，比如index时用standard+ngram，搜索时用standard用来完成自动提示功能

"similarity":"BM25"//默认是TF/IDF算法，指定一个字段评分策略，仅仅对字符串型和分词类型有效

"term_vector":"no"//默认不存储向量信息，支持参数yes（term存储），with_positions（term+位置）,with_offsets（term+偏移量），with_positions_offsets(term+位置+偏移量) 对快速高亮fast vector highlighter能提升性能，但开启又会加大索引体积，不适合大数据量用

}

（2）数字类型主要如下几种：

long：64位存储

integer：32位存储

short：16位存储

byte：8位存储

double：64位双精度存储

float：32位单精度存储

支持参数：

Java代码

收藏代码

coerce：true/false 如果数据不是干净的，将自动会将字符串转成合适的数字类型，字符串会被强转成数字，浮点型会被转成整形，经纬度会被转换为标准类型

boost：索引时加权因子

doc_value：是否开启doc_value

ignore_malformed：false（错误的数字类型会报异常）true（将会忽略）

include_in_all：是否包含在_all字段中

index:not_analyzed默认不分词

null_value：默认替代的数字值

precision_step：16 额外存储对应的term，用来加快数值类型在执行范围查询时的性能，索引体积相对变大

store：是否存储具体的值

（3）复合类型

数组类型：没有明显的字段类型设置，任何一个字段的值，都可以被添加0个到多个，要求，他们的类型必须一致：

对象类型：存储类似json具有层级的数据

嵌套类型：支持数组类型的对象Aarray[Object]，可层层嵌套

（4）地理类型

geo-point类型：支持经纬度存储和距离范围检索

geo-shape类型：支持任意图形范围的检索，例如矩形和平面多边形

（5）专用类型

ipv4类型：用来存储IP地址，es内部会转换成long存储

completion类型：使用fst有限状态机来提供suggest前缀查询功能

token_count类型：提供token级别的计数功能

mapper-murmur3类型：安装sudo bin/plugin install mapper-size插件，可支持_size统计_source数据的大小

附件类型：需要开源es插件支持，可存储office，html等类型

（6）多值字段：

一个字段的值，可以通过多种分词器存储，使用fields参数，支持大多数es数据类型

（二）Mapping 参数列表，上面文章出现过的不再解释：

序号	名称	解释
1	copy_to	与solr里面的copy_field字段功能一样，支持拷贝某个字段的值到集中的一个字段里面
2	properties	mapping type，对象字段和嵌套字段可以包含子字段，这些属性可以被添加进去，例子如下

官网文档：

http://qindongliang.iteye.com/blog/2259541

转载于:https://my.oschina.net/xiaominmin/blog/1597126

你可能感兴趣的文章

深入解析ES6中let和闭包

前端图像处理指南

【大数据学习日记】Spark之shuffle调优

React-Router V4 简单实现

如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes

转行IT行业，月薪过万需要多久？

短视频APP开发应该注意些什么

springmvc dubbo整合cms内容发布平台

让字符码跟着迈克杰克逊一起舞蹈，致敬天王经典舞蹈

java B2B2C 仿淘宝电子商城系统-服务网关zuul初级篇

Vue响应式原理-理解Observer、Dep、Watcher

几个简单又实用的配色技巧

最新Python学习教程_Python学习视频_Python学习路线：手把手教你用Python做数据分析...

强大的代码保护软件 .NET Reactor使用教程（三）：.Net Reactor应用场景

人工智能创业项目，创业服务资源渠道

iOS使用SQLCipher加密数据库

喜讯不断，BCH又迎来两个代币发行方案

java B2B2C 源码多租户电子商城系统-Spring Cloud整合Netflix Archaius介绍

阿里云DMS发布数据库网关服务: 打通网络限制开启数据库统一管理的万能钥匙...

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-02 20:50:18 当前IP: 3.143.4.14 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我