2024-03-13
原文作者:吴声子夜歌 原文地址: https://blog.csdn.net/cold___play/article/details/104803398

映射类型

每个索引拥有一个或多个映射类型,用来在索引中将文档分为不同的逻辑组。

每个映射类型拥有:

  • 元字段:用来定义如何处理文档的元数据。元字段包括文档的_index字段、_type字段、_id字段和_source字段。
  • 字段或属性:每个映射类型包含与类型相关的字段或属性列表。同一索引中不同映射类型的相同名称字段必须拥有相同的映射。

字段数据类型

每个字段拥有一个数据类型,可以是简单数据类型,比如字符串(String)、日期型(date)、长整型(long)、双精度浮点型(double)、布尔型(boolean)或者IP。

支持JSON的层次性类型,比如对象(object)、嵌套(nested),或者指定的类型,比如地理点(geo_point)、地理形状(geo_shape)。

基于不同目的对同一个字段进行不同方式的索引是很有用的。例如,一个字符串类型字段可以在全文搜索中作为分析字段,在排序或聚合时作为不分析的字段。或者,可以通过标准分析器、英文分析器或者语法分析器对字符串字段进行索引。

一个数据类型通过fields参数支持多字段。

动态映射

字段和映射类型在使用前不需要事先定义。依靠动态映射,通过索引文档,新的映射类型和字段名会自动添加。新的字段可以添加到顶级映射类型或者映射内部的对象和嵌入字段。

动态映射可以配置自定义映射用于新类型或者新字段。

显示映射

相对于Elasticsearch来说,我们对于数据类型的掌控更加全面,所以我们可以指定显式映射而不是使用动态映射。

当创建索引的时候,可以创建映射类型和字段。也可以在当前的索引中通过映射创建接口添加映射类型和字段。

更新当前映射

除了记录之外,现有的映射类型和字段不能更新。修改映射意味着废弃已经索引的文档,我们反而应该根据映射创建新的索引并且重新索引数据。

映射类型之间共享字段

映射类型在每个索引中是唯一的,就是在一个索引的多个类型中,如果多个类型中的映射名称一样,则它必须是相同的类型。

例如:一个title字段同时存在与user和blogpost映射类型中,title字段在每个类型中必须拥有相同的映射。

这个规则的唯一例外是:对于copy_to参数、dynamic参数、enabled参数、ignore_above参数,include_in_all参数,每个不同映射类型中的字段拥有不同的参数设置。

通常,相同名称的字段由相同类型的数据构成,所以拥有相同的索引是没有问题的。当产生类型冲突的时候,可以选择更详细的命名,比如user_title和blog_title。

映射示例

在创建索引的时候,可以指定映射:

    PUT /myindex
    {
      "mappings": {
        "user":{
          "_all": {"enabled": false},
          "properties":{
            "title":{"type":"text"},
            "name":{"type":"text"},
            "age":{"type":"integer"}
          }
        },
        "blogpost":{
          "properties": {
            "title":{"type":"text"},
            "body":{"type":"text"},
            "user_id":{"type":"text","index": false},
            "created":{
              "type": "date",
              "format": "strict_date_optional_time||epoch_millis"
            }
          }
        }
        
      }
    }

创建一个名为myindex的索引,在索引中添加名为user和blogpost的映射类型。user类型取消元字段_all,指定了每个映射类型的字段或属性,指定了每个字段的数据类型和映射。

阅读全文