Es学习系列之一: 常见的查询场景总结

陈世映

前言

Elasticsearch(简称ES)是一个基于Apache Lucene(TM)的开源搜索引擎,无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。
1.模糊查询

在平常的查询中经常有用到模糊查询的情况,而且模糊查询在Es中提供了多种实现的方式: wildcardQuery 通配符查询 中文只能支持关键字查询
prefixQuery 前匹配查询 中文只能支持关键字查询
regexpQuery 正则表达式查询 中文只能支持关键字查询
fuzzyQuery 模糊查询 不支持数字的模糊,中文只能支持单字模糊
2.中文查询

在Es中由于中文的分词方式的影响,上述常见的几种模糊查询的方式都不能完美的支持中文模糊查询的情况。 matchPhrasePrefixQuery,matchPhraseQuery则能满足大部分情况下的中文模糊匹配,代码如下
BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
boolQuery.should(QueryBuilders.matchPhrasePrefixQuery("name", key));

3.范围查询

RangeQuery:
3.1 如果是String则是关键字范围查询,number/date类型则是大小的范围查询

3.2 nuber的比较 es的number类型的比较比较简单,只要用如下几个方法进行比较即可
lte :<= lt : <
gte : >=
gt : >

代码如下 boolQuery.must(QueryBuilders.rangeQuery("num").gte(1).lte(10);

3.3 date 日期

3.3.1 日期算法 y:年 M:月 w:周 d:天 h:时 m:分 s:秒 /d 四舍五入取最近一天
GET _search
{ "query": { "range" : { "date" : { "gte" : "now-1d/d", "lt" : "now/d" } } } }

3.3.2 时间格式查询
GET search
{ "query": { "range" : { "born" : { "gte": "01/01/2012", "lte": "2013", "format": "dd/MM/yyyy||yyyy" } } } } boolQuery.must(QueryBuilders.rangeQuery("ins
tm").gte(DateUtil.toLocaleString(DateUtil.add(DateUtil.getCurrentTimeIgnoreMills(), Calendar.DAYOFMONTH, -3),DateUtil.YYYYMMDDHHDDSS))
.lte(DateUtil.getNowTime()).format(DateUtil.YYYY
MMDDHHDDSS));

3.3.3 时区查询

GET search
{ "query": { "range" : { "timestamp" : { "gte": "2015-01-01 00:00:00", "lte": "now", "time
zone": "+01:00" } } } } boolQuery.must(QueryBuilders.rangeQuery("instm").gte(DateUtil.toLocaleString(DateUtil.add(DateUtil.getCurrentTimeIgnoreMills(), Calendar.DAYOFMONTH, -3),DateUtil.YYYYMMDDHHDDSS))
.lte(DateUtil.getNowTime()).timeZone(DateUtil.+01:00 ));

4.null查询,空字符查询
1.因为Es是根据索引的方式去查询数据,但是空字符串没有索引,所以空字符串只有在String类型数据未解析(notanalyzed)的情况下能被全文检索。
2.null的检索可以用existsQuery判断字段是否有值
查询为null的字段时配合must
not使用,判断所以不存在值的字段,代码如下: boolQuery.mustNot(QueryBuilders.existsQuery("name"));
而查询不为空的情况则用must,判断值存在的数据,代码如下: boolQuery.must(QueryBuilders.existsQuery("name"));

5.聚合查询

在mysql中经常会有很多and,or等条件的聚合查询,在ES中must代表and,should代表or。 5.1 如果需要表示A=1 and B =2 可以用
"bool" : { "must" : [ { "match" : { "A" : { "query" : 1, } } } ,

                {
                  "B" : {
                    "city_id" : {
                      "query" : 1,
                    }
                  }
                }
              ],
 java代码如下

BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
boolQuery.must(QueryBuilders.matchPhrasePrefixQuery("A", 1)); boolQuery.must(QueryBuilders.prefixQuery("A", 2));

5.2 如果需要A=1 or A=2 可以用
"bool" : { "should" : [ { "match" : { "A" : { "query" : 1, } } } ,

                {
                  "A" : {
                    "city_id" : {
                      "query" : 1,
                    }
                  }
                }
              ],

BoolQueryBuilder boolQuery = QueryBuilders.boolQuery(); boolQuery.should(QueryBuilders.matchPhrasePrefixQuery("A", 1)); boolQuery.should(QueryBuilders.prefixQuery("A", 2)); 5.3 如果需要 实现(A=1 or A=2) and C=1
"must" : [ { "bool" : { "should" : [ { "bool" : { "must" : [ { "match" : { "A" : { "query" : 1, } } } ], "disablecoord" : false, "adjustpure_negative" : true, "boost" : 1.0 } }, {

                {
                  "match" : {
                    "A" : {
                      "query" : 2,

                    }
                  }
          }
        ],
        "disable_coord" : false,
        "adjust_pure_negative" : true,
        "boost" : 1.0
      }
    },
    {
      "match" : {
        "C" : {
          "value" : 1,
          "boost" : 1.0
        }
      }
    }
  ],
  "disable_coord" : false,
  "adjust_pure_negative" : true,
  "boost" : 1.0
}

},

java 代码
BoolQueryBuilder boolQuery = QueryBuilders.boolQuery(); BoolQueryBuilder cityQuery = QueryBuilders.boolQuery(); cityQuery.should(QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("A", 1)));
cityQuery.should(QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("A", 2)));
boolQuery.must(cityQuery);
boolQuery.must(QueryBuilders.matchQuery("C", 1) );