1 | PUT /my_index/my_type/1 |
用户输入词组 Brown fox
然后点击搜索按钮。事先,我们并不知道用户的搜索项是会在 title 还是在 body 字段中被找到,但是,用户很有可能是想搜索相关的词组。用肉眼判断,文档 2 的匹配度更高,因为它同时包括要查找的两个词:
现在运行以下 bool 查询:
1 | { |
但是我们发现查询的结果是文档 1 的评分更高:

为了理解导致这样的原因,需要回想一下 bool 是如何计算评分的:
它会执行 should 语句中的两个查询。
文档 1 的两个字段都包含 brown
这个词,所以两个 match
语句都能成功匹配并且有一个评分。文档 2 的 body 字段同时包含 brown
和 fox
这两个词,但 title 字段没有包含任何词。这样, body 查询结果中的高分,加上 title 查询中的 0 分,然后乘以二分之一,就得到比文档 1 更低的整体评分。
在本例中, title 和 body 字段是相互竞争的关系,所以就需要找到单个 最佳匹配 的字段。
如果不是简单将每个字段的评分结果加在一起,而是将 最佳匹配
字段的评分作为查询的整体评分,结果会怎样?这样返回的结果可能是: 同时 包含 brown
和 fox
dis_max 查询
不使用 bool
查询,可以使用 dis_max
即分离 最大化查询 (Disjunction Max Query)
。分离(Disjunction)的意思是 或(or) ,这与可以把结合(conjunction)理解成 与(and) 相对应。分离最大化查询(Disjunction Max Query)指的是: 将任何与任一查询匹配的文档作为结果返回,但只将最佳匹配的评分作为查询的评分结果返回 :
1 | { |
Top-level parameters for dis_maxedit
(Required, array of query objects) Contains one or more query clauses. Returned documents must match one or more of these queries. If a document matches multiple queries, Elasticsearch uses the highest relevance score.tie_breaker
(Optional, float) Floating point number between 0 and 1.0 used to increase the relevance scores of documents matching multiple query clauses. Defaults to 0.0.
You can use the tie_breaker value to assign higher relevance scores to documents that contain the same term in multiple fields than documents that contain this term in only the best of those multiple fields, without confusing this with the better case of two different terms in the multiple fields.
If a document matches multiple clauses, the dis_max query calculates the relevance score for the document as follows:
Take the relevance score from a matching clause with the highest score.
Multiply the score from any other matching clauses by the tie_breaker value.
Add the highest score to the multiplied scores.
If the tie_breaker value is greater than 0.0, all matching clauses count, but the clause with the highest score counts most.
使用 tie_breaker
将其他query的分数也考虑进去, tie_breaker