MySQL 全文搜索:优化相关性和列优先级
在多个表列中执行全文搜索时,通常需要对相关性结果。 MySQL 的 MATCH() AGAINST() 函数提供了一种有效的方法来实现此目的。
但是,有时会出现对特定列中的相关性进行优先级排序至关重要的情况。举例来说,我们有一个包含带有标题列和正文列的页面的表,我们希望为标题列中找到的匹配项提供更高的优先级。
解决方案:合并特定于列的相关性
为了满足此要求,我们可以利用附加的 MATCH() 子句来单独计算头列的相关性。通过将其与整体相关性相结合,我们可以对符合整体搜索条件和指定列的结果进行优先级排序。
SELECT pages.*, MATCH(head, body) AGAINST('some words') AS relevance, MATCH(head) AGAINST('some words') AS head_relevance FROM pages WHERE MATCH(head, body) AGAINST('some words') ORDER BY head_relevance DESC, relevance DESC
在此查询中,我们计算整体相关性(相关性)和标题列 -具体相关性(head_relevance)。通过首先按 head_relevance 降序 (DESC) 对结果进行排序,然后再按相关性降序排列,我们可以有效地对 head 列中找到的匹配项进行优先级排序。
奖励:计算搜索词的出现次数
虽然上述方法增强了列优先级,但它没有提供搜索词出现次数的计数在指定的列内。为了实现这一点,我们可以使用 FULLTEXT() 和 LENGTH() 函数:
... SELECT pages.*, MATCH(head, body) AGAINST('some words') AS relevance, MATCH(head) AGAINST('some words') AS head_relevance, LENGTH(head) - LENGTH(REPLACE(head, 'some words', '')) AS head_count, LENGTH(body) - LENGTH(REPLACE(body, 'some words', '')) AS body_count FROM pages ...
这扩展了前面的查询来计算头部 (head_count) 和正文 (body_count) 中搜索词出现的计数
其他选项:Postgres 和加权
如果适合您的项目,Postgres 提供高级功能,可以更好地控制相关性排名。其搜索功能支持对特定术语或运算符进行加权,从而可以更好地定制搜索结果。
以上是如何确定 MySQL 全文搜索中多列相关性的优先级?的详细内容。更多信息请关注PHP中文网其他相关文章!