全文索引可提升 mysql 文本搜索效率,支持 InnoDB 和 MyISAM 引擎,需用 MATCH()…AGaiNST()语法查询,建表时或后期添加均可,推荐使用 ngram 解析器处理中文,注意最小词长和停用词影响。

在 MySQL 中使用全文索引(FULLTEXT)可以显著提升对文本字段的搜索效率,尤其是在处理大量文本数据时。全文索引适用于 MyISAM 和InnoDB存储引擎(从 MySQL 5.6 开始 InnoDB 支持 FULLTEXT),主要用于 VARchar、CHAR 和TEXT类型的列。
创建全文索引
可以在建表时或已有表上添加全文索引。
1. 建表时创建:
CREATE table articles (
id int AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT(title, content)
) ENGINE=InnoDB;
2. 在已有表上添加:
ALTER TABLE articles ADD FULLTEXT(title, content);
也可以只为单个字段创建:
CREATE FULLTEXT INDEX idx_content ON articles(content);
使用 MATCH()…AGAINST()进行查询
全文索引不能用 LIKE 或普通 WHERE 条件发挥优势,必须使用 MATCH()……AGAINST() 语法。
自然语言模式(默认):
select * FROM articles
WHERE MATCH(title, content) AGAINST(‘数据库 优化 ’ IN NATURAL LANGUAGE MODE);
布尔模式(支持操作符):
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST(‘+ 数据库 - 性能 ’ IN Boolean MODE);
-
+:必须包含该词 -
-:必须排除该词 -
"……":匹配完整短语,如"MySQL 教程 " - 无符号:可选词
查询相关性得分:
SELECT id, title, MATCH(title, content) AGAINST(‘ 索引 ’) AS score
FROM articles
WHERE MATCH(title, content) AGAINST(‘ 索引 ’);
注意事项与限制
使用全文索引时需注意以下几点:
- 中文支持有限:MySQL 默认按空格或标点分词,对中文不友好。建议使用
ngram解析器(MySQL 5.7+)来支持中文分词。 - 启用 ngram 分词需在 配置文件 设置:
ngram_token_size=2,建表时指定:
CREATE TABLE articles_cn (
id INT PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT(title, content) WITH PARSER ngram
) ENGINE=InnoDB;
- 最小搜索词长度由
ft_min_word_len(MyISAM)或innodb_ft_min_token_size(InnoDB)控制,默认为 3,短词如“AI”可能被忽略。 - 停用词列表会影响结果,常见词如“的”、“是”可能被过滤。
- 全文索引只用于文本搜索,不适合精确匹配或范围查询。
基本上就这些。合理使用全文索引能大幅提升文本检索性能,但要注意语言、分词和索引维护的问题。