全文索引可提升mysql文本搜索效率,支持InnoDB和MyISAM引擎,需用MATCH()…AGaiNST()语法查询,建表时或后期添加均可,推荐使用ngram解析器处理中文,注意最小词长和停用词影响。

在MySQL中使用全文索引(FULLTEXT)可以显著提升对文本字段的搜索效率,尤其是在处理大量文本数据时。全文索引适用于MyISAM和InnoDB存储引擎(从MySQL 5.6开始InnoDB支持FULLTEXT),主要用于VARchar、CHAR和TEXT类型的列。
创建全文索引
可以在建表时或已有表上添加全文索引。
1. 建表时创建:
CREATE table articles (
id int AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT(title, content)
) ENGINE=InnoDB;
2. 在已有表上添加:
ALTER TABLE articles ADD FULLTEXT(title, content);
也可以只为单个字段创建:
CREATE FULLTEXT INDEX idx_content ON articles(content);
使用MATCH()…AGAINST()进行查询
全文索引不能用LIKE或普通WHERE条件发挥优势,必须使用MATCH()...AGAINST()语法。
自然语言模式(默认):
select * FROM articles
WHERE MATCH(title, content) AGAINST(‘数据库优化’ IN NATURAL LANGUAGE MODE);
布尔模式(支持操作符):
SELECT * FROM articles
WHERE MATCH(title, content) AGAINST(‘+数据库 -性能’ IN Boolean MODE);
-
+:必须包含该词 -
-:必须排除该词 -
"...":匹配完整短语,如"MySQL教程" - 无符号:可选词
查询相关性得分:
SELECT id, title, MATCH(title, content) AGAINST(‘索引’) AS score
FROM articles
WHERE MATCH(title, content) AGAINST(‘索引’);
注意事项与限制
使用全文索引时需注意以下几点:
- 中文支持有限:MySQL默认按空格或标点分词,对中文不友好。建议使用
ngram解析器(MySQL 5.7+)来支持中文分词。 - 启用ngram分词需在配置文件设置:
ngram_token_size=2,建表时指定:
CREATE TABLE articles_cn (
id INT PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT(title, content) WITH PARSER ngram
) ENGINE=InnoDB;
- 最小搜索词长度由
ft_min_word_len(MyISAM)或innodb_ft_min_token_size(InnoDB)控制,默认为3,短词如“AI”可能被忽略。 - 停用词列表会影响结果,常见词如“的”、“是”可能被过滤。
- 全文索引只用于文本搜索,不适合精确匹配或范围查询。
基本上就这些。合理使用全文索引能大幅提升文本检索性能,但要注意语言、分词和索引维护的问题。