先备份数据库,再逐步升级字符集和排序规则以支持更多字符。1. 查看当前字符集设置;2. 选择utf8mb4及合适排序规则;3. 修改数据库默认字符集;4. 转换表和列的字符集;5. 更新客户端连接配置;6. 验证数据存储与显示正常。

在mysql中升级字符集和排序规则,主要是为了支持更广泛的字符(比如中文、emoji等)或统一数据库的编码标准。操作需谨慎,避免数据乱码或损坏。以下是具体步骤和注意事项。
1. 检查当前字符集和排序规则
执行以下命令查看当前数据库、表和列的字符集设置:
SHOW VARIABLES LIKE ‘character_set%’;
SHOW VARIABLES LIKE ‘collation%’;
— 查看某个数据库
SHOW CREATE database db_name;
— 查看某张表
SHOW CREATE table table_name;
— 查看所有列的字符集
select TABLE_NAME, COLUMN_NAME, CHARACTER_SET_NAME, COLLATION_NAME
FROM information_schema.COLUMNS
WHERE TABLE_SCHEMA = ‘your_db’ AND DATA_TYPE IN (‘varchar’, ‘text’, ‘char’);
记录当前状态,便于对比和回滚。
2. 选择目标字符集和排序规则
推荐使用 utf8mb4 字符集,支持完整的UTF-8编码(包括四字节字符如 emoji),替代旧的 utf8(实际是 utf8mb3)。
常用搭配:
- 字符集:utf8mb4
- 排序规则:utf8mb4_unicode_ci(通用)或 utf8mb4_general_ci(更快但精度略低)
- 如需区分大小写,可用 utf8mb4_bin
3. 修改数据库级别设置
更改数据库默认字符集:
ALTER DATABASE db_name CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
4. 修改表和列的字符集
逐个修改表:
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
这条命令会转换表中所有支持字符集的列(如 VARCHAR、TEXT 等),并更新表的默认设置。
如果只想改特定列:
ALTER TABLE table_name MODIFY column_name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
5. 更新连接层配置
确保客户端连接也使用新字符集。修改 MySQL 配置文件(my.cnf 或 my.ini):
[client]
default-character-set = utf8mb4
[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
skip-character-set-client-handshake # 忽略客户端字符集协商
[mysql]
default-character-set = utf8mb4
重启 MySQL 服务使配置生效。
6. 验证与测试
重新运行开头的查询,确认字符集已更新。插入测试数据(如 emoji 或中文)验证是否正常存储和显示。
INSERT INTO test_table(content) VALUES (‘Hello 世界 ?’);
检查结果是否正确显示,无问号或乱码。
基本上就这些。关键点是先备份,逐步操作,注意连接层一致性,避免出现“存进去是乱码”或“读出来是问号”的问题。


