将 Go 字符串分割为 Unicode 字符切片

2025-10-27 0:35

|

3

|

后端开发

693 字

|

3 分钟

将 Go 字符串分割为 Unicode 字符切片

本文介绍了如何在 go 语言中将一个字符串分割成包含其所有 Unicode 字符的字符串切片。通过将字符串转换为 rune 切片，可以正确处理包含多字节字符（如中文）的字符串，确保每个 Unicode 字符都被正确分割。

在 Go 语言中，字符串是由字节组成的，而 Unicode 字符（rune）可能由一个或多个字节表示。因此，直接将字符串视为字节数组进行分割可能会导致错误，尤其是在处理包含非 ASCII 字符（如中文、日文等）的字符串时。为了正确地将字符串分割成 Unicode 字符切片，需要将字符串转换为 rune 切片。

使用 rune 切片分割字符串

rune 是 Go 语言中表示 Unicode 码点的类型。将字符串转换为 []rune 类型会生成一个包含字符串中所有 Unicode 字符的切片。然后，可以遍历这个切片来访问每个字符。

以下是一个示例代码：

快转字幕

新一代 ai 字幕工作站，为创作者提供字幕制作、学习资源、会议记录、字幕制作等场景，一键为您的视频生成精准的字幕。

357

查看详情

package main  import "fmt"  func main() {     s := "Hello, 世界"     fmt.Println("原始字符串:", s)      // 将字符串转换为 rune 切片     runes := []rune(s)      fmt.Println("Rune 切片:", runes)      // 遍历 rune 切片     for i, r := range runes {         fmt.printf("索引: %d, 字符: %cn", i, r)     }      // 将 rune 切片转换回字符串切片 (String array)     stringSlice := make([]string, len(runes))     for i, r := range runes {         stringSlice[i] = string(r)     }      fmt.Println("字符串切片:", stringSlice) }

代码解释：

s := “Hello, 世界”: 定义一个包含英文字符和中文字符的字符串。
runes := []rune(s): 将字符串 s 转换为 rune 切片。
for i, r := range runes: 遍历 rune 切片，i 是索引，r 是 rune 类型的字符。
fmt.Printf(“索引: %d, 字符: %cn”, i, r): 打印每个字符的索引和值。 %c 格式化动词用于打印 rune 对应的 Unicode 字符。
stringSlice := make([]string, len(runes)): 创建一个字符串切片，用于存储结果
for i, r := range runes { stringSlice[i] = string(r) }: 将 rune 切片转换为字符串切片，将每个 rune 转换为 string 类型。
fmt.Println(“字符串切片:”, stringSlice): 打印最终的字符串切片。

输出：

原始字符串: Hello, 世界 Rune 切片: [72 101 108 108 111 44 32 19990 30028] 索引: 0, 字符: H 索引: 1, 字符: e 索引: 2, 字符: l 索引: 3, 字符: l 索引: 4, 字符: o 索引: 5, 字符: , 索引: 6, 字符:   索引: 7, 字符: 世 索引: 8, 字符: 界 字符串切片: [H e l l o ,   世 界]

总结

通过将 Go 字符串转换为 rune 切片，可以正确地处理包含多字节字符的字符串分割问题。这种方法确保每个 Unicode 字符都被正确识别和处理，避免了因直接操作字节而导致的错误。在处理需要精确字符级别的字符串操作时，使用 rune 切片是一个推荐的做法。

ai ASCII for go len printf String 切片字符串字节

text=ZqhQzanResources