Golang如何处理字符和字节 – 小浪学习网

Golang如何处理字符和字节

2025-10-21 23:27

|

2

|

956 字

|

4 分钟

go中字符串是只读字节序列，通常为UTF-8编码；通过[]byte(str)可得其字节表示，转换回String需确保合法UTF-8；rune为int32别名，代表Unicode码点，用于正确处理中文、emoji等字符；使用range遍历字符串时，range s按字节位置迭代，而_, r := range s则逐个获取rune；统计字符数应使用[]rune(s)；修改内容或网络传输宜用[]byte，如json.Marshal返回[]byte；避免频繁字符串拼接，推荐strings.Builder或bytes.Buffer；文件或网络数据默认为字节流，需显式解码为UTF-8字符串；关键在于区分字节与字符概念，依场景选用byte、rune或string类型。

Golang如何处理字符和字节

Go语言中字符和字节的处理涉及字符串、字节切片、rune类型以及UTF-8编码。理解它们之间的区别和转换方式，是正确处理文本数据的基础。

字符串与字节切片的关系

Go中的字符串本质上是只读的字节序列，通常存储UTF-8编码的文本。虽然字符串内容常被当作文本使用，但从底层看，它是一串byte值。

可以将字符串转换为[]byte来查看其字节表示：

str := “你好”
bytes := []byte(str) // 得到UTF-8编码的字节切片
中文“你”在UTF-8中占3个字节，“好”也占3个字节，所以len(bytes)为6

反向转换也很简单：string(bytes) 可将字节切片还原为字符串，前提是字节数据是合法的UTF-8编码。

立即学习“go语言免费学习笔记（深入）”；

rune：正确处理Unicode字符

一个rune是int32类型的别名，代表一个Unicode码点。当字符串包含非ASCII字符（如中文、emoji）时，直接用索引遍历字符串可能无法正确获取字符。

Golang如何处理字符和字节

字狐AIPPT是一款集成了多种智能功能的软件，智能生成PPT和PPT大纲，帮助您快速生成PPT，节约时间，提高效率！

Golang如何处理字符和字节

24

例如：

s := “Hello世界”
for i := range s { … } 遍历的是字节位置
for _, r := range s { … } 才能正确逐个获取rune（即字符）

使用[]rune(s)可将字符串转为rune切片，len([]rune(s))给出实际字符数，而非字节数。

常见操作建议

处理字符和字节时，根据场景选择合适类型：

需要修改内容或进行网络传输时，使用[]byte。比如在http请求体处理中常见json.Marshal返回[]byte
要统计字符数或逐个处理用户可见字符（尤其是多语言文本），应转为[]rune或使用range遍历
避免对字符串做频繁拼接，使用strings.Builder或bytes.Buffer
从文件或网络读取原始数据时，默认是字节流，需明确是否按UTF-8解码为字符串

基本上就这些。关键是分清“字节”和“字符”的概念，根据实际需求选择byte、rune或string类型操作。Go的UTF-8原生支持让大多数情况变得简单，但遇到中文、emoji等宽字符时，rune不可忽视。

ASCII for go golang Go语言 http js json len String string类切片区别多语言字符串字节编码

text=ZqhQzanResources