c++ wstring和string如何转换 c++宽窄字符转换【技巧】

2次阅读

c++中 std::String与 std::wstring 转换需显式 编码 转换:windows 推荐 WideCharToMultiByte/MultiByteToWideChar(UTF-8),跨平台可用 utf8cpp 或 ICU;C++11 的 std::wstring_convert 已弃用,不可依赖 locale,必须明确源 / 目标编码。

c++ wstring 和 string 如何转换 c++ 宽窄字符转换【技巧】

在 C++ 中,std::string(窄 字符串 ,通常为 UTF-8 或本地多 字节 编码 )和 std::wstring(宽字符串,windows 下为 UTF-16,linux/macOS 一般为 UTF-32)之间的转换不能直接赋值,必须通过编码转换。核心在于明确源 / 目标编码,并借助系统 API 或 标准库(C++11 起)完成。

wstring → string(宽转窄,如 UTF-16 → UTF-8)

推荐使用 std::wstring_convert(C++11–C++17,已弃用但广泛可用)或更现代的 std::iconv / 第三方库(如 ICU、utf8cpp),但 Windows 下最稳妥的是 Win32 API:WideCharToMultiByte

  • Windows(转 UTF-8):调用 WideCharToMultiByte(CP_UTF8, ……),先查长度再转换,避免截断
  • 跨平台(C++11):用 std::wstring_convert<:codecvt_utf8>></:codecvt_utf8>,注意该类在 C++17 被标记为 deprecated,仅限简单场景
  • 示例(Windows UTF-8):// 先获取所需 buffer 大小,再分配并转换

string → wstring(窄转宽,如 UTF-8 → UTF-16)

同样需明确输入编码。若 std::string 存的是 UTF-8(推荐),则转 std::wstring 就是 UTF-8 → UTF-16;若存的是本地 ANSI(如 GBK),则需指定对应代码页。

  • Windows:用 MultiByteToWideChar(CP_UTF8, ……)(推荐 UTF-8 输入)或 CP_ACP(系统默认 ANSI)
  • C++11 方式:std::wstring_convert<:codecvt_utf8>> conv; auto wstr = conv.from_bytes(str);</:codecvt_utf8>
  • 注意:若输入 string 实际是 GBK/Big5 等,却按 UTF-8 解码,结果必然乱码

避免踩坑的关键细节

字符编码不是“自动识别”的——你必须清楚原始数据的编码,否则转换必错。

立即学习C++ 免费学习笔记(深入)”;

  • 不要依赖 localestd::localecodecvt 在不同平台行为不一致,且 C++17 已移除
  • Windows 控制台默认是活动代码页(如 CP936)wcout 输出 wstring 正常,但若用 cout 输出 UTF-8 字符串,需先调用 SetConsoleOutputCP(CP_UTF8)
  • 文件读写要显式指定编码:用 fopen(……, "wb") 写二进制,或用 std::wofstream 配合 imbue 设置 UTF-16 编码(需配合 bom

现代替代建议(C++17 及以后)

标准库 不再提供内置编码转换,推荐轻量方案:

  • UTF-8 ↔ UTF-16/32:用 utf8cpp(头文件库,无依赖)
  • 全功能国际化:用 ICU(较重,但最可靠)
  • Windows-only:继续用 WideCharToMultiByte/MultiByteToWideChar,它们稳定、高效、支持所有代码页

以上就是

站长
版权声明:本站原创文章,由 站长 2025-12-24发表,共计1447字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
1a44ec70fbfb7ca70432d56d3e5ef742
text=ZqhQzanResources