JavaScript的charAt方法怎么获取字符串字符？-小浪学习网

在JavaScript中，使用charat()方法可以从字符串中获取特定索引位置的字符。该方法接受一个整数参数作为索引值，返回对应的字符；若索引超出字符串长度，则返回空字符串””，例如：str.charat(0)获取第一个字符，str.charat(str.Length-1)获取最后一个字符。与方括号[]访问的区别在于越界处理，[]会返回undefined。此外，charat()无法正确处理由多个utf-16编码单元组成的unicode字符（如emoji），此时应使用codepointat()方法以确保准确性。charat()适用于ASCII字符或单编码单元字符的操作，在国际化场景中需谨慎使用。

JavaScript的charAt方法怎么获取字符串字符？

在JavaScript里，要从一个字符串中获取特定位置的字符，charAt() 方法是一个非常直接且常用的方式。它就是用来根据你给定的索引（也就是位置）来取出对应字符的。

解决方案

charAt() 方法的用法其实挺简单。你只需要在字符串后面点上 .charAt()，然后把你想获取的字符的索引值作为参数传进去就行。记住，字符串的索引是从 0 开始的，所以第一个字符的索引是 0，第二个是 1，以此类推。

举个例子，如果你有一个字符串 “Hello World”：

立即学习“Java免费学习笔记（深入）”；

const myString = "Hello World";  // 获取第一个字符 const firstChar = myString.charAt(0); // 'H' console.log(firstChar);  // 获取第五个字符（索引是4） const fifthChar = myString.charAt(4); // 'o' console.log(fifthChar);  // 如果索引超出了字符串的长度，charAt() 会返回一个空字符串 "" const outOfBoundsChar = myString.charAt(100); // "" console.log(`超出范围的字符：'${outOfBoundsChar}'`);  // 甚至可以这样用，虽然有点多余，但语法上没问题 const lastChar = myString.charAt(myString.length - 1); // 'd' console.log(lastChar);

我个人觉得，charAt() 的优势在于它处理越界索引时的行为：它会返回一个空字符串，而不是抛出错误或者返回 undefined。这在某些场景下可以省去额外的边界检查，但另一方面，也可能掩盖一些逻辑错误，所以在使用时得留心。

charAt() 与方括号 [] 访问字符有什么区别？

这是个好问题，因为在现代JavaScript中，我们更常用方括号 [] 来访问字符串字符，比如 myString[0]。那么，这两者到底有什么不同呢？

最核心的区别在于它们处理“越界”索引时的行为。就像我前面提到的，charAt() 在索引超出字符串长度时会返回一个空字符串 “”。而使用方括号 [] 访问时，如果索引越界，它会返回 undefined。

const text = "你好";  console.log(text.charAt(10));    // 输出：'' (空字符串) console.log(text[10]);           // 输出：undefined

从技术实现上讲，charAt() 是一个明确的方法调用，而方括号 [] 访问实际上是对字符串对象属性的访问（字符串在JavaScript中被视为类数组对象）。在老旧的IE浏览器版本中（比如IE7及以下），[] 语法可能不支持对字符串的直接字符访问，但现在这基本不是问题了，现代浏览器都支持。

所以，在大多数情况下，方括号 [] 语法更简洁，也更符合我们对数组或类数组对象访问的直觉。但如果你有特定需求，比如希望越界访问时得到一个空字符串而不是 undefined，那么 charAt() 依然有它的用武之地。我个人倾向于使用 [] 语法，因为它更通用，而且 undefined 的语义在错误处理上可能更明确。

charAt() 方法在处理多语言字符（如Emoji）时表现如何？

这部分内容就有点意思了，也是 charAt() 在实际应用中需要特别注意的地方。简单来说，charAt() 方法是基于 UTF-16 编码单元来工作的，而不是基于完整的 Unicode 字符（或称码点）。

这是什么意思呢？在Unicode中，一些字符（特别是像Emoji表情、某些不常用的汉字或古文字）可能由一个以上的UTF-16编码单元组成，我们称之为“代理对”（surrogate pair）。一个完整的Emoji可能由两个UTF-16编码单元构成，虽然我们视觉上只看到一个字符。

当你使用 charAt() 方法时，它每次只返回一个UTF-16编码单元。这意味着，如果一个Emoji是由两个编码单元组成的，charAt() 可能会把它“劈开”，导致你得到一个不完整的、无法正确显示的字符。

const emojiString = "你好?世界"; // ? 是一个由两个UTF-16编码单元组成的字符  console.log(emojiString.length); // 输出：7 (因为?被算作两个编码单元)  // 尝试获取? console.log(emojiString.charAt(2)); // 输出：'�' 或其他乱码，因为这是?的第一个编码单元 console.log(emojiString.charAt(3)); // 输出：'�' 或其他乱码，这是?的第二个编码单元

这显然不是我们想要的结果。为了正确处理这类由多个编码单元组成的字符，JavaScript提供了 codePointAt() 方法。codePointAt() 返回的是字符的Unicode码点值，并且能够正确处理代理对。结合 String.fromCodePoint()，我们可以完整地获取这些字符：

console.log(emojiString.codePointAt(2)); // 输出：128522 (?的Unicode码点) console.log(String.fromCodePoint(emojiString.codePointAt(2))); // 输出：?

所以，如果你的字符串可能包含Emoji或其它需要代理对表示的Unicode字符，强烈建议使用 codePointAt() 配合循环遍历来确保正确性。charAt() 更适合处理ASCII字符或那些单个UTF-16编码单元就能表示的字符。在国际化或处理用户输入时，这一点尤为重要。

在实际项目中有效利用 charAt() 方法

尽管 charAt() 在处理复杂Unicode字符时有局限性，但在许多场景下，它依然是一个简单高效的工具。

快速获取首尾字符： 这是最常见的用途之一。

function getFirstChar(str) {     if (str && str.length > 0) {         return str.charAt(0);     }     return ''; } function getLastChar(str) {     if (str && str.length > 0) {         return str.charAt(str.length - 1);     }     return ''; } console.log(getFirstChar("Hello")); // H console.log(getLastChar("World"));  // d

简单的字符串校验： 比如检查一个字符串是否以某个特定字符开头。
```
function startsWithHash(input) {     return input.length > 0 && input.charAt(0) === '#'; } console.log(startsWithHash("#tag")); // true console.log(startsWithHash("notag")); // false
```
当然，现代JavaScript有 startsWith() 方法，但了解 charAt() 的这种用法有助于理解其基础功能。

遍历字符串（传统方式）： 虽然 for…of 循环或 Array.from() 更推荐用于遍历字符串，尤其是在处理Unicode时，但 charAt() 也可以用于传统的 for 循环。

const myText = "Code"; for (let i = 0; i < myText.length; i++) {     console.log(`字符在索引 ${i} 是: ${myText.charAt(i)}`); } // 输出: // 字符在索引 0 是: C // 字符在索引 1 是: o // 字符在索引 2 是: d // 字符在索引 3 是: e

我发现，在项目里，如果我确定字符串内容是纯英文或者不需要考虑复杂多语言字符，那么 charAt() 或者 [] 访问都挺方便。但一旦涉及到用户输入、国际化或者任何可能包含Emoji的场景，我就会本能地转向 codePointAt()，因为它能提供更稳健的字符处理。选择合适的工具，才能让代码更健壮。

文章版权归作者所有，未经允许请勿转载。

THE END