哈希表是什么？哈希表在JS中的应用-小浪学习网

哈希表通过哈希函数将键映射到索引，实现接近O(1)的存取效率，核心包括哈希函数、冲突解决（如链地址法）、以及在JavaScript中由Object和map实现的键值对存储；Map相比Object支持任意类型键、保持插入顺序、无原型链干扰，适用于非字符串键、频繁增删和去重等场景，但需注意键的相等性判断、内存泄漏风险（可用WeakMap缓解）及潜在的哈希冲突对性能的影响。

哈希表是什么？哈希表在JS中的应用

哈希表，在我看来，它本质上是一种极其高效的数据结构，它的核心思想就是通过一个函数（我们称之为哈希函数）将你给的“键”映射到一个特定的位置，通常是一个数组的索引，这样你就能以接近常数时间的速度来存取数据。简单来说，它就像一个超级智能的图书馆，你给书名（键），它立刻就能告诉你书架的精确位置（索引），而不是让你一本本去找。

解决方案

哈希表的工作原理说起来挺巧妙的。当你有一个键值对（key-value pair）要存储时，哈希函数会把这个键转换成一个固定大小的数字，这个数字就是哈希值。然后，这个哈希值会通过取模运算等方式，被映射到内部存储结构（通常是一个数组）的某个索引位置上。当你需要查找或者删除这个键值对时，同样的操作流程能让你迅速定位到它。

当然，这里面有个绕不开的问题叫“哈希冲突”。就是不同的键，经过哈希函数计算后，可能会得到相同的哈希值，进而映射到同一个索引位置。解决冲突的方法有很多，最常见的是“链地址法”（Separate Chaining），也就是在每个索引位置上挂一个链表，把所有冲突的键值对都放到这个链表里。另一种是“开放地址法”（Open Addressing），当发生冲突时，它会尝试寻找下一个空闲的位置来存放数据。理解这些机制，对于我们掌握哈希表的性能边界非常有帮助。理想情况下，哈希表的增、删、查操作时间复杂度都是O(1)，但在极端冲突的情况下，可能会退化到O(n)。

JavaScript中，我们是如何“使用”哈希表的？

在JavaScript的世界里，我们日常开发中其实无时无刻不在与哈希表打交道，只是它被包装成了更高级、更易用的形式。最典型的就是

Object

和

Map

。

Object

是我们最常用的键值对集合，它的键默认会被转换成字符串（或者symbol）。从底层实现来看，JavaScript引擎在处理

Object

的属性访问时，会采用类似哈希表的数据结构来优化查找效率。比如，

obj.name

或者

obj['name']

的访问速度之所以快，就是因为引擎内部通过哈希机制快速定位到了

name

这个属性的值。

然而，

Object

也有它的局限性。比如，它的键只能是字符串或Symbol，如果你想用一个对象作为键，它会被隐式地转换为字符串

[object Object]

，这显然不是我们想要的效果。另外，

Object

在迭代时，属性的顺序在ES2015之前是无法保证的（虽然现在对于数字和字符串键有了更明确的顺序），而且原型链的存在也可能带来一些意想不到的问题。

这时候，es6引入的

Map

就显得尤为强大了。

Map

就是为键值对存储而生的，它最显著的特点是键可以是任意类型的值，包括对象、函数、甚至另一个

Map

实例。这解决了

Object

在键类型上的限制。同时，

Map

会保持键值对的插入顺序，这在很多场景下非常有用。从性能上讲，对于频繁的添加、删除和遍历操作，

Map

通常比

Object

表现更好，因为它没有原型链的干扰，并且是专门优化过的哈希表实现。

// 使用Object作为哈希表 const userMapObject = {   'id_1': { name: 'Alice', age: 30 },   'id_2': { name: 'Bob', age: 25 } }; console.log(userMapObject['id_1'].name); // Alice  // 使用Map作为哈希表 const userMap = new Map(); const user1 = { id: 'id_1' }; const user2 = { id: 'id_2' }; userMap.set(user1, { name: 'Alice', age: 30 }); // 可以用对象作为键 userMap.set(user2, { name: 'Bob', age: 25 }); console.log(userMap.get(user1).name); // Alice console.log(userMap.size); // 2

在我看来，如果你只是需要一个简单的配置对象，或者键都是字符串，

Object

依然是简洁高效的选择。但一旦涉及到非字符串键、需要保持插入顺序、或者有大量动态的键值对操作时，

Map

无疑是更专业、更健壮的工具。

哈希表在JavaScript实际开发中常见的应用场景有哪些？

哈希表的思维模型几乎渗透在javascript开发的方方面面。我们不直接说“用哈希表”，但实际就是在用它解决问题。

数据缓存和记忆化（Memoization）： 这是最常见的应用之一。当你有一个计算成本较高的函数，并且它在相同输入下总是返回相同结果时，你可以用一个哈希表来存储已经计算过的结果。下次再调用时，先查哈希表，有就直接返回，没有再计算并存入。这在前端性能优化中非常常见。

function memoize(fn) {   const cache = new Map(); // 使用Map更灵活，键可以是任意类型   return function(...args) {     const key = JSON.stringify(args); // 简单粗暴的键生成方式，复杂场景需自定义     if (cache.has(key)) {       console.log('从缓存中获取:', key);       return cache.get(key);     }     const result = fn(...args);     cache.set(key, result);     console.log('计算并缓存:', key);     return result;   }; }  const slowFunction = (num) => {   // 模拟耗时操作   let sum = 0;   for (let i = 0; i < 1e7; i++) {     sum += i;   }   return num * 2 + sum; };  const memoizedSlowFunction = memoize(slowFunction); memoizedSlowFunction(10); // 第一次计算 memoizedSlowFunction(10); // 从缓存获取

数据去重： 无论是数组去重还是其他集合去重，哈希表的快速查找特性都能派上用场。

Set

就是一种特殊的哈希表，它只存储键，并且保证键的唯一性。

const numbers = [1, 2, 2, 3, 4, 4, 5]; const uniqueNumbers = [...new Set(numbers)]; // Set内部利用哈希表实现快速去重 console.log(uniqueNumbers); // [1, 2, 3, 4, 5]  // 如果是对象数组去重，可以手动用Map或Object const people = [{ id: 1, name: 'A' }, { id: 2, name: 'B' }, { id: 1, name: 'A' }]; const uniquePeopleMap = new Map(); people.forEach(p => uniquePeopleMap.set(p.id, p)); // 以id为键，覆盖重复id const uniquePeople = Array.from(uniquePeopleMap.values()); console.log(uniquePeople); // [{ id: 1, name: 'A' }, { id: 2, name: 'B' }]

计数器或频率统计： 统计字符串中字符出现的频率，或者数组中元素出现的次数，哈希表能让你快速地存储和更新每个元素的计数。

const text = "hello world"; const charCounts = new Map(); for (const char of text) {   charCounts.set(char, (charCounts.get(char) || 0) + 1); } console.log(charCounts); // Map(7) { 'h' => 1, 'e' => 1, 'l' => 3, 'o' => 2, ' ' => 1, 'w' => 1, 'r' => 1, 'd' => 1 }

快速查找与映射： 当你需要根据一个ID或某个属性快速找到对应的完整数据时，哈希表是理想选择。比如，根据用户ID快速获取用户详情，或者根据产品SKU快速获取产品信息。
路由表： 在前端框架中，路由通常也是通过哈希表（或类似结构）来映射URL路径到对应的组件或处理函数。

这些例子只是冰山一角，可以说，只要涉及到“键值对”和“快速查找”的场景，背后几乎都有哈希表的影子。

使用哈希表时，我们需要注意哪些潜在的陷阱或优化点？

尽管哈希表在大多数情况下都表现出色，但作为开发者，了解它的一些特性和潜在问题，能帮助我们写出更健壮、更高效的代码。

一个经常被忽略的点是键的类型和相等性判断。对于

Object

，所有非Symbol的键都会被强制转换为字符串。这意味着

obj[1]

和

obj['1']

访问的是同一个属性。而

Map

则使用“SameValueZero”算法来比较键的相等性。这导致

NaN

在

Map

中被认为是相等的，而

+0

和

-0

也被认为是相等的。更重要的是，对于对象类型的键，

Map

是基于引用相等性来判断的。这意味着即使两个对象的内容完全一样，但只要它们是不同的引用，在

Map

中它们就是不同的键。

const myMap = new Map(); myMap.set(NaN, "not a number"); console.log(myMap.get(NaN)); // "not a number" (NaN === NaN for Map)  myMap.set({}, "obj1"); myMap.set({}, "obj2"); // 这是另一个不同的对象引用 console.log(myMap.size); // 2

另一个值得思考的是内存占用和垃圾回收。

Map

会对它的键和值都保持强引用。这意味着如果一个对象被用作

Map

的键，那么即使这个对象在其他地方已经没有引用了，只要它还在

Map

中，垃圾回收器就不会回收它。这在处理大量临时性或生命周期短的对象作为键时，可能会导致内存泄漏。为了解决这个问题，JavaScript提供了

WeakMap

。

WeakMap

只对它的键保持弱引用，这意味着如果一个键对象没有其他地方引用它，垃圾回收器就可以自由地回收它，而不会影响

WeakMap

的正常工作。当然，

WeakMap

也有自己的局限性，比如它不能被迭代，也不能获取

size

。

在性能方面，虽然哈希表平均是O(1)，但哈希冲突的严重程度确实会影响性能。JavaScript引擎的哈希函数通常都非常优秀，能很好地分散键，所以我们很少会遇到极端冲突导致性能退化到O(n)的情况。但如果你在处理的数据集有某种特殊模式，或者你正在实现一个自定义的哈希结构，那么设计一个好的哈希函数就变得至关重要。

最后，对于