你不知道的 WeakMap
相信很多读者对 ES6 引入的 Map 已经不陌生了,其中的一部分读者可能也听说过 WeakMap。既生 Map 何生 WeakMap?带着这个问题,本文将围绕以下几个方面的内容为你详细介绍 WeakMap 的相关知识。
一、什么是垃圾回收
在计算机科学中,垃圾回收(Garbage Collection,缩写为 GC)是指一种自动的存储器管理机制。当某个程序占用的一部分内存空间不再被这个程序访问时,这个程序会借助垃圾回收算法向操作系统归还这部分内存空间。 垃圾回收器可以减轻程序员的负担,也减少程序中的错误。
垃圾回收最早起源于 LISP 语言,它有两个基本的原理:
- 考虑某个对象在未来的程序运行中,将不会被访问;
- 回收这些对象所占用的存储器。
JavaScript 具有自动垃圾回收机制,这种垃圾回收机制原理其实很简单:找出那些不再继续使用的变量,然后释放其所占用的内存,垃圾回收器会按照固定的时间间隔周期性地执行这一操作。
(图片来源:Garbage Collection: V8’s Orinoco)
局部变量只有在函数执行的过程中存在,在这个过程中,一般情况下会为局部变量在栈内存上分配空间,然后在函数中使用这些变量,直至函数执行结束。垃圾回收器必须追踪每个变量的使用情况,为那些不再使用的变量打上标记,用于将来能及时回收其占用的内存,用于标识无用变量的策略主要有引用计数法和标记清除法。
1.1 引用计数法
最早的也是最简单的垃圾回收实现方法,这种方法为占用物理空间的对象附加一个计数器,当有其他对象引用这个对象时计数器加一,反之引用解除时减一。这种算法会定期检查尚未被回收的对象的计数器,为零的话则回收其所占物理空间,因为此时的对象已经无法访问。
引用计数法实现比较简单,但它却无法回收循环引用的存储对象,比如:
1function f() {
2 var o1 = {};
3 var o2 = {};
4 o1.p = o2; // o1引用o2
5 o2.p = o1; // o2引用o1
6}
7
8f();
9
为了解决这个问题,垃圾回收器引入了标记清除法。
1.2 标记清除法
标记清除法主要将 GC 的垃圾回收过程分为标记阶段和清除两个阶段:
- 标记阶段:把所有活动对象做上标记;
- 清除阶段:把没有标记(也就是非活动对象)销毁。
JavaScript 中最常用的垃圾回收方式就是标记清除(mark-and-sweep),当变量进入环境时,就将这个变量标记 “进入环境”,当变量离开环境时,就将其标记为 “离开环境”。
标记清除法具体的垃圾回收过程如下图所示:
(图片来源:How JavaScript works: memory management + how to handle 4 common memory leaks)
在日常工作中,对于不再使用的对象,通常我们会希望它们会被垃圾回收器回收。这时,你可以使用 null
来覆盖对应对象的引用,比如:
1let sem = { name: "Semlinker" };
2// 该对象能被访问,sem是它的引用
3sem = null; // 覆盖引用
4// 该对象将会被从内存中清除
5
但是,当对象、数组这类数据结构在内存中时,它们的子元素,如对象的属性、数组的元素都是可以访问的。例如,如果把一个对象放入到数组中,那么只要这个数组存在,那么这个对象也就存在,即使没有其他对该对象的引用。比如:
1let sem = { name: "Semlinker" };
2let array = [ sem ];
3sem = null; // 覆盖引用
4
5// sem 被存储在数组里, 所以它不会被垃圾回收机制回收
6// 我们可以通过 array[0] 来获取它
7
同样,如果我们使用对象作为常规 Map
的键,那么当 Map
存在时,该对象也将存在。它会占用内存,并且不会被垃圾回收机制回收。比如:
1let sem = { name: "Semlinker" };
2
3let map = new Map();
4map.set(sem, "全栈修仙之路");
5sem = null; // 覆盖引用
6
7// sem被存储在map中
8// 我们可以使用map.keys()来获取它
9
那么如何解决上述 Map 的垃圾回收问题呢?这时我们就需要来了解一下 WeakMap。
二、为什么需要 WeakMap
2.1 Map 和 WeakMap 的区别
相信很多读者对 ES6 中 Map 已经不陌生了,已经有了 Map,为什么还会有 WeakMap,它们之间有什么区别呢?Map 和 WeakMap 之间的主要区别:
- Map 对象的键可以是任何类型,但 WeakMap 对象中的键只能是对象引用;
- WeakMap 不能包含无引用的对象,否则会被自动清除出集合(垃圾回收机制);
- WeakMap 对象是不可枚举的,无法获取集合的大小。
在 JavaScript 里,Map API 可以通过使其四个 API 方法共用两个数组(一个存放键,一个存放值)来实现。给这种 Map 设置值时会同时将键和值添加到这两个数组的末尾。从而使得键和值的索引在两个数组中相对应。当从该 Map 取值的时候,需要遍历所有的键,然后使用索引从存储值的数组中检索出相应的值。
但这样的实现会有两个很大的缺点,首先赋值和搜索操作都是 O(n) 的时间复杂度(n 是键值对的个数),因为这两个操作都需要遍历全部整个数组来进行匹配。 另外一个缺点是可能会导致内存泄漏,因为数组会一直引用着每个键和值。 这种引用使得垃圾回收算法不能回收处理他们,即使没有其他任何引用存在了。
相比之下,原生的 WeakMap 持有的是每个键对象的 “弱引用”,这意味着在没有其他引用存在时垃圾回收能正确进行。 原生 WeakMap 的结构是特殊且有效的,其用于映射的 key 只有在其没有被回收时才是有效的。
正由于这样的弱引用, WeakMap
的 key 是不可枚举的 (没有方法能给出所有的 key)。如果key 是可枚举的话,其列表将会受垃圾回收机制的影响,从而得到不确定的结果。因此,如果你想要这种类型对象的 key 值的列表,你应该使用 Map
。而如果你要往对象上添加数据,又不想干扰垃圾回收机制,就可以使用 WeakMap。
所以对于前面遇到的垃圾回收问题,我们可以使用 WeakMap 来解决,具体如下:
1let sem = { name: "Semlinker" };
2
3let map = new WeakMap();
4map.set(sem, "全栈修仙之路");
5sem = null; // 覆盖引用
6
2.2 WeakMap 与垃圾回收
WeakMap 真有介绍的那么神奇么?下面我们来动手测试一下同个场景下 Map 与 WeakMap 对垃圾回收的影响。首先我们分别创建两个文件:map.js 和 weakmap.js。
map.js
1//map.js
2function usageSize() {
3 const used = process.memoryUsage().heapUsed;
4 return Math.round((used / 1024 / 1024) * 100) / 100 + "M";
5}
6
7global.gc();
8console.log(usageSize()); // ≈ 3.19M
9
10let arr = new Array(10 * 1024 * 1024);
11const map = new Map();
12
13map.set(arr, 1);
14global.gc();
15console.log(usageSize()); // ≈ 83.19M
16
17arr = null;
18global.gc();
19console.log(usageSize()); // ≈ 83.2M
20
创建完 map.js 之后,在命令行输入 node --expose-gc map.js
命令执行 map.js
中的代码,其中 --expose-gc
参数表示允许手动执行垃圾回收机制。
weakmap.js
1function usageSize() {
2 const used = process.memoryUsage().heapUsed;
3 return Math.round((used / 1024 / 1024) * 100) / 100 + "M";
4}
5
6global.gc();
7console.log(usageSize()); // ≈ 3.19M
8
9let arr = new Array(10 * 1024 * 1024);
10const map = new WeakMap();
11
12map.set(arr, 1);
13global.gc();
14console.log(usageSize()); // ≈ 83.2M
15
16arr = null;
17global.gc();
18console.log(usageSize()); // ≈ 3.2M
19
同样,创建完 weakmap.js 之后,在命令行输入 node --expose-gc weakmap.js
命令执行 weakmap.js
中的代码。通过对比 map.js
和 weakmap.js
的输出结果,我们可知 weakmap.js
中定义的 arr
被清除后,其占用的堆内存被垃圾回收器成功回收了。
下面我们来大致分析一下出现上述区别的主要原因:
对于 map.js
来说,由于在 arr 和 Map 中都保留了数组的强引用,所以在 Map 中简单的清除 arr 变量内存并没有得到释放,因为 Map 还存在引用计数。而在 WeakMap 中,它的键是弱引用,不计入引用计数中,所以当 arr 被清除之后,数组会因为引用计数为 0 而被垃圾回收清除。
了解完上述内容之后,下面我们来正式介绍 WeakMap。
三、WeakMap 简介
WeakMap 对象是一组键/值对的集合,其中的键是弱引用的。 WeakMap 的 key 只能是 Object 类型。 原始数据类型是不能作为 key 的(比如 Symbol)。
3.1 语法
1new WeakMap([iterable])
2
iterable
:是一个数组(二元数组)或者其他可迭代的且其元素是键值对的对象。每个键值对会被加到新的 WeakMap 里。null 会被当做 undefined。
3.2 属性
length
:属性的值为 0;prototype
:WeakMap
构造器的原型。 允许添加属性到所有的 WeakMap 对象。
3.3 方法
WeakMap.prototype.delete(key)
:移除 key 的关联对象。执行后WeakMap.prototype.has(key)
返回false。WeakMap.prototype.get(key)
:返回key
关联对象,或者undefined
(没有 key 关联对象时)。WeakMap.prototype.has(key)
:根据是否有 key 关联对象返回一个布尔值。WeakMap.prototype.set(key, value)
:在 WeakMap 中设置一组 key 关联对象,返回这个WeakMap
对象。
3.4 示例
1const wm1 = new WeakMap(),
2 wm2 = new WeakMap(),
3 wm3 = new WeakMap();
4const o1 = {},
5 o2 = function(){},
6 o3 = window;
7
8wm1.set(o1, 37);
9wm1.set(o2, "azerty");
10wm2.set(o1, o2); // value可以是任意值,包括一个对象或一个函数
11wm2.set(o3, undefined);
12wm2.set(wm1, wm2); // 键和值可以是任意对象,甚至另外一个WeakMap对象
13
14wm1.get(o2); // "azerty"
15wm2.get(o2); // undefined,wm2中没有o2这个键
16wm2.get(o3); // undefined,值就是undefined
17
18wm1.has(o2); // true
19wm2.has(o2); // false
20wm2.has(o3); // true (即使值是undefined)
21
22wm3.set(o1, 37);
23wm3.get(o1); // 37
24
25wm1.has(o1); // true
26wm1.delete(o1);
27wm1.has(o1); // false
28
介绍完 WeakMap 相关的基础知识,下面我们来介绍一下 WeakMap 的应用。
四、WeakMap 应用
4.1 通过 WeakMap 缓存计算结果
使用 WeakMap,你可以将先前计算的结果与对象相关联,而不必担心内存管理。以下功能 countOwnKeys()
是一个示例:它将以前的结果缓存在 WeakMap 中 cache
。
1const cache = new WeakMap();
2
3function countOwnKeys(obj) {
4 if (cache.has(obj)) {
5 return [cache.get(obj), 'cached'];
6 } else {
7 const count = Object.keys(obj).length;
8 cache.set(obj, count);
9 return [count, 'computed'];
10 }
11}
12
创建完 countOwnKeys
方法,我们来具体测试一下:
1let obj = { name: "kakuqo", age: 30 };
2console.log(countOwnKeys(obj));
3// [2, 'computed']
4console.log(countOwnKeys(obj));
5// [2, 'cached']
6obj = null; // 当对象不在使用时,设置为null
7
4.2 在 WeakMap 中保留私有数据
在以下代码中,WeakMap _counter
和 _action
用于存储以下实例的虚拟属性的值:
1const _counter = new WeakMap();
2const _action = new WeakMap();
3
4class Countdown {
5 constructor(counter, action) {
6 _counter.set(this, counter);
7 _action.set(this, action);
8 }
9
10 dec() {
11 let counter = _counter.get(this);
12 counter--;
13 _counter.set(this, counter);
14 if (counter === 0) {
15 _action.get(this)();
16 }
17 }
18}
19
创建完 Countdown
类,我们来具体测试一下:
1let invoked = false;
2
3const countDown = new Countdown(3, () => invoked = true);
4countDown.dec();
5countDown.dec();
6countDown.dec();
7
8console.log(`invoked status: ${invoked}`)
9
说到类的私有属性,我们不得提一下 ECMAScript Private Fields。
五、ECMAScript 私有字段
5.1 ES 私有字段简介
在介绍 ECMAScript 私有字段前,我们先目睹一下它的 “芳容”:
1class Counter extends HTMLElement {
2 #x = 0;
3
4 clicked() {
5 this.#x++;
6 window.requestAnimationFrame(this.render.bind(this));
7 }
8
9 constructor() {
10 super();
11 this.onclick = this.clicked.bind(this);
12 }
13
14 connectedCallback() { this.render(); }
15
16 render() {
17 this.textContent = this.#x.toString();
18 }
19}
20
21window.customElements.define('num-counter', Counter);
22
第一眼看到 #x
是不是觉得很别扭,目前 TC39 委员会以及对此达成了一致意见,并且该提案已经进入了 Stage 3。那么为什么使用 #
符号,而不是其他符号呢?
TC39 委员会解释道,他们也是做了深思熟虑最终选择了 # 符号,而没有使用 private 关键字。其中还讨论了把 private 和 # 符号一起使用的方案。并且还打算预留了一个 @ 关键字作为 protected 属性 。
来源于迷渡大大: 为什么 JavaScript 的私有属性使用 # 符号
在 TypeScript 3.8 版本就开始支持 ECMAScript 私有字段,使用方式如下:
1class Person {
2 #name: string;
3
4 constructor(name: string) {
5 this.#name = name;
6 }
7
8 greet() {
9 console.log(`Hello, my name is ${this.#name}!`);
10 }
11}
12
13let semlinker = new Person("Semlinker");
14
15semlinker.#name;
16// ~~~~~
17// Property '#name' is not accessible outside class 'Person'
18// because it has a private identifier.
19
与常规属性(甚至使用 private
修饰符声明的属性)不同,私有字段要牢记以下规则:
- 私有字段以
#
字符开头,有时我们称之为私有名称; - 每个私有字段名称都唯一地限定于其包含的类;
- 不能在私有字段上使用 TypeScript 可访问性修饰符(如 public 或 private);
- 私有字段不能在包含的类之外访问,甚至不能被检测到。
说到这里使用 #
定义的私有字段与 private
修饰符定义字段有什么区别呢?现在我们先来看一个 private
的示例:
1class Person {
2 constructor(private name: string){}
3}
4
5let person = new Person("Semlinker");
6console.log(person.name);
7
在上面代码中,我们创建了一个 Person 类,该类中使用 private
修饰符定义了一个私有属性 name
,接着使用该类创建一个 person
对象,然后通过 person.name
来访问 person
对象的私有属性,这时 TypeScript 编译器会提示以下异常:
1Property 'name' is private and only accessible within class 'Person'.(2341)
2
那如何解决这个异常呢?当然你可以使用类型断言把 person 转为 any 类型:
1console.log((person as any).name);
2
通过这种方式虽然解决了 TypeScript 编译器的异常提示,但是在运行时我们还是可以访问到 Person
类内部的私有属性,为什么会这样呢?我们来看一下编译生成的 ES5 代码,也许你就知道答案了:
1var Person = /** @class */ (function () {
2 function Person(name) {
3 this.name = name;
4 }
5 return Person;
6}());
7
8var person = new Person("Semlinker");
9console.log(person.name);
10
这时相信有些小伙伴会好奇,在 TypeScript 3.8 以上版本通过 #
号定义的私有字段编译后会生成什么代码:
1class Person {
2 #name: string;
3
4 constructor(name: string) {
5 this.#name = name;
6 }
7
8 greet() {
9 console.log(`Hello, my name is ${this.#name}!`);
10 }
11}
12
以上代码目标设置为 ES2015,会编译生成以下代码:
1"use strict";
2var __classPrivateFieldSet = (this && this.__classPrivateFieldSet)
3 || function (receiver, privateMap, value) {
4 if (!privateMap.has(receiver)) {
5 throw new TypeError("attempted to set private field on non-instance");
6 }
7 privateMap.set(receiver, value);
8 return value;
9};
10
11var __classPrivateFieldGet = (this && this.__classPrivateFieldGet)
12 || function (receiver, privateMap) {
13 if (!privateMap.has(receiver)) {
14 throw new TypeError("attempted to get private field on non-instance");
15 }
16 return privateMap.get(receiver);
17};
18
19var _name;
20class Person {
21 constructor(name) {
22 _name.set(this, void 0);
23 __classPrivateFieldSet(this, _name, name);
24 }
25 greet() {
26 console.log(`Hello, my name is ${__classPrivateFieldGet(this, _name)}!`);
27 }
28}
29_name = new WeakMap();
30
通过观察上述代码,使用 #
号定义的 ECMAScript 私有字段,会通过 WeakMap
对象来存储,同时编译器会生成 __classPrivateFieldSet
和 __classPrivateFieldGet
这两个方法用于设置值和获取值。介绍完单个类中私有字段的相关内容,下面我们来看一下私有字段在继承情况下的表现。
5.2 ES 私有字段继承
为了对比常规字段和私有字段的区别,我们先来看一下常规字段在继承中的表现:
1class C {
2 foo = 10;
3
4 cHelper() {
5 return this.foo;
6 }
7}
8
9class D extends C {
10 foo = 20;
11
12 dHelper() {
13 return this.foo;
14 }
15}
16
17let instance = new D();
18// 'this.foo' refers to the same property on each instance.
19console.log(instance.cHelper()); // prints '20'
20console.log(instance.dHelper()); // prints '20'
21
很明显不管是调用子类中定义的 cHelper()
方法还是父类中定义的 dHelper()
方法最终都是输出子类上的 foo
属性。接下来我们来看一下私有字段在继承中的表现:
1class C {
2 #foo = 10;
3
4 cHelper() {
5 return this.#foo;
6 }
7}
8
9class D extends C {
10 #foo = 20;
11
12 dHelper() {
13 return this.#foo;
14 }
15}
16
17let instance = new D();
18// 'this.#foo' refers to a different field within each class.
19console.log(instance.cHelper()); // prints '10'
20console.log(instance.dHelper()); // prints '20'
21
通过观察上述的结果,我们可以知道在 cHelper()
方法和 dHelper()
方法中的 this.#foo
指向了每个类中的不同字段。关于 ECMAScript 私有字段的其他内容,我们不再展开,感兴趣的读者可以自行阅读相关资料。
六、总结
本文主要介绍了 JavaScript 中 WeakMap 的作用和应用场景,其实除了 WeakMap 之外,还有一个 WeakSet,只要将对象添加到 WeakMap 或 WeakSet 中,GC 在触发条件时就可以将其占用内存回收。
但实际上 JavaScript 的 WeakMap 并不是真正意义上的弱引用:其实只要键仍然存活,它就强引用其内容。WeakMap 仅在键被垃圾回收之后,才弱引用它的内容。为了提供真正的弱引用,TC39 提出了 WeakRefs 提案。
WeakRef 是一个更高级的 API,它提供了 真正的弱引用,并在对象的生命周期中插入了一个窗口。同时它也可以解决 WeakMap 仅支持 object 类型作为 Key 的问题。