14 字节码（二）：解释器是如何解释执行字节码的？

你好，我是李兵。

在上节我们介绍了V8为什么要引入字节码，这节课我们来聊聊解释器是如何解释执行字节码的。学习字节码如何被执行，可以让我们理解解释器的工作机制，同时还能帮助我们搞懂JavaScript运行时的内存结构，特别是闭包的结构和非闭包数据的区别。

字节码的解释执行在编译流水线中的位置你可以参看下图：

如何生成字节码？

我们知道当V8执行一段JavaScript代码时，会先对JavaScript代码进行解析(Parser)，并生成为AST和作用域信息，之后AST和作用域信息被输入到一个称为Ignition 的解释器中，并将其转化为字节码，之后字节码再由Ignition解释器来解释执行。

接下来，我们就结合一段代码来看看执行解释器是怎么解释执行字节码的。你可以参看下面这段代码：

function add(x, y) {
var z = x+y
return z
}
console.log(add(1, 2))

在控制台执行这段代码，会返回数字3，V8是如何得到这个结果的呢？

刚刚我们提到了，V8首先会将函数的源码解析为AST，这一步由解析器(Parser)完成，你可以在d8中通过–print-ast 命令来查看V8内部生成的AST。

[generating bytecode for function: add]
--- AST ---
FUNC at 12
. KIND 0
. LITERAL ID 1
. SUSPEND COUNT 0
. NAME "add"
. PARAMS
. . VAR (0x7fa7bf8048e8) (mode = VAR, assigned = false) "x"
. . VAR (0x7fa7bf804990) (mode = VAR, assigned = false) "y"
. DECLS
. . VARIABLE (0x7fa7bf8048e8) (mode = VAR, assigned = false) "x"
. . VARIABLE (0x7fa7bf804990) (mode = VAR, assigned = false) "y"
. . VARIABLE (0x7fa7bf804a38) (mode = VAR, assigned = false) "z"
. BLOCK NOCOMPLETIONS at -1
. . EXPRESSION STATEMENT at 31
. . . INIT at 31
. . . . VAR PROXY local[0] (0x7fa7bf804a38) (mode = VAR, assigned = false) "z"
. . . . ADD at 32
. . . . . VAR PROXY parameter[0] (0x7fa7bf8048e8) (mode = VAR, assigned = false) "x"
. . . . . VAR PROXY parameter[1] (0x7fa7bf804990) (mode = VAR, assigned = false) "y"
. RETURN at 37
. . VAR PROXY local[0] (0x7fa7bf804a38) (mode = VAR, assigned = false) "z"

同样，我们将其图形化：

从图中可以看出，函数的字面量被解析为AST树的形态，这个函数主要拆分成四部分。

第一部分为参数的声明(PARAMS)，参数声明中包括了所有的参数，在这里主要是参数x和参数y，你可以在函数体中使用arguments来使用对应的参数。
第二部分是变量声明节点(DECLS)，参数部分你可以使用arguments来调用，同样，你也可以将这些参数作为变量来直接使用，这体现在DECLS节点下面也出现了变量x和变量y，除了可以直接使用x和y之外，我们还有一个z变量也在DECLS节点下。你可以注意一下，在上面生成的AST数据中，参数声明节点中的x和变量声明节点中的x的地址是相同的，都是0x7fa7bf8048e8，同样y也是相同的，都是0x7fa7bf804990，这说明它们指向的是同一块数据。
第三部分是x+y的表达式节点，我们可以看到，节点add下面使用了var proxy x和var proxy x的语法，它们指向了实际x和y的值。
第四部分是RETURN节点，它指向了z的值，在这里是local[0]。

V8在生成AST的同时，还生成了add函数的作用域，你可以使用–print-scopes命令来查看：

Global scope:
function add (x, y) { // (0x7f9ed7849468) (12, 47)
// will be compiled
// 1 stack slots
// local vars:
VAR y;  // (0x7f9ed7849790) parameter[1], never assigned
VAR z;  // (0x7f9ed7849838) local[0], never assigned
VAR x;  // (0x7f9ed78496e8) parameter[0], never assigned
}

作用域中的变量都是未使用的，默认值都是undefined，在执行阶段，作用域中的变量会指向堆和栈中相应的数据，作用域和实际数据的关系如下图所示：

在解析期间，所有函数体中声明的变量和函数参数，都被放进作用域中，如果是普通变量，那么默认值是undefined，如果是函数声明，那么将指向实际的函数对象。

一旦生成了作用域和AST，V8就可以依据它们来生成字节码了。AST之后会被作为输入传到字节码生成器(BytecodeGenerator)，这是Ignition解释器中的一部分，用于生成以函数为单位的字节码。你可以通过–print-bytecode命令查看生成的字节码。

[generated bytecode for function: add (0x079e0824fdc1 <SharedFunctionInfo add>)]
Parameter count 3
Register count 2
Frame size 16
0x79e0824ff7a @    0 : a7                StackCheck
0x79e0824ff7b @    1 : 25 02             Ldar a1
0x79e0824ff7d @    3 : 34 03 00          Add a0, [0]
0x79e0824ff80 @    6 : 26 fb             Star r0
0x79e0824ff82 @    8 : 0c 02             LdaSmi [2]
0x79e0824ff84 @   10 : 26 fa             Star r1
0x79e0824ff86 @   12 : 25 fb             Ldar r0
0x79e0824ff88 @   14 : ab                Return
Constant pool (size = 0)
Handler Table (size = 0)
Source Position Table (size = 0)

我们可以看到，生成的字节码第一行提示了“Parameter count 3”，这是告诉我们这里有三个参数，包括了显式地传入了x 和 y，还有一个隐式地传入了this。下面是字节码的详细信息：

StackCheck
Ldar a1
Add a0, [0]
Star r0
LdaSmi [2]
Star r1
Ldar r0
Return

将JavaScript函数转换为字节码之后，我们看到只有8行，接下来我们的任务就是要分析这8行字节码是怎么工作的，理解了这8行字节码是怎么工作的，就可以学习其他字节码的工作方式了。

理解字节码：解释器的架构设计

通过上面的一段字节码我们可以看到，字节码似乎和汇编代码有点像，这些字节码看起来似乎难以理解，但实际上它们非常简单，每一行表示一个特定的功能，把这些功能拼凑在一起就构成完整的程序。

通俗地讲，你可以把这一行行字节码看成是一个个积木块，每个积木块块负责实现特定的功能，有实现运算的，有实现跳转的，有实现返回的，有实现内存读取的。一段JavaScript代码最终被V8还原成一个个积木块，将这些积木搭建在一起就实现了JavaScript的功能，现在我们大致了解了字节码就是一些基础的功能模块，接下来我们就来认识下这些构建块。

下图是一些常用的“积木块”，我们又称为字节码的指令集：

你也可以去V8的源码中查看这些字节码，V8字节码的指令非常多，如果要掌握所有指令的含义，需要花费一段时间的学习和实践，这节课我们不需要了解所有字节码的含义，但我们需要知道，怎样阅读字节码。

我们阅读汇编代码，需要先理解CPU的体系架构，然后再分析特定汇编指令的具体含义，同样，要了解怎么阅读字节码，我们就需要理解V8解释器的整体设计架构，然后再来分析特定的字节码指令的含义。接下来，我们就依次介绍这两部分内容。

因为解释器就是模拟物理机器来执行字节码的，比如可以实现如取指令、解析指令、执行指令、存储数据等，所以解释器的执行架构和CPU处理机器代码的架构类似（关于CPU是如何执行机器代码的，你可以参看《10｜机器代码：二进制机器码究竟是如何被CPU执行的？》这节课）。

通常有两种类型的解释器，基于栈(Stack-based)和基于寄存器(Register-based)，基于栈的解释器使用栈来保存函数参数、中间运算结果、变量等，基于寄存器的虚拟机则支持寄存器的指令操作，使用寄存器来保存参数、中间计算结果。

通常，基于栈的虚拟机也定义了少量的寄存器，基于寄存器的虚拟机也有堆栈，其区别体现在它们提供的指令集体系。

大多数解释器都是基于栈的，比如Java虚拟机，.Net虚拟机，还有早期的V8虚拟机。基于堆栈的虚拟机在处理函数调用、解决递归问题和切换上下文时简单明快。

而现在的V8虚拟机则采用了基于寄存器的设计，它将一些中间数据保存到寄存器中，了解这点对于我们分析字节码的执行过程非常重要。

接下来我们就来看看基于寄存器的解释器架构，具体你可以参考下图：

解释器执行时主要有四个模块，内存中的字节码、寄存器、栈、堆。

这和我们介绍过的CPU执行二进制机器代码的模式是类似的：

使用内存中的一块区域来存放字节码；
使用了通用寄存器 r0，r1，r2，…… 这些寄存器用来存放一些中间数据；
PC寄存器用来指向下一条要执行的字节码；
栈顶寄存器用来指向当前的栈顶的位置。

但是我们需要重点注意这里的累加器，它是一个非常特殊的寄存器，用来保存中间的结果，这体现在很多V8字节码的语义上面，我们来看下面这个字节码的指令：

Ldar a1

Ldar表示将寄存器中的值加载到累加器中，你可以把它理解为LoaD Accumulator from Register，就是把某个寄存器中的值，加载到累加器中。那么上面这个指令的意思就是把a1寄存器中的值，加载到累加器中，你可以参看下图：

我们再来看另外一个段字节码指令：

Star r0

Star 表示 Store Accumulator Register，你可以把它理解为Store Accumulator to Register，就是把累加器中的值保存到某个寄存器中，上面这段代码的意思就是将累加器中的数值保存到r0寄存器中，具体流程你可以参看下图：

我们再来看一个执行加法的字节码：

Add a0, [0]

Add a0, [0]是从a0寄存器加载值并将其与累加器中的值相加，然后将结果再次放入累加器，最终操作如下图所示：

你可能会注意到，add a0 后面还跟了一个[0]，这个符号是做什么的呢？

这个称之为feedback vector slot，中文我们可以称为反馈向量槽，它是一个数组，解释器将解释执行过程中的一些数据类型的分析信息都保存在这个反馈向量槽中了，目的是为了给TurboFan优化编译器提供优化信息，很多字节码都会为反馈向量槽提供运行时信息，这块内容我们会在下一节来介绍。

在上面的字节码中，还有一个：

LdaSmi [2]

这是将小整数（Smi）2 加载到累加器寄存器中，操作流程你可以参看下图：

我们再来看一个字节码：

Return

Return 结束当前函数的执行，并将控制权传回给调用方。返回的值是累加器中的值。

好了，上面我们分析了几个常见的字节码的含义，相信你已经发现了，大部分字节码都间接地使用了累加器，认识到累加器在字节码指令中的使用方式之后，再去认识V8中的字节码就会非常轻松了。

完整分析一段字节码

接下来，我们完整地分析一段字节码是怎么执行的：

StackCheck
Ldar a1
Add a0, [0]
Star r0
LdaSmi [2]
Star r1
Ldar r0
Return

执行这段代码时，整体的状态如下图所示：

我们可以看到：

参数对象parameter保存在栈中，包含了a0和a1两个值，在上面的代码中，这两个值分别是1和2；
PC寄存器指向了第一个字节码StackCheck，我们知道，V8在执行一个函数之前，会判断栈是否会溢出，这里的StackCheck字节码指令就是检查栈是否达到了溢出的上限，如果栈增长超过某个阈值，我们将中止该函数的执行并抛出一个RangeError，表示栈已溢出。

然后继续执行下一条字节码，Ldar a1，这是将a1寄存器中的参数值加载到累加器中，这时候第一个参数就保存到累加器中了。

接下来执行加法操作，Add a0, [0]，因为a0是第一个寄存器，存放了第一个参数，Add a0就是将第一个寄存器中的值和累加器中的值相加，也就是将累加器中的2和通用寄存器中a0中的1进行相加，同时将相加后的结果3保存到累加器中。

现在累加器中就保存了相加后的结果，然后执行第四段字节码，Star r0，这是将累加器中的值，也就是1+2的结果3保存到寄存器r0中，那么现在寄存器r0中的值就是3了。

然后将常数2加载到累加器中，又将累加器中的2加载到寄存器r1中，我们发现这里两段代码可能没实际的用途，不过V8生成的字节码就是这样。

接下来V8将寄存器r0中的值加载到累加器中，然后执行最后一句Return指令，Return指令会中断当前函数的执行，并将累加器中的值作为返回值。

这样V8就执行完成了add函数。

总结

今天我们先分析了V8是如何生成字节码的，有了字节码，V8的解释器就可以解释执行字节码了。通常有两种架构的解释器，基于栈的和基于寄存器的。基于栈的解释器会将一些中间数据存放到栈中，而基于寄存器的解释器会将一些中间数据存放到寄存器中。由于采用了不同的模式，所以字节码的指令形式是不同的。

而目前版本的V8是基于寄存器的，所以我们又重点分析了基于寄存器的解释器的架构，这些寄存器和CPU中的寄存器类似，不过这里有一个特别的寄存器，那就是累加器。在操作过程中，一些中间结果都默认放到累加器中，比如Ldar a1就是将第二个参数加载到累加器中，Star r0是将累加器中的值写入到r0寄存器中，Return就是返回累加器中的数值。

理解了累加器的重要性，我们又分析了一些常用字节码指令，这包括了Ldar、Star、Add、LdaSmi、Return，了解了这些指令是怎么工作的之后，我们就可以完整地分析一段字节码的工作流程了。

思考题

观察下面这段代码：

function foo() {
var d = 20
return function inner(a, b) {
const c = a + b + d
return c
}
}
const f = foo()
f(1,2)

请你课后利用d8生成字节码，然后分析字节码的执行流程，欢迎你在留言区与我分享讨论。

感谢你的阅读，如果你觉得这一讲的内容对你有所启发，也欢迎把它分享给你的朋友。

精选留言（15）

Shine 👍（10） 💬（4）
老师我有一个疑问：'Ldar a1表示将寄存器中的值加载到累加器中' a1的值不是在栈里面吗？不是直接从栈中加载到累加器吗？
2020-04-18

木山 👍（5） 💬（1）
老师下午好, 我来这里催加餐了(笑),
2020-04-17

chris 👍（4） 💬（2）
另外请问老师对jvm的字节码熟悉吗，能否推荐一些jvm字节码与v8字节码的比较的资料。目前看到的差异是1）基于栈和基于寄存器，2）v8字节码带了feedback vector。不知还有什么其他的差异。两者之间能否相互表示。openjdk里面自带的nashorn就是一个用java实现的js引擎，它是把js翻译成java字节码吗？
2020-04-17

灰的更高 👍（1） 💬（1）
老师，我在这次的课件中看到了，小整型smi。我之前在看书的时候看到了v8的数据表示，书上说smi直接使用前32位进行数值表示，后32位为句柄且最后一位标记位是1，除了smi其他的类型都是存放的指针句柄最后一位是0，但是我不清楚这个其他类型存档指针是什么格式，然后又怎么样和咱们课程里面的内容联系在一起呢，麻烦您能简单介绍一下吗
2020-05-13

Geek_bcfa56 👍（5） 💬（0）
/** [generated bytecode for function: foo (0x32e4082d26c5 <SharedFunctionInfo foo>)] // Creates a new context with number of |slots| for the function closure CreateFunctionContext [0], [1] // 创建函数上下文环境 // Saves the current context in <context>, and pushes the accumulator as the // new current context. PushContext r0 // 保存旧的上下文到r0中，然后把累加器中的内容作为新的上下文 LdaSmi [20] // 加载20到累加器中 StaCurrentContextSlot [2] // 把累加器中的值存储到上下文中的slot 2中 CreateClosure [1], [0], #2 // 创建闭包，并存储在累加器中 Return // 返回累加器中的值 [generated bytecode for function: inner (0x32e4082d28e9 <SharedFunctionInfo inner>)] Ldar a1 // 把a1加载到累加器中 Add a0, [0] // 把累加器中的值和a0相加，即a0+a1 Star r1 // 把累加器中的值存储到r1 // Load the object in |slot_index| of the current context into the accumulator. // 把当前上下文中的slot 2加载到累加器中，即把20(变量d)加载到累加器中 LdaImmutableCurrentContextSlot [2] Add r1, [1] // 把r1跟累加器中的值相加 Star r0 // 把累加器中的值存储到r0 Return // 返回累加器中的值 */
2020-11-26

champ可口可乐了 👍（5） 💬（1）
[generated bytecode for function: add (0x02160824fe59 <SharedFunctionInfo add>)] Parameter count 3 Register count 1 Frame size 8 0x21608250026 @ 0 : 25 02 Ldar a1 0x21608250028 @ 2 : 34 03 00 Add a0, [0] 0x2160825002b @ 5 : 26 fb Star r0 0x2160825002d @ 7 : aa Return Constant pool (size = 0) Handler Table (size = 0) Source Position Table (size = 0) 这是我的Mac平台输出的字节码，好像那2条无用代码被优化掉了。但是，函数开头没有出现 StackCheck，不知道为什么
2020-04-19

Imart 👍（4） 💬（0）
解释器执行字节码 ‘Ldar a1’时，最底层还是会转换为机器码再由 cpu 来吗？这些字节码指令的执行实际需要再调用cpu执行吗？
2020-08-24

奕 👍（3） 💬（0）
在生成作用域那个图里面，参数 x ，y 在堆中进行声明吗？这个不应该也是在栈中的？
2020-04-16

慢慢来的比较快 👍（1） 💬（1）
字节码是所有的代码编译出来的，用于缓存的状态，那么这时还有12节说的延迟解析吗？
2021-03-17

Imart 👍（1） 💬（1）
老师您好，解释器解释执行字节码，为什么之后还需要编译为二进制码给cpu执行？比如 Ldar a1 这句字节码最终是不是也编译为对应的机器码，再给cpu 执行？
2020-08-24

doujiao 👍（1） 💬（1）
我有个问题，参数是什么时候放到栈里的？生成作用域吗？
2020-07-19

奕 👍（1） 💬（1）
解释器执行字节码，是在解释器内部执行吗？底层还需要把指令在放到 CPU执行吗？这里的寄存器是解释器内部的？还是指CPU的寄存器？
2020-04-16

ifelse 👍（0） 💬（0）
学习打卡
2024-06-16

安石 👍（0） 💬（0）
``` Ldar a1 0x21e1000dafc8 @ 2 : 38 03 00 Add a0, [0] 0x21e1000dafcb @ 5 : c3 Star1 0x21e1000dafcc @ 6 : 17 02 LdaImmutableCurrentContextSlot [2] 0x21e1000dafce @ 8 : 38 f9 01 Add r1, [1] 0x21e1000dafd1 @ 11 : c4 Star0 0x21e1000dafd2 @ 12 : a9 Return ``` 将a1加载到累加寄存器从a0寄存器取值和累加寄存器的值相加，并保存读取保存在堆（闭包）上下文变量累加寄存器加上从闭包山下读取的变量将累加寄存器的保存返回结果
2023-05-11

Jerry银银 👍（0） 💬（0）
老师，我有两个疑问： 1、文中提到的寄存器就是计算机真实的寄存器硬件吧。如果是真实的寄存器硬件的话，那不同的机器上（x86，arm) 的解释器设计的时候肯定就要和硬件相关了吧？ 2. 在不考虑JIT的前提下，字节码是被解释器解释执行的，最终需要解释器转化为机器码然后才执行吗？还是说，不会转化为机器码，而是由解释器直接得出最终的结果？静候老师解答~谢谢
2021-11-08