为什么需要性能监控？聊聊Node.js性能监控-js教程-PHP中文网

为什么需要性能监控？下面本篇就来带大家了解一下Node.js性能监控，希望对大家有所帮助！

为什么需要性能监控？聊聊Node.js性能监控

Node作为Javascript在服务端的一个运行时（Runtime），极大的丰富了Javascript的应用场景。

但是Node.js Runtime本身是一个黑盒，我们无法感知运行时的状态，对于线上问题也难以复现。

因此性能监控是Node.js应用程序「正常运行」的基石。不仅可以随时监控运行时的各项指标，还可以帮助排查异常场景问题。

性能监控可以分为两个部分：

性能指标的采集和展示
- 进程级别的数据：CPU，Memory，Heap，GC等
- 系统级别的数据：磁盘占用率，I/O负载，TCP/UDP连接状态等
- 应用层的数据：QPS，慢HTTP，业务处理链路日志等
性能数据的抓取和分析
- Heapsnapshot：堆内存快照
- Cpuprofile：CPU快照
- Coredump：应用崩溃快照

从上图可以看到目前主流的三种Node.js性能监控方案的优缺点，以下是简单介绍这三种方案的组成：

Prometheus
- prom-client是prometheus的nodejs实现，用于采集性能指标
- grafana是一个可视化平台，用来展示各种数据图表，支持prometheus的接入
- 只支持了性能指标的采集和展示，排查问题还需要其他快照工具，才能组成闭环
AliNode
- alinode是一个兼容官方nodejs的拓展运行时，提供了一些额外功能：
  - v8的运行时内存状态监控
  - libuv的运行时状态监控
  - 在线故障诊断功能：堆快照、CPU Profile、GC Trace等
- agenthub是一个常驻进程，用来收集性能指标并上报
  - 整合了agentx + commdx的便利工具
- 整体从监控，展示，快照，分析形成闭环，接入便捷简单，但是拓展运行时还是有风险
Easy-Monitor
- xprofiler 负责进行实时的运行时状态采样，以及输出性能日志（也就是性能数据的抓取）
- xtransit 负责性能日志的采集与传输
- 跟AliNode最大的区别在于使用了Node.js Addon来实现采样器

性能指标

通过process.cpuUsage()可以获取当前进程的CPU耗时数据，返回值的单位是微秒

通过process.memoryUsage()可以获取当前进程的内存分配数据，返回值的单位是字节

从上图可以看出，rss包含代码段(Code Segment)、栈内存(Stack)、堆内存(Heap)

通过v8.getHeapStatistics()和v8.getHeapSpaceStatistics()可以获取v8堆内存和堆空间的分析数据，下图展示了v8的堆内存组成分布：

堆内存空间先划分为空间（space），空间又划分为页（page），内存按照1MB对齐进行分页。

New Space：新生代空间，用来存放一些生命周期比较短的对象数据，平分为两个空间（空间类型为semi space）：from space，to space
- 晋升条件：在New space中经过两次GC依旧存活
Old Space：老生代空间，用来存放New Space晋升的对象
Code Space：存放v8 JIT编译后的可执行代码
Map Space：存放Object指向的隐藏类的指针对象，隐藏类指针是v8根据运行时记录下的对象布局结构，用于快速访问对象成员
Large Object Space：用于存放大于1MB而无法分配到页的对象

v8的垃圾回收算法分为两类：

前提：New space分为from和to两个对象空间

触发时机：当New space空间满了

步骤：

适用于回收频繁，内存不大的对象，典型的空间换时间的策略，缺点是浪费了多一倍的空间

三个步骤：标记、清除、整理

触发时机：当Old space空间满了

步骤：

Marking（三色标记法）
- 白色：代表可回收对象
- 黑色：代表不可回收对象，且其所产生的引用都已经扫描完毕
- 灰色：代表不可回收对象，且其所产生的引用还没扫描完
- 将V8根对象直接引用的对象放进一个marking queue（显式栈）中，并将这些对象标记为灰色
- 从这些对象开始做深度优先遍历，每访问一个对象，将该对象从marking queue pop出来，并标记为黑色
- 然后将该对象引用下的所有白色对象标记为灰色，push到marking queue上，如此往复
- 直到栈上所有对象都pop掉为止，老生代的对象只剩下黑色（不可回收）和白色（可以回收）两种了
- PS：当一个对象太大，无法push到空间有限的栈时，v8会把这个对象保留灰色跳过，将整个栈标记为溢出状态（overflowed），等栈清空后，再次进行遍历标记，这样导致需要额外扫描一遍堆
Sweep
- 清除白色对象
- 会造成内存空间不连续
Compact
- 由于Sweep会造成内存空间不连续，不利于新对象进入GC
- 把黑色（存活）对象移到Old space的一端，这样清除出来的空间就是连续完整的
- 虽然可以解决内存碎片问题，但是会增加停顿时间（执行速度慢）
- 在空间不足以对新生代晋升过来的对象进行分配时才使用mark-compact