Maison > interface Web > js tutoriel > Comment obtenir les indicateurs de suivi des performances du Node ? Obtenez le partage de méthodes

Comment obtenir les indicateurs de suivi des performances du Node ? Obtenez le partage de méthodes

青灯夜游
Libérer: 2022-04-20 21:06:40
avant
4548 Les gens l'ont consulté

Comment obtenir les indicateurs de suivi de performance de Node ? Cet article vous expliquera comment obtenir des indicateurs de suivi des performances des nœuds. J'espère qu'il vous sera utile !

Comment obtenir les indicateurs de suivi des performances du Node ? Obtenez le partage de méthodes

Récemment, j'apprends le monitoring nodejs Même si je n'ai pas l'énergie d'apprendre à écrire une version simple du monitoring, je ne peux toujours pas m'empêcher de comprendre comment obtenir ces indicateurs (après avoir consulté un. beaucoup d'informations, j'ai l'impression que ce contenu n'est pas disponible sur l'Internet domestique. L'introduction est trop courte. Je suis également en train de trier les points de connaissance des nœuds du serveur, je vais donc les résumer dans cet article et les partager avec vous).

Certains indicateurs de cet article peuvent avoir des problèmes, bienvenue pour échanger. En fait, vous pouvez organiser ces données et les écrire dans une bibliothèque de surveillance et les utiliser dans vos propres projets de petite et moyenne taille. Ensuite, le front-end React dispose d'outils tels que bizcharts et g2, et le front-end dessine lui-même le grand écran de données. Je pense que les dimensions des données collectées par esay Monitor ne sont pas aussi complètes que les nôtres.

Les goulots d'étranglement des performances des serveurs sont généralement les suivants :

  • Utilisation du processeur
  • Charge du processeur
  • Mémoire
  • Disque
  • E/S
  • Débit
  • Taux de requête par seconde QPS (Query Per Second)
  • Journal surveillance/QPS réel
  • Temps de réponse
  • Surveillance des processus

Obtenez des indicateurs de processeur

Utilisation du processeur et charge du processeur, qui peuvent tous deux refléter l'activité d'une machine dans une certaine mesure.

Utilisation du processeur

L'utilisation du processeur correspond aux ressources du processeur occupées par les programmes en cours d'exécution, indiquant comment la machine exécute les programmes à un moment donné. Plus le taux d'utilisation est élevé, cela signifie que la machine exécute actuellement de nombreux programmes, et vice versa. Le niveau d'utilisation est directement lié à la puissance du processeur. Commençons par comprendre les API pertinentes et quelques explications terminologiques pour nous aider à comprendre le code permettant d'obtenir l'utilisation du processeur.

os.cpus()os.cpus()

返回包含有关每个逻辑 CPU 内核的信息的对象数组。

  • model: 一个字符串,指定CPU内核的型号。

  • speed: 一个数字,指定CPU内核的速度(以MHz为单位)。

  • times: 包含以下属性的对象:

    • user  CPU 在用户模式下花费的毫秒数。
    • nice  CPU 在良好模式下花费的毫秒数。
    • sys  CPU 在系统模式下花费的毫秒数。
    • idle  CPU 在空闲模式下花费的毫秒数。
    • irq  CPU 在中断请求模式下花费的毫秒数。

注意:nice值仅用于POSIX。在Windows操作系统上,nice

Renvoie un tableau d'objets contenant des informations sur chaque cœur logique du processeur.

model: Une chaîne spécifiant le modèle du cœur du CPU.

vitesse : Un nombre spécifiant la vitesse du cœur du processeur en MHz. times: Un objet contenant les propriétés suivantes :

user Le nombre de millisecondes passées par le CPU en mode utilisateur.

nice Le nombre de millisecondes passées par le processeur en mode Nice.

sys Le nombre de millisecondes passées par le processeur en mode système. idle Le nombre de millisecondes passées par le processeur en mode inactif.

irq Nombre de millisecondes passées par le processeur en mode demande d'interruption.

Remarque : La valeur nice de est uniquement pour POSIX. Sur les systèmes d'exploitation Windows, la valeur nice est toujours 0 pour tous les processeurs.

Lorsque vous voyez l'utilisateur et les champs sympas, certains étudiants sont confus quant aux avantages, et moi aussi, j'ai donc soigneusement vérifié leur signification, veuillez continuer.

user

user représente la proportion de temps pendant lequel le processeur fonctionne en

mode utilisateur

.

L'exécution du processus d'application est divisée en mode utilisateur

et 🎜mode noyau🎜 : le processeur exécute la logique de code du processus d'application lui-même en mode utilisateur, généralement des 🎜logiques🎜 ou des 🎜calculs numériques🎜 ; lancé en mode noyau🎜 Appel système 🎜, généralement en réponse à une demande de ressources d'un processus. 🎜🎜Un programme en espace utilisateur est tout processus qui ne fait pas partie du noyau. Les shells, les compilateurs, les bases de données, les serveurs Web et les programmes liés au bureau sont tous des processus de l'espace utilisateur. Si le processeur n'est pas inactif, il est normal que la majeure partie du temps CPU soit consacrée à l'exécution de processus en espace utilisateur. 🎜🎜nice🎜🎜nice représente la proportion de temps pendant laquelle le processeur fonctionne en 🎜mode utilisateur à faible priorité🎜 Une faible priorité signifie que la valeur nice du processus est inférieure à 0. 🎜🎜system🎜🎜user représente la proportion de temps pendant lequel le processeur fonctionne en 🎜mode noyau🎜. 🎜🎜De manière générale, l'utilisation du processeur en 🎜mode noyau🎜 ne devrait pas être trop élevée, à moins que le processus d'application ne lance un grand nombre d'appels système. S'il est trop élevé, cela signifie que l'appel système prend beaucoup de temps, comme des opérations d'E/S fréquentes. 🎜🎜idle🎜🎜idle représente la proportion de temps pendant laquelle le processeur est en état d'inactivité. Dans cet état, le processeur n'a aucune tâche à exécuter. 🎜🎜irq🎜🎜irq représente la proportion de temps pendant laquelle le processeur traite 🎜interruption matérielle🎜. 🎜

Interruption de la carte réseau est un exemple typique : une fois que la carte réseau a reçu le paquet de données, elle informe le processeur via une interruption matérielle pour le traitement. Si le trafic réseau du système est très important, vous pouvez observer une augmentation significative de l'utilisation de l'irq.

Conclusion :

L'état de l'utilisateur est inférieur à 70 %, l'état du noyau est inférieur à 35 % et l'état global est inférieur à 70 %, ce qui peut être considéré comme un état sain.

L'exemple suivant illustre l'utilisation de la méthode os.cpus() dans Node.js :

Exemple 1 :

// Node.js program to demonstrate the    
// os.cpus() method 
  
// Allocating os module 
const os = require('os'); 
  
// Printing os.cpus() values 
console.log(os.cpus());
Copier après la connexion

Sortie :

[ { model:'Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz',
    speed:2712,
    times:
     { user:900000, nice:0, sys:940265, idle:11928546, irq:147046 } },
  { model:'Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz',
    speed:2712,
    times:
     { user:860875, nice:0, sys:507093, idle:12400500, irq:27062 } },
  { model:'Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz',
    speed:2712,
    times:
     { user:1273421, nice:0, sys:618765, idle:11876281, irq:13125 } },
  { model:'Intel(R) Core(TM) i5-7200U CPU @ 2.50GHz',
    speed:2712,
    times:
     { user:943921, nice:0, sys:460109, idle:12364453, irq:12437 } } ]
Copier après la connexion

Voici le code permettant d'obtenir l'utilisation du processeur

const os = require('os');
const sleep = ms => new Promise(resolve => setTimeout(resolve, ms));

class OSUtils {
  constructor() {
    this.cpuUsageMSDefault = 1000; // CPU 利用率默认时间段
  }

  /**
   * 获取某时间段 CPU 利用率
   * @param { Number } Options.ms [时间段,默认是 1000ms,即 1 秒钟]
   * @param { Boolean } Options.percentage [true(以百分比结果返回)|false] 
   * @returns { Promise }
   */
  async getCPUUsage(options={}) {
    const that = this;
    let { cpuUsageMS, percentage } = options;
    cpuUsageMS = cpuUsageMS || that.cpuUsageMSDefault;
    const t1 = that._getCPUInfo(); // t1 时间点 CPU 信息

    await sleep(cpuUsageMS);

    const t2 = that._getCPUInfo(); // t2 时间点 CPU 信息
    const idle = t2.idle - t1.idle;
    const total = t2.total - t1.total;
    let usage = 1 - idle / total;

    if (percentage) usage = (usage * 100.0).toFixed(2) + "%";

    return usage;
  }

  /**
   * 获取 CPU 瞬时时间信息
   * @returns { Object } CPU 信息
   * user <number> CPU 在用户模式下花费的毫秒数。
   * nice <number> CPU 在良好模式下花费的毫秒数。
   * sys <number> CPU 在系统模式下花费的毫秒数。
   * idle <number> CPU 在空闲模式下花费的毫秒数。
   * irq <number> CPU 在中断请求模式下花费的毫秒数。
   */
  _getCPUInfo() {
    const cpus = os.cpus();
    let user = 0, nice = 0, sys = 0, idle = 0, irq = 0, total = 0;

    for (let cpu in cpus) {
      const times = cpus[cpu].times;
      user += times.user;
      nice += times.nice;
      sys += times.sys;
      idle += times.idle;
      irq += times.irq;
    }

    total += user + nice + sys + idle + irq;

    return {
      user,
      sys,
      idle,
      total,
    }
  }
}

const cpuUsage = new OSUtils().getCPUUsage({ percentage: true });
console.log(&#39;cpuUsage: &#39;, cpuUsage.then(data=>console.log(data)));  // 我的电脑是6.15%
Copier après la connexion

Charge CPU

La charge CPU (loadavg) est facile à comprendre. Elle fait référence au nombre de processus occupant du temps CPU et au nombre de processus en attente de temps CPU dans une certaine période de temps. processus en attente d'être réveillé, à l'exclusion des processus en état d'attente.

Avant cela, nous devons apprendre une API de nœud

os.loadavg()os.loadavg()

返回包含 1、5 和 15 分钟平均负载的数组。

平均负载是操作系统计算的系统活动量度,并表示为小数。

平均负载是 Unix 特有的概念。 在 Windows 上,返回值始终为 [0, 0, 0]

Renvoie un tableau contenant la moyenne de charge sur 1, 5 et 15 minutes.

La charge moyenne est une mesure de l'activité du système calculée par le système d'exploitation et exprimée sous forme décimale.

La charge moyenne est un concept propre à Unix. Sous Windows, la valeur de retour est toujours [0, 0, 0]

Elle est utilisée pour décrire l'activité actuelle du système d'exploitation, qui peut être simplement comprise comme le processeur utilisé et en attente de être utilisé par unité de temps Nombre moyen de tâches CPU. La charge du processeur est trop élevée, ce qui indique qu'il y a trop de processus dans Node, cela peut se traduire par le démarrage répété de nouveaux processus à l'aide du module Forbidden City.

const os = require(&#39;os&#39;);
// CPU线程数
const length = os.cpus().length;
// 单核CPU的平均负载,返回一个包含 1、5、15 分钟平均负载的数组
os.loadavg().map(load => load / length);
Copier après la connexion

Indicateur de mémoire

Expliquons d'abord une API, sinon vous ne comprenez pas notre code pour obtenir des indicateurs de mémoire
  • process.memoryUsage():
  • Cette fonction renvoie 4 paramètres, les significations et les différences sont les suivantes :
    • rss : (Resident Set Size) La taille totale de la mémoire allouée au processus par le système d'exploitation. Inclut tous les objets et codes C++ et JavaScript. (Par exemple, pile et segment de code)
    • heapTotal : La taille totale du tas, comprenant 3 parties,
    • mémoire allouée, utilisée pour la création et le stockage d'objets, correspondant à heapUsed
  • non alloué mais disponible pour l'allocation Mémoire
  • Mémoire qui n'est pas allouée mais ne peut pas être allouée, comme la fragmentation de la mémoire entre les objets avant le garbage collection (GC)

heapUsed : la mémoire allouée, qui est la taille totale de tous les objets dans le tas, est un enfant de l'ensemble heapTotal.

externe : La mémoire occupée par la bibliothèque de liens système utilisée par le processus. Par exemple, le tampon correspond aux données en externe. Les données tampon sont différentes des autres objets dans la mesure où elles ne passent pas par le mécanisme d'allocation de mémoire de V8, il n'y a donc pas de limite de taille de mémoire tas.

Utilisez le code suivant pour imprimer l'utilisation de la mémoire d'un processus enfant. On peut voir que rss est à peu près égal au RES de la commande top. De plus, la mémoire du processus principal n'est que de 33 Mo, ce qui est plus petit que la mémoire du processus enfant. On peut voir que leur utilisation de la mémoire est calculée indépendamment.

var showMem = function(){
   var mem = process.memoryUsage();
   var format = function(bytes){
       return (bytes / 1024 / 1024).toFixed(2) + &#39; MB&#39;;
   };
   console.log(&#39;Process: heapTotal &#39; + format(mem.heapTotal) + &#39; heapUsed &#39; + format(mem.heapUsed) + &#39; rss &#39; + format(mem.rss) + &#39; external:&#39; + format(mem.external));
   console.log(&#39;-----------------------------------------------------------&#39;);
};
Copier après la connexion

Pour Node, une fois qu'une fuite de mémoire se produit, il n'est pas si facile de la dépanner. S'il est surveillé que la mémoire augmente seulement mais ne diminue pas, il doit y avoir un problème de fuite de mémoire. Une utilisation saine de la mémoire devrait augmenter et diminuer. Il augmente lorsque l'accès est important, et l'accès retombe

Code pour obtenir l'indicateur de mémoire

const os = require(&#39;os&#39;);
// 查看当前 Node 进程内存使用情况
const { rss, heapUsed, heapTotal } = process.memoryUsage();
// 获取系统空闲内存
const systemFree = os.freemem();
// 获取系统总内存
const systemTotal = os.totalmem();

module.exports = {
  memory: () => {
    return {
      system: 1 - systemFree / systemTotal,  // 系统内存占用率
      heap: heapUsed / headTotal,   // 当前 Node 进程内存占用率
      node: rss / systemTotal,         // 当前 Node 进程内存占用系统内存的比例
    }
  }
}
Copier après la connexion

Indicateur d'espace disque
  • La surveillance du disque surveille principalement l'utilisation du disque. En raison de l'écriture fréquente des journaux, l'espace disque est progressivement utilisé. Une fois que le disque ne suffit pas, cela entraînera divers problèmes dans le système. Définissez une limite supérieure pour l'utilisation du disque. Une fois que l'utilisation du disque dépasse la valeur d'avertissement, l'administrateur du serveur doit organiser les journaux ou nettoyer le disque.
  • Le code suivant fait référence à easy monitor3.0
  • Utilisez d'abord df -P pour obtenir tous les états du disque. Ce -P sert à éviter les sauts de ligne
  • startsWith('/') garantit qu'il s'agit d'un vrai disque, pas. une ligne virtuelle. match(/(d+)%s+(/.*$)/) => Faites correspondre l'état du disque et le disque monté, tel que '1% /System/Volumes/Preboot'

match[ 1] est une chaîne, ce qui signifie Utilisation, match[2] représente le nom du disque monté

const { execSync } = require(&#39;child_process&#39;);
const result = execSync(&#39;df -P&#39;, { encoding: &#39;utf8&#39;})
const lines = result.split(&#39;\n&#39;);
const metric = {};
lines.forEach(line => {
  if (line.startsWith(&#39;/&#39;)) {
    const match = line.match(/(\d+)%\s+(\/.*$)/);
    if (match) {
      const rate = parseInt(match[1] || 0);
      const mounted = match[2];
      if (!mounted.startsWith(&#39;/Volumes/&#39;) && !mounted.startsWith(&#39;/private/&#39;)) {
        metric[mounted] = rate;
      }
    }
  }
});
console.log(metric)
Copier après la connexion

Indicateur d'E/S

La charge d'E/S fait principalement référence aux E/S du disque. Cela reflète la situation de lecture et d'écriture sur le disque. Pour les applications écrites par Node, qui sont principalement destinées aux services réseau, il est peu probable que la charge d'E/S soit trop élevée. La pression d'E/S de nombreuses lectures provient de la base de données. .

Comment obtenir les indicateurs de suivi des performances du Node ? Obtenez le partage de méthodesPour obtenir les indicateurs d'E/S, nous devons comprendre une commande Linux appelée iostat. Si elle n'est pas installée, vous devez l'installer. Voyons pourquoi cette commande peut refléter les indicateurs d'E/S

iostat -dx
Copier après la connexion

.

Description de l'attribut
    rrqm/s: 每秒进行 merge 的读操作数目。即 rmerge/s(每秒对该设备的读请求被合并次数,文件系统会对读取同块(block)的请求进行合并)
    wrqm/s: 每秒进行 merge 的写操作数目。即 wmerge/s(每秒对该设备的写请求被合并次数)
    r/s: 每秒完成的读 I/O 设备次数。即 rio/s
    w/s: 每秒完成的写 I/O 设备次数。即 wio/s
    rsec/s: 每秒读扇区数。即 rsect/s
    wsec/s: 每秒写扇区数。即 wsect/s
    rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。
    wkB/s: 每秒写K字节数。是 wsect/s 的一半。
    avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。
    avgqu-sz: 平均I/O队列长度。
    await: 平均每次设备I/O操作的等待时间 (毫秒)。
    svctm: 平均每次设备I/O操作的处理时间 (毫秒)。
    %util: 一秒中有百分之多少的时间用于 I/O 操作,即被io消耗的cpu百分比
    Copier après la connexion
  • Il suffit de surveiller %util

    Si %util est proche de 100%

    , cela signifie que trop de requêtes d'E/S sont générées, le 🎜Le système d'E/S est déjà plein🎜 , et il peut y avoir un goulot d'étranglement sur le disque. 🎜
  • 如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响应时间变慢,如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU。

响应时间RT监控

监控Nodejs的页面响应时间, 方案选自廖雪峰老师的博客文章。

最近想监控一下Nodejs的性能。记录分析Log太麻烦,最简单的方式是记录每个HTTP请求的处理时间,直接在HTTP Response Header中返回。

记录HTTP请求的时间很简单,就是收到请求记一个时间戳,响应请求的时候再记一个时间戳,两个时间戳之差就是处理时间。

但是,res.send()代码遍布各个js文件,总不能把每个URL处理函数都改一遍吧。

正确的思路是用middleware实现。但是Nodejs没有任何拦截res.send()的方法,怎么破?

其实只要稍微转换一下思路,放弃传统的OOP方式,以函数对象看待res.send(),我们就可以先保存原始的处理函数res.send,再用自己的处理函数替换res.send:

app.use(function (req, res, next) {
    // 记录start time:
    var exec_start_at = Date.now();
    // 保存原始处理函数:
    var _send = res.send;
    // 绑定我们自己的处理函数:
    res.send = function () {
        // 发送Header:
        res.set(&#39;X-Execution-Time&#39;, String(Date.now() - exec_start_at));
        // 调用原始处理函数:
        return _send.apply(res, arguments);
    };
    next();
});
Copier après la connexion

只用了几行代码,就把时间戳搞定了。

对于res.render()方法不需要处理,因为res.render()内部调用了res.send()。

调用apply()函数时,传入res对象很重要,否则原始的处理函数的this指向undefined直接导致出错。

实测首页响应时间9毫秒

监控吞吐量/每秒查询率 QPS

名词解释:

一、QPS,每秒查询

QPS:Queries Per Second意思是“每秒查询率”,是一台服务器每秒能够响应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。

互联网中,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。

二、TPS,每秒事务

TPS:是TransactionsPerSecond的缩写,也就是事务数/秒。它是软件测试结果的测量单位。一个事务是指一个客户机向服务器发送请求然后服务器做出反应的过程。客户机在发送请求时开始计时,收到服务器响应后结束计时,以此来计算使用的时间和完成的事务个数。

QPS vs TPS:QPS基本类似于TPS,但是不同的是,对于一个页面的一次访问,形成一个TPS;但一次页面请求,可能产生多次对服务器的请求,服务器对这些请求,就可计入“QPS”之中。如,访问一个页面会请求服务器2次,一次访问,产生一个“T”,产生2个“Q”。

三、RT,响应时间

响应时间:执行一个请求从开始到最后收到响应数据所花费的总体时间,即从客户端发起请求到收到服务器响应结果的时间。

响应时间RT(Response-time),是一个系统最重要的指标之一,它的数值大小直接反应了系统的快慢。

四、并发数

并发数是指系统同时能处理的请求数量,这个也是反应了系统的负载能力。

五、吞吐量

系统的吞吐量(承压能力)与request对CPU的消耗、外部接口、IO等等紧密关联。单个request 对CPU消耗越高,外部系统接口、IO速度越慢,系统吞吐能力越低,反之越高。

系统吞吐量几个重要参数:QPS(TPS)、并发数、响应时间。

  • QPS(TPS):(Query Per Second)每秒钟request/事务 数量

  • 并发数: 系统同时处理的request/事务数

  • 响应时间: 一般取平均响应时间

理解了上面三个要素的意义之后,就能推算出它们之间的关系:

  • QPS(TPS)= 并发数/平均响应时间
  • 并发数 = QPS*平均响应时间

六、实际举例

我们通过一个实例来把上面几个概念串起来理解。按二八定律来看,如果每天 80% 的访问集中在 20% 的时间里,这 20% 时间就叫做峰值时间。

  • 公式:( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS)
  • 机器:峰值时间每秒QPS / 单台机器的QPS = 需要的机器

1、每天300w PV 的在单台机器上,这台机器需要多少QPS?
( 3000000 * 0.8 ) / (86400 * 0.2 ) = 139 (QPS)

2、如果一台机器的QPS是58,需要几台机器来支持?
139 / 58 = 3

到这里,以后如果你做一般中小项目的前端架构,在部署自己的node服务,就知道需要多少机器组成集群来汇报ppt了吧,哈哈,有pv就能推算一个初略值。

我们需要了解一下压力测试(我们要靠压测获取qps),以ab命令为例:

命令格式:

ab [options] [http://]hostname[:port]/path
Copier après la connexion

常用参数如下:

-n requests 总请求数
-c concurrency 并发数
-t timelimit 测试所进行的最大秒数, 可以当做请求的超时时间
-p postfile 包含了需要POST的数据的文件
-T content-type POST数据所使用的Content-type头信息复制代码
Copier après la connexion

更多参数请查看官方文档。

http://httpd.apache.org/docs/2.2/programs/ab.html

例如测试某个GET请求接口:

ab -n 10000 -c 100 -t 10 "http://127.0.0.1:8080/api/v1/posts?size=10"
Copier après la connexion

得到一下数据:

Comment obtenir les indicateurs de suivi des performances du Node ? Obtenez le partage de méthodes

我们从中获取几个关键指标:

  • 吞吐率(Requests per second)在图上有显示

服务器并发处理能力的量化描述,单位是reqs/s,指的是在某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。

记住:吞吐率是基于并发用户数的。这句话代表了两个含义:

  • a、吞吐率和并发用户数相关
  • b、不同的并发用户数下,吞吐率一般是不同的

计算公式:

总请求数/处理完成这些请求数所花费的时间
Copier après la connexion

必须要说明的是,这个数值表示当前机器的整体性能,值越大越好。

2、QPS每秒查询率(Query Per Second)

  每秒查询率QPS是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准,在因特网上,作为域名系统服务器的机器的性能经常用每秒查询率来衡量,即每秒的响应请求数,也即是最大吞吐能力。

计算公式

QPS(TPS)= 并发数/平均响应时间(Time per request)
Copier après la connexion

在上图里有Time per request的值,然后我们也有并发数数据,就可以计算出QPS。

这个QPS是压测数据,真实的qps,可使用日志监控来获取。

日志监控

通常情况下,随着系统的运行,我们的后台服务会产生各种日志,应用程序会产生应用程序的访问日志、错误日志,运行日志,网络日志,我们需要一个展示平台去展示这些日志。

后端一般都用比如ELk去展示,我们前端都是ui老手了,自己可以画定制的UI界面,不多说了,主要是日志本身要打印符合一定的规范,这样格式化的数据更利于分析和展示。

并且业务逻辑型的监控主要体现在日志上。通过监控异常日志文件的变动,将新增的异常按异常类型和数量反映出来。某些异常与具体的某个子系统相关,监控出现的某个异常也能反映出子系统的状态。

在体制监控里也能体现出实际业务的QPS值。观察QPS的表现能够检查业务在时间上的分部。

此外,从访问日志中也能实现PV和UV的监控。并且可以从中分析出使用者的习惯,预知访问高峰。

响应时间

这个也可以通过访问日志来获取,并且真实响应时间是需要在controller上打log的。

进程监控

监控进程一般是检查操作系统中运行的应用进程数,比如对于采用多进程架构的node应用,就需要检查工作进程的数量,如果低于预期值,就当发出报警。

查看进程数在linux下很简单,

假如我们通过Node 提供 child_process 模块来实现多核 CPU 的利用。child_process.fork() 函数来实现进程的复制。

worker.js 代码如下:

var http = require(&#39;http&#39;)\
http.createServer(function(req, res) {\
res.writeHead(200, { &#39;Content-Type&#39;: &#39;text/plain&#39; })\
res.end(&#39;Hello World\n&#39;)\
}).listen(Math.round((1 + Math.random()) * 1000), &#39;127.0.0.1&#39;)\
Copier après la connexion

通过 node worker.js 启动它,会监听 1000 到 2000 之间的一个随机端口。

master.js 代码如下:

var fork = require(&#39;child_process&#39;).fork
var cpus = require(&#39;os&#39;).cpus()
for (var i = 0; i < cpus.length; i++) {
  fork(&#39;./worker.js&#39;)
}
Copier après la connexion

查看进程数的 命令如下:

ps aux | grep worker.js
Copier après la connexion
$ ps aux | grep worker.js
lizhen 1475 0.0 0.0 2432768 600 s003 S+ 3:27AM 0:00.00 grep worker.js\
lizhen 1440 0.0 0.2 3022452 12680 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js\
lizhen 1439 0.0 0.2 3023476 12716 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js\
lizhen 1438 0.0 0.2 3022452 12704 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js\
lizhen 1437 0.0 0.2 3031668 12696 s003 S 3:25AM 0:00.15 /usr/local/bin/node ./worker.js\
Copier après la connexion

更多node相关知识,请访问:nodejs 教程

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:juejin.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal