• 技术文章 >web前端 >js教程

    浅析Node高并发的原理

    青灯夜游青灯夜游2022-10-18 20:53:17转载249

    大前端成长进阶课程:进入学习

    我们先来看几个常见的说法

    在具体分析这几个说法是不是、为什么之前,我们先来做一些准备工作

    从头聊起

    一个常见web应用会做哪些事情

    一个典型的传统web应用实现


    多进程web应用示例伪代码

    listenFd = new Socket(); // 创建监听socket
    Bind(listenFd, 80); // 绑定端口
    Listen(listenFd);   // 开始监听
    
    for ( ; ; ) {
        // 接收客户端请求,通过新的socket建立连接
        connFd = Accept(listenFd);
        // fork子进程
        if ((pid = Fork()) === 0) {
            // 子进程中
            // BIO读取网络请求数据,阻塞,发生进程调度
            request = connFd.read();
            // BIO读取本地文件,阻塞,发生进程调度
            content = ReadFile('test.txt');
            // 将文件内容写入响应
            Response.write(content);
        }
    }

    多线程应用实际上和多进程类似,只不过将一个请求分配一个进程换成了一个请求分配一个线程。线程对比进程更轻量,在系统资源占用上更少,上下文切换(ps:所谓上下文切换,稍微解释一下:单核心CPU的情况下同一时间只能执行一个进程或线程中的任务,而为了宏观上的并行,则需要在多个进程或线程之间按时间片来回切换以保证各进、线程都有机会被执行)的开销也更小;同时线程间更容易共享内存,便于开发

    上文中提到了web应用的两个核心要点,一个是进(线)程模型,一个是I/O模型。那阻塞I/O到底是什么?又有哪些其他的I/O模型呢?别着急,首先我们看一下什么是阻塞

    什么是阻塞?什么是阻塞I/O?

    简而言之,阻塞是指函数调用返回之前,当前进(线)程会被挂起,进入等待状态,在这个状态下,当前进(线)程暂停运行,引起CPU的进(线)程调度。函数只有在内部工作全部执行完成后才会返回给调用者

    所以阻塞I/O是,应用程序通过API调用I/O操作后,当前进(线)程将会进入等待状态,代码无法继续往下执行,这时CPU可以进行进(线)程调度,即切换到其他可执行的进(线)程继续执行,当前进(线)程在底层I/O请求处理完后才会返回并可以继续执行

    多进(线)程 + 阻塞I/O模型有什么问题?

    在了解了什么是阻塞和阻塞I/O后,我们来分析一下传统web应用多进(线)程 + 阻塞I/O模型有什么弊端。

    因为一个请求需要分配一个进(线)程,这样的系统在并发量大时需要维护大量进(线)程,且需要进行大量的上下文切换,这都需要大量的CPU、内存等系统资源支撑,所以在高并发请求进来时CPU和内存开销会急剧上升,可能会迅速拖垮整个系统导致服务不可用

    nodejs应用实现

    接下来我们看看nodejs应用是如何实现的。

    const net = require('net');
    const server = net.createServer();
    const fs = require('fs');
    
    server.listen(80);  // 监听端口
    // 监听事件建立连接
    server.on('connection', (socket) => {
        // 监听事件读取请求数据
        socket.on('data', (data) => {
        // 异步读取本地文件
        fs.readFile('test.txt', (err, data) => {
                // 将读取的内容写入响应
                socket.write(data);
                socket.end();
            })
        });
    });

    可以看到在nodejs中,我们可以以异步的方式去进行I/O操作,通过API调用I/O操作后会马上返回,紧接着就可以继续执行其他代码逻辑,那为什么nodejs中的I/O是“非阻塞”的呢?回答这个问题之前我们再做一些准备工作,参考nodejs进阶视频讲解:进入学习

    read操作基本步骤

    首先看下一个read操作需要经历哪些步骤

    接下来我们看一下操作系统中有哪些I/O模型

    几种I/O模型

    阻塞式I/O

    1.png


    非阻塞式I/O

    2.png


    I/O多路复用(进程可同时监听多个I/O设备就绪)

    3.png


    信号驱动I/O

    4.png


    异步I/O

    5.png


    那么nodejs里到底使用了哪种I/O模型呢?是上图中的“非阻塞I/O”吗?别着急,先接着往下看,我们来了解下nodejs的体系结构

    nodejs体系结构,线程、I/O模型分析

    6.png

    最上面一层是就是我们编写nodejs应用代码时可以使用的API库,下面一层则是用来打通nodejs和它所依赖的底层库的一个中间层,比如实现让js代码可以调用底层的c代码库。来到最下面一层,可以看到前端同学熟悉的V8,还有其他一些底层依赖。注意,这里有一个叫libuv的库,它是干什么的呢?从图中也能看出,libuv帮助nodejs实现了底层的线程池、异步I/O等功能。libuv实际上是一个跨平台的c语言库,它在windows、linux等不同平台下会调用不同的实现。我这里主要分析linux下libuv的实现,因为我们的应用大部分时候还是运行在linux环境下的,且平台间的差异性并不会影响我们对nodejs原理的分析和理解。好了,对于nodejs在linux下的I/O模型来说,libuv实际上提供了两种不同场景下的不同实现,处理网络I/O主要由epoll函数实现(其实就是I/O多路复用,在前面的图中使用的是select函数来实现I/O多路复用,而epoll可以理解为select函数的升级版,这个暂时不做具体分析),而处理文件I/O则由多线程(线程池) + 阻塞I/O模拟异步I/O实现


    下面是一段我写的nodejs底层实现的伪代码帮助大家理解

    listenFd = new Socket();    // 创建监听socket
    Bind(listenFd, 80); // 绑定端口
    Listen(listenFd);   // 开始监听
    
    for ( ; ; ) {
        // 阻塞在epoll函数上,等待网络数据准备好
        // epoll可同时监听listenFd以及多个客户端连接上是否有数据准备就绪
        // clients表示当前所有客户端连接,curFd表示epoll函数最终拿到的一个就绪的连接
        curFd = Epoll(listenFd, clients);
    
        if (curFd === listenFd) {
            // 监听套接字收到新的客户端连接,创建套接字
            int connFd = Accept(listenFd);
            // 将新建的连接添加到epoll监听的list
            clients.push(connFd);
        }
    
        else {
            // 某个客户端连接数据就绪,读取请求数据
            request = curFd.read();
            // 这里拿到请求数据后可以发出data事件进入nodejs的事件循环
            ...
        }
    }
    
    // 读取本地文件时,libuv用多线程(线程池) + BIO模拟异步I/O
    ThreadPool.run((callback) => {
        // 在线程里用BIO读取文件
        String content = Read('text.txt');  
        // 发出事件调用nodejs提供的callback
    });

    通过I/O多路复用 + 多线程模拟的异步I/O配合事件循环机制,nodejs就实现了单线程处理并发请求并且不会阻塞。所以回到之前所说的“非阻塞I/O”模型,实际上nodejs并没有直接使用通常定义上的非阻塞I/O模型,而是I/O多路复用模型 + 多线程BIO。我认为“非阻塞I/O”其实更多是对nodejs编程人员来说的一种描述,从编码方式和代码执行顺序上来讲,nodejs的I/O调用的确是“非阻塞”的

    总结

    至此我们应该可以了解到,nodejs的I/O模型其实主要是由I/O多路复用和多线程下的阻塞I/O两种方式一起组成的,而应对高并发请求时发挥作用的主要就是I/O多路复用。好了,那最后我们来总结一下nodejs线程模型和I/O模型对比传统web应用多进(线)程 + 阻塞I/O模型的优势和劣势

    更多node相关知识,请访问:nodejs 教程

    以上就是浅析Node高并发的原理的详细内容,更多请关注php中文网其它相关文章!

    声明:本文转载于:掘金社区,如有侵犯,请联系admin@php.cn删除

    前端(VUE)零基础到就业课程:点击学习

    清晰的学习路线+老师随时辅导答疑

    自己动手写 PHP MVC 框架:点击学习

    快速了解MVC架构、了解框架底层运行原理

    专题推荐:nodejs node 高并发
    上一篇:聊聊Angular中懒加载模块并动态显示它的组件 下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)

    相关文章推荐

    • ❤️‍🔥共22门课程,总价3725元,会员免费学• ❤️‍🔥接口自动化测试不想写代码?• 一文通过实践解析nodejs中间件• 浅析Nodejs怎么进行大文件读写• 浅谈node.js的后端路由自动加载• 一文探究Node中的的进程与子进程• 如何利用Node获取物理网卡mac地址
    1/1

    PHP中文网