PHP의 다중 프로세스 소비 대기열에 대한 간략한 토론

青灯夜游
풀어 주다: 2023-04-09 19:30:02
앞으로
2590명이 탐색했습니다.

이 문서에서는 PHP의 다중 프로세스 소비 대기열을 안내합니다. 도움이 필요한 친구들이 모두 참고할 수 있기를 바랍니다.

PHP의 다중 프로세스 소비 대기열에 대한 간략한 토론

추천 연구: "PHP 비디오 튜토리얼"

최근에 큐 mcq를 사용하여 큐 데이터를 소비하는 프로세스를 시작하는 작은 기능을 개발했는데, 나중에 한 프로세스가 이를 처리할 수 없어서 다른 프로세스가 발견되었습니다. 잠시 후 처리할 수 없게 되었습니다...

이 방법을 사용하려면 매번 crontab을 수정해야 합니다. 프로세스가 중단되면 제때에 시작되지 않고 다음 crontab이 실행될 때까지 시작되지 않습니다. 실행. Kill은 프로세스를 종료(재시작)할 때 사용되며, 이로 인해 처리 중인 데이터가 손실될 수 있습니다. 예를 들어 다음 예에서는 효과를 명확하게 확인하기 위해 sleep 프로세스를 처리 로직으로 가정합니다. 10초로 확대:

<?php $i = 1;
while (1) {
    echo "开始第[{$i}]次循环\n";
    sleep(10);
    echo "结束第[{$i}]次循环\n";
    $i++;
}
로그인 후 복사

스크립트를 실행한 후 루프가 시작될 때까지 기다렸다가 kill {$pid}를 프로세스에 보냅니다. 기본적으로 SIGTERM 신호는 번호가 매겨져 있습니다. 15개를 보냈습니다. 큐에서 $i를 얻었을 때 2가 처리 중이라고 가정합니다. 큐 데이터 손실과 마찬가지로 문제가 상대적으로 크기 때문에 프로그램에 종료 신호를 보냅니다. 이러한 질문을 해결할 방법을 찾아야 합니다. kill {$pid},默认发送的是编号为15的SIGTERM信号。假设$i是从队列拿到的,拿到2的时候,正在处理,我们给程序发送了kill信号,和队列数据丢失一样,问题比较大,因此我要想办法解决这些问题。

开始第[1]次循环
结束第[1]次循环
开始第[2]次循环


[1]    28372 terminated  php t.php
로그인 후 복사

nginx进程模型

这时候我想到了nginx,nginx作为高性能服务器的中流砥柱,为成千上万的企业和个人服务,他的进程模型比较经典,如下所示:

nginx 进程模型 图片来自网络

管理员通过master进程和nginx进行交互,从/path/to/nginx.pid读取nginx master进程的pid,发送信号给master进程,master根据不同的信号做出不同的处理,然后反馈信息给管理员。worker是master进程fork出来的,master负责管理worker,不会去处理业务,worker才是具体业务的处理者,master可以控制worker的退出、启动,当worker意外退出,master会收到子进程退出的消息,也会重新启动新的worker进程补充上来,不让业务处理受影响。nginx还可以平滑退出,不丢失任何一个正在处理的数据,更新配置时nginx可以做到不影响线上服务来加载新的配置,这在请求量很大的时候特别有用。

进程设计

看了nginx的进模型,我们完全可以开发一个类似的类库来满足处理mcq数据的需求,做到单文件控制所有进程、可以平滑退出、可以查看子进程状态。不需要太复杂,因为我们处理队列数据接收一定的延迟,做到nginx那样不间断服务比较麻烦,费时费力,意义不是很大。设计的进程模型跟nginx类似,更像是nginx的简化版本。
PHP의 다중 프로세스 소비 대기열에 대한 간략한 토론

进程信号量设计

信号量是进程间通讯的一种方式,比较简单,单功能也比较弱,只能发送信号给进程,进程根据信号做出不同的处理。

master进程启动的时候保存pid到文件/path/to/daeminze.pid,管理员通过信号和master进程通讯,master进程安装3种信号,碰到不同的信号,做出不同的处理,如下所示:

SIGINT 	=> 平滑退出,处理完正在处理的数据再退出
SIGTERM => 暴力退出,无论进程是否正在处理数据直接退出
SIGUSR1 => 查看进程状态,查看进程占用内存,运行时间等信息
로그인 후 복사

master进程通过信号和worker进程通讯,worker进程安装了2个信号,如下所示:

SIGINT 	=> 平滑退出
SIGUSR1	=> 查看worker进程自身状态
로그인 후 복사

为什么worker进程只安装2个信号呢,少了个SIGTERM,因为master进程收到信号SIGTERM之后,向worker进程发送SIGKILL信号,默认强制关闭进程即可。

worker进程是通过master进程fork出来的,这样master进程可以通过pcntl_wait来等待子进程退出事件,当有子进程退出的时候返回子进程pid,做处理并启动新的进程补充上来。

master进程也通过pcntl_wait来等待接收信号,当有信号到达的时候,会返回-1,这个地方还有些坑,在下文中会详细讲。

PHP中有2种信号触发的方式,第一种方式是declare(ticks = 1);,这种效率不高,Zend每执行一次低级语句,都会去检查进程中是否有未处理的信号,现在已经很少使用了,PHP 5.3.0及之前的版本可能会用到这个。

第二种是通过pcntl_signal_dispatch来调用未处理的信号,PHP 5.4.0及之后的版本适用,可以巧妙的将该函数放在循环中,性能上基本没什么损失,现在推荐适用。

PHP安装修信号量

PHP通过pcntl_signal

bool pcntl_signal ( int $signo , [callback $handler [, bool $restart_syscalls = true ] )
로그인 후 복사
로그인 후 복사

nginx 프로세스 모델

이때 nginx는 고성능 서버의 중심으로 수천 개의 기업과 개인에게 서비스를 제공하고 있다고 생각했습니다. 아래와 같이 더 고전적입니다. 🎜🎜nginx 프로세스 모델 사진은 다음에서 가져옵니다. the Internet🎜🎜관리자는 마스터 프로세스를 통해 nginx와 상호 작용하고 /path/to/nginx.pid에서 nginx 마스터 프로세스의 pid를 읽고 마스터 프로세스, 마스터에 신호를 보냅니다. 서로 다른 신호를 기반으로 서로 다른 프로세스가 수행되고 해당 정보가 관리자에게 피드백됩니다. 작업자는 마스터 프로세스에서 분기되며 마스터는 작업자 관리를 담당하며 특정 비즈니스의 처리자입니다. 작업자가 예기치 않게 종료되는 경우 마스터는 작업자의 종료 및 시작을 제어할 수 있습니다. 마스터가 하위 프로세스가 종료되었다는 알림을 받으면 이를 보완하기 위해 새 작업자 프로세스가 다시 시작되므로 비즈니스 처리에는 영향이 없습니다. 또한 nginx는 처리 중인 데이터를 잃지 않고 원활하게 종료할 수 있으며, 구성을 업데이트할 때 nginx는 온라인 서비스에 영향을 주지 않고 새 구성을 로드할 수 있으며 이는 요청 볼륨이 클 때 특히 유용합니다. 🎜

Process Design

🎜nginx의 고급 모델을 살펴본 후 mcq 데이터 처리 요구 사항을 충족하는 유사한 클래스 라이브러리를 개발하여 단일 파일로 모든 것을 제어할 수 있습니다. 프로세스를 원활하게 종료하면 하위 프로세스의 상태를 볼 수 있습니다. nginx처럼 중단 없이 서비스를 제공하는 것은 번거롭고 시간 소모적이며 노동 집약적이며 그다지 의미가 없습니다. 설계된 프로세스 모델은 nginx와 유사하며 nginx의 단순화된 버전에 더 가깝습니다.
다중 프로세스 모델🎜

프로세스 세마포어 디자인

🎜 세마포어는 프로세스 간 통신 방법으로, 프로세스와 프로세스에만 신호를 보낼 수 있는 약한 단일 기능을 가지고 있습니다. 신호에 반응합니다. 다르게 수행하십시오. 🎜🎜마스터 프로세스가 시작되면 pid를 /path/to/daeminze.pid 파일에 저장합니다. 관리자는 신호를 통해 마스터 프로세스와 통신합니다. 다른 신호를 만나면 아래와 같이 다른 처리가 수행됩니다. 🎜
<?php $i = 0;
while ($i<5) {
    $pid = pcntl_fork();
    $random = rand(10, 50);
    if ($pid == 0) {
        sleep($random);
        exit();
    }
    echo "child {$pid} sleep {$random}\n";
    $i++;
}

pcntl_signal(SIGINT,  function($signo) {
     echo "Ctrl + C\n";
});

while (1) {
    $pid = pcntl_wait($status);
    var_dump($pid);
    pcntl_signal_dispatch();
}
로그인 후 복사
로그인 후 복사
🎜마스터 프로세스는 신호를 통해 작업자 프로세스와 통신합니다. 작업자 프로세스는 아래와 같이 2개의 신호를 설치합니다. 🎜
child 29643 sleep 48
child 29644 sleep 24
child 29645 sleep 37
child 29646 sleep 20
child 29647 sleep 31
int(29643)
Ctrl + C
Ctrl + C
Ctrl + C
Ctrl + C
int(29646)
로그인 후 복사
로그인 후 복사
🎜작업자 프로세스는 왜 2개만 설치합니까? 신호가 하나 누락되었습니다. 마스터 프로세스가 SIGTERM 신호를 수신한 후 SIGKILL 신호를 작업자 프로세스로 보내기 때문입니다. 기본적으로 프로세스를 강제로 닫을 수 있습니다. 🎜🎜작업자 프로세스는 마스터 프로세스에 의해 분기되어 마스터 프로세스가 pcntl_wait를 통해 하위 프로세스 종료 이벤트를 기다릴 수 있도록 하위 프로세스가 종료되면 하위 프로세스 pid를 반환합니다. 처리하고 새 프로세스를 시작합니다. 🎜🎜마스터 프로세스도 pcntl_wait를 통해 신호를 받기를 기다립니다. 신호가 도착하면 -1을 반환합니다. 여기에는 여전히 몇 가지 함정이 있습니다. 아래에서 자세히 논의됩니다. 🎜🎜PHP에서 신호를 트리거하는 방법에는 두 가지가 있습니다. 첫 번째 방법은 declare(ticks = 1);입니다. 이는 낮은 수준의 명령문을 실행할 때마다 프로세스를 확인하는 데 효과적이지 않습니다. . 처리되지 않은 신호가 있습니까? 현재는 거의 사용되지 않으며 이전 버전에서는 이를 사용할 수 있습니다. 🎜🎜두 번째 방법은 pcntl_signal_dispatch를 통해 처리되지 않은 신호를 호출하는 것입니다. PHP 5.4.0 이상 버전에 적용 가능합니다. 기본적으로 성능 저하가 없으므로 지금 사용하는 것이 좋습니다. 🎜

PHP가 세마포어 설치 및 복구

🎜PHP는 pcntl_signal을 통해 시그널을 설치하며, 함수 선언은 다음과 같습니다. 🎜
bool pcntl_signal ( int $signo , [callback $handler [, bool $restart_syscalls = true ] )
로그인 후 복사
로그인 후 복사

第三个参数restart_syscalls不太好理解,找了很多资料,也没太查明白,经过试验发现,这个参数对pcntl_wait函数接收信号有影响,当设置为缺省值true的时候,发送信号,进程用pcntl_wait收不到,必须设置为false才可以,看看下面这个例子:

<?php $i = 0;
while ($i<5) {
    $pid = pcntl_fork();
    $random = rand(10, 50);
    if ($pid == 0) {
        sleep($random);
        exit();
    }
    echo "child {$pid} sleep {$random}\n";
    $i++;
}

pcntl_signal(SIGINT,  function($signo) {
     echo "Ctrl + C\n";
});

while (1) {
    $pid = pcntl_wait($status);
    var_dump($pid);
    pcntl_signal_dispatch();
}
로그인 후 복사
로그인 후 복사

运行之后,我们对父进程发送kill -SIGINT {$pid}信号,发现pcntl_wait没有反应,等到有子进程退出的时候,发送过的SIGINT会一个个执行,比如下面结果:

child 29643 sleep 48
child 29644 sleep 24
child 29645 sleep 37
child 29646 sleep 20
child 29647 sleep 31
int(29643)
Ctrl + C
Ctrl + C
Ctrl + C
Ctrl + C
int(29646)
로그인 후 복사
로그인 후 복사

这是运行脚本之后马上给父进程发送了四次SIGINT信号,等到一个子进程推出的时候,所有信号都会触发。

但当把安装信号的第三个参数设置为false

pcntl_signal(SIGINT,  function($signo) {
     echo "Ctrl + C\n";
}, false);
로그인 후 복사

这时候给父进程发送SIGINT信号,pcntl_wait会马上返回-1,信号对应的事件也会触发。

所以第三个参数大概意思就是,是否重新注册此信号,如果为false只注册一次,触发之后就返回,pcntl_wait就能收到消息,如果为true,会重复注册,不会返回,pcntl_wait收不到消息。

信号量和系统调用

信号量会打断系统调用,让系统调用立刻返回,比如sleep,当进程正在sleep的时候,收到信号,sleep会马上返回剩余sleep秒数,比如:

<?php pcntl_signal(SIGINT,  function($signo) {
     echo "Ctrl + C\n";
}, false);

while (true) {
	pcntl_signal_dispatch();
    echo "123\n";
    $limit = sleep(2);
	echo "limit sleep [{$limit}] s\n";
}
로그인 후 복사

运行之后,按Ctrl + C,结果如下所示:

123
^Climit sleep [1] s
Ctrl + C
123
limit sleep [0] s
123
^Climit sleep [1] s
Ctrl + C
123
^Climit sleep [2] s
로그인 후 복사

daemon(守护)进程

这种进程一般设计为daemon进程,不受终端控制,不与终端交互,长时间运行在后台,而对于一个进程,我们可以通过下面几个步骤把他升级为一个标准的daemon进程:

protected function daemonize()
{
    $pid = pcntl_fork();
    if (-1 == $pid) {
        throw new Exception("fork进程失败");
    } elseif ($pid != 0) {
        exit(0);
    }
    if (-1 == posix_setsid()) {
        throw new Exception("新建立session会话失败");
    }

    $pid = pcntl_fork();
    if (-1 == $pid) {
        throw new Exception("fork进程失败");
    } else if($pid != 0) {
        exit(0);
    }

    umask(0);
    chdir("/");
}
로그인 후 복사

拢共分五步:

  1. fork子进程,父进程退出。
  2. 设置子进程为会话组长,进程组长。
  3. 再次fork,父进程退出,子进程继续运行。
  4. 恢复文件掩码为0
  5. 切换当前目录到根目录/

第2步是为第1步做准备,设置进程为会话组长,必要条件是进程非进程组长,因此做第一次fork,进程组长(父进程)退出,子进程通过posix_setsid()设置为会话组长,同时也为进程组长。

第3步是为了不让进程重新控制终端,因为一个进程控制一个终端的必要条件是会话组长(pid=sid)。

第4步是为了恢复默认的文件掩码,避免之前做的操作对文件掩码做了设置,带来不必要的麻烦。关于文件掩码, linux中,文件掩码在创建文件、文件夹的时候会用到,文件的默认权限为666,文件夹为777,创建文件(夹)的时候会用默认值减去掩码的值作为创建文件(夹)的最终值,比如掩码022下创建文件666 - 222 = 644,创建文件夹777 - 022 = 755

掩码 新建文件权限 新建文件夹权限
umask(0) 666 (-rw-rw-rw-) 777 (drwxrwxrwx)
umask(022) 644 (-rw-r--r--) 755 (drwxr-xr-x)

第5步是切换了当前目录到根目录/,网上说避免起始运行他的目录不能被正确卸载,这个不是太了解。

对应5步,每一步的各种id变化信息:

操作后 pid ppid pgid sid
开始 17723 31381 17723 31381
第一次fork 17723 1 17723 31381
posix_setsid() 17740 1 17740 17740
第二次fork 17840 1 17740 17740

另外,会话、进程组、进程的关系如下图所示,这张图有助于更好的理解。
PHP의 다중 프로세스 소비 대기열에 대한 간략한 토론

至此,你也可以轻松地造出一个daemon进程了。

命令设计

我准备给这个类库设计6个命令,如下所示:

  1. start 启动命令
  2. restart 强制重启
  3. stop 平滑停止
  4. reload 平滑重启
  5. quit 强制停止
  6. status 查看进程状态

启动命令

启动命令就是默认的流程,按照默认流程走就是启动命令,启动命令会检测pid文件中是否已经有pid,pid对应的进程是否健康,是否需要重新启动。

强制停止命令

管理员通过入口文件结合pid给master进程发送SIGTERM信号,master进程给所有子进程发送SIGKILL信号,等待所有worker进程退出后,master进程也退出。

强制重启命令

强制停止命令 + 启动命令

平滑停止命令

平滑停止命令,管理员给master进程发送SIGINT信号,master进程给所有子进程发送SIGINT,worker进程将自身状态标记为stoping,当worker进程下次循环的时候会根据stoping决定停止,不在接收新的数据,等所有worker进程退出之后,master进程也退出。

平滑重启命令

平滑停止命令 + 启动命令

查看进程状态

查看进程状态这个借鉴了workerman的思路,管理员给master进程发送SIGUSR1信号,告诉主进程,我要看所有进程的信息,master进程,master进程将自身的进程信息写入配置好的文件路径A中,然后发送SIGUSR1,告诉worker进程把自己的信息也写入文件A中,由于这个过程是异步的,不知道worker进程啥时候写完,所以master进程在此处等待,等所有worker进程都写入文件之后,格式化所有的信息输出,最后输出的内容如下所示:

➜/dir /usr/local/bin/php DaemonMcn.php status
Daemon [DaemonMcn] 信息:
-------------------------------- master进程状态 --------------------------------
pid       占用内存       处理次数       开始时间                 运行时间
16343     0.75M          --             2018-05-15 09:42:45      0 天 0 时 3 分
12 slaver
-------------------------------- slaver进程状态 --------------------------------
任务task-mcq:
16345     0.75M          236            2018-05-15 09:42:45      0 天 0 时 3 分
16346     0.75M          236            2018-05-15 09:42:45      0 天 0 时 3 分
--------------------------------------------------------------------------------
任务test-mcq:
16348     0.75M          49             2018-05-15 09:42:45      0 天 0 时 3 分
16350     0.75M          49             2018-05-15 09:42:45      0 天 0 时 3 分
16358     0.75M          49             2018-05-15 09:42:45      0 天 0 时 3 分
16449     0.75M          1              2018-05-15 09:46:40      0 天 0 时 0 分
--------------------------------------------------------------------------------
로그인 후 복사

等待worker进程将进程信息写入文件的时候,这个地方用了个比较trick的方法,每个worker进程输出一行信息,统计文件的行数,达到worker进程的行数之后表示所有worker进程都将信息写入完毕,否则,每个1s检测一次。

其他设计

另外还加了两个比较实用的功能,一个是worker进程运行时间限制,一个是worker进程循环处理次数限制,防止长时间循环进程出现内存溢出等意外情况。时间默认是1小时,运行次数默认是10w次。

除此之外,也可以支持多任务,每个任务几个进程独立开,统一由master进程管理。

代码已经放到github中,有兴趣的可以试试,不支持windows哦,有什么错误还望指出来。

更多编程相关知识,请访问:编程入门!!

위 내용은 PHP의 다중 프로세스 소비 대기열에 대한 간략한 토론의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
php
원천:cnblogs.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿