Ringkasan alat analisis prestasi Linux-LINUX-php.cn

Disebabkan minat saya terhadap sistem pengendalian Linux dan keinginan saya untuk pengetahuan peringkat rendah, saya menyusun artikel ini. Ia berfungsi sebagai semakan untuk pengetahuan asas dan merangkumi semua aspek sistem. Alat dalam dokumentasi tidak boleh dikuasai sepenuhnya tanpa pengetahuan lengkap tentang sistem komputer, rangkaian dan sistem pengendalian. Selain itu, analisis dan pengoptimuman prestasi sistem ialah siri jangka panjang.

Dokumen ini terutamanya artikel komprehensif yang disusun daripada catatan blog alat penalaan prestasi Linux yang dikemas kini oleh guru Linux dan arkitek prestasi kanan Netflix Brendan Gregg, dan mengumpul artikel yang berkaitan dengan pengoptimuman prestasi sistem Linux. Ia menerangkan terutamanya prinsip dan alat ujian prestasi yang terlibat bersama dengan catatan blog.

Pengetahuan latar belakang: Apabila menganalisis masalah prestasi, memahami pengetahuan latar belakang adalah perlu. Sebagai contoh, cache perkakasan contoh lain ialah kernel sistem pengendalian. Butiran gelagat aplikasi sering dikaitkan dengan perkara ini dan perkara peringkat rendah ini boleh menjejaskan prestasi aplikasi dengan cara yang tidak dijangka. Sebagai contoh, sesetengah program gagal menggunakan cache sepenuhnya, mengakibatkan prestasi yang lemah. Sebagai contoh, terlalu banyak panggilan sistem dipanggil secara tidak perlu, menyebabkan penukaran kernel/pengguna yang kerap, dsb.

Alat Analisis Prestasi

Pertama, mari lihat gambar:

Gambar di atas adalah analisis prestasi yang dikongsikan oleh Brendan Gregg Semua alatan di sini boleh mendapatkan dokumen bantuan mereka melalui man Berikut adalah pengenalan ringkas kepada penggunaan umum:

vmstat – statistik memori maya

vmstat (VirtualMeomoryStatistics, statistik memori maya) ialah alat biasa untuk memantau memori dalam Linux Ia boleh memantau keadaan keseluruhan memori maya sistem pengendalian, proses, CPU, dll. Penggunaan biasa vmstat: vmstat interval times 即每隔 interval 秒采样一次，共采样 times 次，如果省略 times, data akan dikumpul sehingga pengguna menghentikannya secara manual. Hanya berikan contoh mudah:

Anda boleh menggunakan ctrl+c 停止 vmstat untuk mengumpul data.

Baris pertama menunjukkan purata sistem sejak ia dimulakan, baris kedua mula menunjukkan apa yang berlaku sekarang, baris berikut akan menunjukkan apa yang berlaku dalam setiap selang 5 saat, maksud setiap lajur adalah dalam pengepala, seperti ditunjukkan di bawah:

procs: r Lajur ini menunjukkan berapa banyak proses sedang menunggu untuk cpu, dan lajur b menunjukkan berapa banyak proses sedang tidur tanpa gangguan (menunggu IO).
Lajur memory:swapd menunjukkan bilangan blok yang telah ditukar daripada cakera (pertukaran halaman), lajur yang selebihnya menunjukkan bilangan blok yang bebas (tidak digunakan), berapa banyak blok yang digunakan sebagai penimbal dan berapa banyak yang digunakan sebagai Cache sistem pengendalian.
swap: Menunjukkan aktiviti swap: berapa banyak blok yang ditukar (dari cakera) dan ditukar keluar (ke cakera) sesaat.
io: Menunjukkan bilangan blok yang dibaca (bi) dan ditulis (bo) daripada peranti blok, biasanya mencerminkan cakera keras I/O.
sistem: Memaparkan bilangan sampukan (dalam) dan suis konteks (cs) sesaat.
cpu: Memaparkan peratusan semua masa CPU yang dibelanjakan untuk pelbagai operasi, termasuk melaksanakan kod pengguna (bukan kernel), melaksanakan kod sistem (kernel), melahu dan menunggu IO.

Simptom memori tidak mencukupi: memori bebas berkurangan dengan mendadak, penimbal dan cache kitar semula tidak membantu, penggunaan meluas partition swap (swpd), pertukaran halaman yang kerap (swap), peningkatan dalam bilangan cakera baca dan tulis (io), dan peningkatan gangguan gangguan halaman (dalam) , bilangan suis konteks (cs) meningkat, bilangan proses menunggu IO (b) meningkat, dan banyak masa CPU dihabiskan untuk menunggu IO (wa)

iostat – untuk melaporkan statistik CPU

iostat digunakan untuk melaporkan statistik unit pemprosesan pusat (CPU) dan statistik input/output untuk keseluruhan sistem, penyesuai, peranti tty, cakera dan CD-ROM Secara lalai, ia memaparkan maklumat penggunaan cpu yang sama seperti vmstat arahan untuk memaparkan sambungan Statistik Peranti:

Barisan pertama menunjukkan purata sejak but sistem, kemudian purata tambahan, satu baris bagi setiap peranti.

Tabiat singkatan penunjuk IO cakera Linux biasa: rq ialah permintaan, r dibaca, w ialah tulis, qu ialah baris gilir, sz ialah saiz, a ialah purata, tm ialah masa dan svc ialah perkhidmatan.

rrqm/s dan wrqm/s: Gabungan permintaan baca dan tulis sesaat, "bercantum" bermakna sistem pengendalian mengambil berbilang permintaan logik daripada baris gilir dan menggabungkannya menjadi satu permintaan ke cakera sebenar.
r/s dan w/s: Bilangan permintaan baca dan tulis yang dihantar ke peranti sesaat.
rsec/s dan wsec/s: Bilangan sektor dibaca dan ditulis sesaat.
avgrq –sz: Bilangan sektor yang diminta.
avgqu –sz: Bilangan permintaan menunggu dalam baris gilir peranti.
menunggu: Masa yang dibelanjakan untuk setiap permintaan IO.
svctm: Masa permintaan (perkhidmatan) sebenar.
%util: Peratusan masa terdapat sekurang-kurangnya satu permintaan aktif.

dstat – alat pemantauan sistem

dstat menunjukkan penggunaan CPU, status IO cakera, status penghantaran paket rangkaian dan status paging Outputnya berwarna-warni dan sangat mudah dibaca Berbanding dengan input vmstat dan iostat, ia lebih terperinci dan intuitif. Apabila menggunakannya, hanya masukkan arahan secara langsung, dan sudah tentu anda juga boleh menggunakan parameter tertentu.

Seperti berikut:dstat –cdlmnpsy

iotop - alat pemantauan masa nyata proses LINUX

Arahan iotop ialah arahan yang direka khusus untuk memaparkan IO cakera keras Gaya antara muka adalah serupa dengan arahan atas Ia boleh memaparkan proses yang menjana beban IO secara khusus. Ia adalah alat teratas yang digunakan untuk memantau penggunaan I/O cakera Ia mempunyai UI yang serupa dengan bahagian atas, termasuk PID, pengguna, I/O, proses dan maklumat lain yang berkaitan.

Boleh digunakan secara tidak interaktif:

iotop –bod interval

Salin selepas log masuk

Untuk melihat I/O setiap proses, anda boleh menggunakan

pidstat，pidstat –d instat

Salin selepas log masuk

pidstat – Pantau sumber sistem

pidstat digunakan terutamanya untuk memantau penggunaan sumber sistem oleh semua atau proses tertentu, seperti CPU, memori, peranti IO, penukaran tugas, benang, dsb.

使用方法：

pidstat –d interval

Salin selepas log masuk

pidstat 还可以用以统计CPU使用信息：

pidstat –u interval

Salin selepas log masuk

统计内存信息：

pidstat –r interval

Salin selepas log masuk

top

top 命令的汇总区域显示了五个方面的系统性能信息：
负载：时间，登陆用户数，系统平均负载；
进程：运行，睡眠，停止，僵尸；
cpu:用户态，核心态，NICE,空闲，等待IO,中断等；
内存：总量，已用，空闲（系统角度），缓冲，缓存；
交换分区：总量，已用，空闲

任务区域默认显示：进程 ID，有效用户，进程优先级，NICE 值，进程使用的虚拟内存，物理内存和共享内存，进程状态，CPU 占用率，内存占用率，累计 CPU 时间，进程命令行信息。

htop

htop 是 Linux 系统中的一个互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要 ncurses。

Htop 可让用户交互式操作，支持颜色主题，可横向或纵向滚动浏览进程列表，并支持鼠标操作。

与 top 相比，htop 有以下优点：

可以横向或者纵向滚动浏览进程列表，以便看到所有的进程和完整的命令行。
在启动上，比top更快。
杀进程时不需要输入进程号。
htop支持鼠标操作。

mpstat

mpstat 是 Multiprocessor Statistics的缩写，是实时系统监控工具。其报告CPU的一些统计信息，这些信息存放在 /proc/stat 文件中。在多 CPUs 系统里，其不但能查看所有 CPU 的平均状况信息，而且能够查看特定 CPU 的信息。常见用法：

mpstat –P ALL interval times

Salin selepas log masuk

netstat

netstat 用于显示与 IP、TCP、UDP和 ICMP 协议相关的统计数据，一般用于检验本机各端口的网络连接情况。

常见用法：

netstat –npl   # 可以查看你要打开的端口是否已经打开。

netstat –rn    # 打印路由表信息。

netstat –in    # 提供系统上的接口信息，打印每个接口的MTU,输入分组数，输入错误，输出分组数，输出错误，冲突以及当前的输出队列的长度。

Salin selepas log masuk

ps–显示当前进程的状态

ps 参数太多，具体使用方法可以参考 man ps

常用的方法：

ps  aux       #hsserver

ps –ef |grep   #hundsun

Salin selepas log masuk

杀掉某一程序的方法：

ps  aux | grep mysqld | grep –v grep | awk ‘{print $2 }’ xargs kill -9

Salin selepas log masuk

杀掉僵尸进程：

ps –eal | awk ‘{if ($2 == “Z”){print $4}}’ | xargs kill -9

Salin selepas log masuk

strace

跟踪程序执行过程中产生的系统调用及接收到的信号，帮助分析程序或命令执行中遇到的异常情况。

举例：查看 mysqld 在 linux 上加载哪种配置文件，可以通过运行下面的命令：

strace –e stat64 mysqld –print –defaults > /dev/null

Salin selepas log masuk

uptime

能够打印系统总共运行了多长时间和系统的平均负载，uptime 命令最后输出的三个数字的含义分别是 1分钟，5分钟，15分钟内系统的平均负荷。

lsof

lsof（list open files）是一个列出当前系统打开文件的工具。通过 lsof 工具能够查看这个列表对系统检测及排错，常见的用法：

查看文件系统阻塞

lsof /boot

Salin selepas log masuk

查看端口号被哪个进程占用

lsof  -i : 3306

Salin selepas log masuk

查看用户打开哪些文件

lsof –u username

Salin selepas log masuk

查看进程打开哪些文件

lsof –p  4838

Salin selepas log masuk

查看远程已打开的网络链接

lsof –i @192.168.34.128

Salin selepas log masuk

perf

perf 是 Linux kernel 自带的系统性能优化工具。优势在于与 Linux Kernel 的紧密结合，它可以最先应用到加入 Kernel 的new feature，用于查看热点函数，查看 cashe miss 的比率，从而帮助开发者来优化程序性能。

性能调优工具如 perf，Oprofile 等的基本原理都是对被监测对象进行采样，最简单的情形是根据 tick 中断进行采样，即在 tick 中断内触发采样点，在采样点里判断程序当时的上下文。

假如一个程序 90% 的时间都花费在函数 foo() 上，那么 90% 的采样点都应该落在函数 foo() 的上下文中。运气不可捉摸，但我想只要采样频率足够高，采样时间足够长，那么以上推论就比较可靠。因此，通过 tick 触发采样，我们便可以了解程序中哪些地方最耗时间，从而重点分析。

汇总

结合以上常用的性能测试命令并联系文初的性能分析工具的图，就可以初步了解到性能分析过程中哪个方面的性能使用哪方面的工具（命令）。

常用的性能测试工具

熟练并精通了第二部分的性能分析命令工具，引入几个性能测试的工具，介绍之前先简单了解几个性能测试工具：

perf_events：一款随 Linux 内核代码一同发布和维护的性能诊断工具，由内核社区维护和发展。Perf 不仅可以用于应用程序的性能统计分析，也可以应用于内核代码的性能统计和分析。
eBPF tools：一款使用 bcc 进行的性能追踪的工具，eBPF map可以使用定制的 eBPF 程序被广泛应用于内核调优方面，也可以读取用户级的异步代码。重要的是这个外部的数据可以在用户空间管理。这个 k-v 格式的 map 数据体是通过在用户空间调用 bpf 系统调用创建、添加、删除等操作管理的。
perf-tools：一款基于 perf_events (perf) 和 ftrace 的Linux性能分析调优工具集。Perf-Tools 依赖库少，使用简单。支持Linux 3.2 及以上内核版本。
bcc(BPF Compiler Collection):：一款使用 eBP F的 perf 性能分析工具。一个用于创建高效的内核跟踪和操作程序的工具包，包括几个有用的工具和示例。利用扩展的BPF（伯克利数据包过滤器），正式称为eBPF，一个新的功能，首先被添加到Linux 3.15。多用途需要Linux 4.1以上BCC。
ktap：一种新型的linux脚本动态性能跟踪工具。允许用户跟踪Linux内核动态。ktap是设计给具有互操作性，允许用户调整操作的见解，排除故障和延长内核和应用程序。它类似于Linux和Solaris DTrace SystemTap。
Flame Graphs：是一款使用 perf，system tap，ktap 可视化的图形软件，允许最频繁的代码路径快速准确地识别，可以是使用 github.com/brendangregg/flamegraph 中的开发源代码的程序生成。

Linux observability tools | Linux 性能观测工具

首先学习的Basic Tool有如下：uptime、top(htop)、mpstat、isstat、vmstat、free、ping、nicstat、dstat。
高级的命令如下：sar、netstat、pidstat、strace、tcpdump、blktrace、iotop、slabtop、sysctl、/proc。

Linux benchmarking tools | Linux 性能测评工具

是一款性能测评工具，对于不同模块的性能测试可以使用相应的工具，想要深入了解，可以参考最下文的附件文档。

Linux tuning tools | Linux 性能调优工具

是一款性能调优工具，主要是从linux内核源码层进行的调优，想要深入了解，可以参考下文附件文档。

Linux observability sar | linux性能观测工具

sar（System Activity Reporter系统活动情况报告）是目前LINUX上最为全面的系统性能分析工具之一，可以从多方面对系统的活动进行报告，包括：文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC 有关的活动等方面。sar 的常规使用方式：

sar  [options] [-A] [-o file]  t [n]

Salin selepas log masuk

其中：t 为采样间隔，n 为采样次数，默认值是1；-o file 表示将命令结果以二进制格式存放在文件中，file 是文件名。options 为命令行选项

Atas ialah kandungan terperinci Ringkasan alat analisis prestasi Linux. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!