En tant que l'une des commandes les plus couramment utilisées dans les systèmes Linux, le nombre de mots (wc) joue un rôle important dans le traitement de texte et les statistiques. Que vous soyez débutant ou administrateur Linux expérimenté, il est important de maîtriser la commande wc. Cet article présentera en détail comment utiliser la commande wc et son application dans les systèmes Linux.
Paramètres principaux
Les paramètres communs sont les suivants :
Regardons directement quelques exemples.
Comptez le nombre de lignes, de mots et d'octets du fichier
$ wc test.txt 1 1 7 test.txt
Le résultat de l'impression montre que le fichier contient 1 ligne, 1 mot et 7 octets.
Un rappel spécial est que les mots ici sont des chaînes séparées par des espaces, des sauts de ligne, etc., c'est-à-dire
words 字词
Il n'y a que deux mots ici.
Ne compte que les lignes de fichiers, les mots, les caractères ou les octets
Lorsqu'on ne compte qu'un seul contenu, il suffit de rentrer les paramètres correspondants, par exemple :
$ wc -l test.txt 1 test.txt
Utilisez le paramètre -l pour afficher uniquement le nombre de lignes.
Mais ce qui nécessite une attention particulière ici, c'est la différence entre le nombre de caractères et le nombre d'octets. Le nombre d'octets correspond à l'espace occupé par les données, et un caractère peut occuper plusieurs octets. Par exemple, dans le codage UTF-8, une lettre anglaise est un caractère et occupe un octet d'espace, tandis qu'un caractère chinois occupe 3 octets. taille.
Par exemple :
编程
Programmation, ici c'est deux caractères, et l'espace occupé est de 6 octets, mais en utilisant wc -m les statistiques seront un de plus que deux, soit 3 caractères.
$ echo 编程|wc -m 3 $ echo 编程|wc -c 7
Les caractères occupés par chaque caractère codé sont les suivants :
Encodage | Lettres anglaises | Chinois |
---|---|---|
UTF-8 | 1 octet | 3 octets |
Unicode | 1 octet | 2 octets |
你可以使用:
$ echo $LANG en_GB.UTF-8
查看编码格式。
统计命令执行结果数量
实际上个人认为,最常用的还是-l参数,它用来统计文件或标准输出有多少行,那么实际上就可以用来做很多统计的事情了。
例如,统计当前目录下有多少个普通文件:
$ ls -l total 4 -rw-rw-r-- 1 hyb hyb 0 3月 21 20:32 test2.txt -rw-rw-r-- 1 hyb hyb 13 3月 21 20:18 test.txt $ ls -l |grep "^-"|wc -l 2
可以得到文件数量为2。grep “^-“的意思是,获取哪些以-开头的行,因为普通文件都是以-开头的。
当然如果想统计包括子目录的总文件数量,可以加上-R参数:
ls -lR |grep "^-"|wc -l
再例如,查看chrome相关进程数量:
$ ps -ef|grep google|grep -v grep |wc -l 23
类似这样的用法还有很多,只要你想统计都可以做。
这里再多说两句:
总结
本文我们学习了如何使用Linux命令行工具wc,包括基本语法、参数选项和示例实践。我们了解了wc如何帮助我们快速统计字符、单词和行数,在文本处理、数据分析等方面发挥着重要的作用。希望这篇文章能够对您掌握wc命令和加深对Linux系统的理解有所帮助。
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!