[日志分析]在nginx日志中,提取有效的request uri
Libérer: 2016-08-08 09:19:23
original
1195 Les gens l'ont consulté
最近在做公司的nginx log分析,其中一个需求是提取这个月每天被访问Top10的页面,及其访问量。做这个需求,首先要清洗出有效的页面访问。我采用排除法,去掉 .js .css之类的访问。但最初,我并不能全面的了解要去掉带有哪些后缀的request。经过清洗 -> 抽样 -> 清洗 -> 抽样 -> 清洗,最终需要过滤掉含有下列后缀的uri
.js .css . gif .jpeg .jpg .png .ico .txt .swf .xml .JPEG .PNG .JPG #python代码:
if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]):
continue
Copier après la connexion
不同公司的日志可能存在一些特殊情况,这还需要抽样分析
版权声明:本文为博主原创文章,未经博主允许不得转载。
以上就介绍了[日志分析]在nginx日志中,提取有效的request uri,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31