[로그 분석] nginx 로그에서 유효한 요청 uri 추출
풀어 주다: 2016-08-08 09:19:23
현재 회사의 nginx 로그 분석을 하고 있는데, 요구 사항 중 하나가 이번 달 매일 방문한 상위 10개 페이지와 방문 횟수를 추출하는 것입니다. 이 요구 사항을 충족하려면 먼저 유효한 페이지 방문을 삭제해야 합니다. .js 및 .css와 같은 액세스를 제거하기 위해 제거 방법을 사용합니다. 하지만 처음에는 접미사를 제거해야 한다는 요청에 대해 포괄적인 이해가 없었습니다. 클리닝->샘플링->샘플링->클리닝 후 다음 접미사가 포함된 uri를 필터링해야 합니다.
.js .css . gif .jpeg .jpg .png .ico .txt .swf .xml .JPEG .PNG .JPG #python代码:
if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]):
continue
로그인 후 복사
특수 상황이 있을 수 있습니다. 다양한 회사의 로그도 샘플링 분석이 필요합니다.
저작권: 이 글은 해당 블로거의 원본 글이므로 무단 복제할 수 없습니다. 블로거의 허락을 받았습니다.
위에서 내용을 포함하여 nginx 로그에서 유효한 요청 uri를 추출하는 [로그 분석]을 소개했습니다. PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되길 바랍니다.
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31