[Protokollanalyse] Extrahieren Sie eine gültige Anforderungs-URI aus dem Nginx-Protokoll
Freigeben: 2016-08-08 09:19:23
Original
1195 Leute haben es durchsucht
Ich führe derzeit die Nginx-Protokollanalyse des Unternehmens durch. Eine der Anforderungen besteht darin, die zehn am häufigsten besuchten Seiten dieses Monats und deren Anzahl an Besuchen zu extrahieren. Um diese Anforderung zu erfüllen, müssen Sie zunächst die gültigen Seitenaufrufe bereinigen. Ich verwende die Eliminierungsmethode, um Zugriffe wie .js und .css zu entfernen. Allerdings hatte ich zunächst kein umfassendes Verständnis dafür, mit welchen Anfragen Suffixe entfernt werden sollten. Nach der Reinigung-> Probenahme-> Reinigung ist es notwendig, die folgenden Suffixe herauszufiltern
.js .css .gif .jpeg .jpg .png .ico .txt .JPEG .PNG .JPG #python代码:
if re.search(r"(\.js|\.css|\.gif|\.jpe?g|\.png|\.ico|\.txt|\.swf|\.JPE?G|\.PNG|\.xml)", request[1]):
continue
Nach dem Login kopieren
Es können einige besondere Umstände vorliegen Die Protokolle verschiedener Unternehmen erfordern auch eine Stichprobenanalyse
Urheberrechtserklärung: Dieser Artikel ist ein Originalartikel des Bloggers und darf nicht ohne reproduziert werden die Erlaubnis des Bloggers.
Das Obige hat [Protokollanalyse] eingeführt, um die gültige Anforderungs-URI im Nginx-Protokoll zu extrahieren, einschließlich des Inhalts. Ich hoffe, dass es für Freunde hilfreich sein wird, die an PHP-Tutorials interessiert sind.
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31