Rumah > pembangunan bahagian belakang > Tutorial Python > Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python

Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python

WBOY
Lepaskan: 2022-08-25 19:11:18
ke hadapan
1683 orang telah melayarinya

[Cadangan berkaitan: Tutorial video Python3]

Ringkasan prasyarat

Python 2.0 tidak boleh dibaca secara langsung masalah mengambil jalan Cina memerlukan penulisan fungsi lain. python3.0 tidak boleh dibaca secara langsung pada tahun 2018.

Apabila saya menggunakannya sekarang, saya mendapati bahawa python3.0 boleh terus membaca laluan Cina.

Anda perlu membawa atau mencipta beberapa fail txt Adalah lebih baik untuk menulis beberapa data di dalamnya (nama, nombor telefon mudah alih, alamat)

Keperluan

Tulis kod Masa terbaik ialah menetapkan sendiri beberapa keperluan dan jelaskan matlamat berikut:

  • Perlu membaca semua fail yang sepadan dalam laluan direktori yang sepadan
  • Baca setiap satu rekod fail txt baris demi baris yang sepadan
  • Gunakan ungkapan biasa untuk mendapatkan nombor telefon mudah alih setiap baris
  • Simpan nombor telefon mudah alih dalam excel

Idea

  • 1) Baca fail
  • 2) Baca data
  • 3) Pengisihan data
  • 4) Pemadanan ungkapan biasa
  • 5) Pembuangan data Semula-
  • 6) Eksport dan simpan data

Kod

import glob
import re
import xlwt
filearray=[]
data=[]
phone=[]
filelocation=glob.glob(r'课堂实训/*.txt')
print(filelocation)
for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)
combine_data=sum(data,[])

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')
Salin selepas log masuk

Hasil berjalan

akan dijana Fail excel

analisis

import glob
import re
import xlwt
Salin selepas log masuk

glob digunakan untuk mencari fail, ungkapan biasa semula, xlwt digunakan Dalam excel

1) Baca fail

filelocation=glob.glob(r'课堂实训/*.txt')
Salin selepas log masuk

Semua fail txt dalam direktori yang ditentukan

2) Baca data

for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)
Salin selepas log masuk

Fail txt di bawah laluan dibaca dalam gelung dan fail dibaca mengikut urutan mengikut nombor siri
Buka fail yang sepadan dengan setiap kitaran
Baca data fail txt dalam setiap kitaran baris demi baris
Gunakan kaedah append() Tambahkan data setiap baris pada senarai data
Outputnya, anda boleh melihat beberapa data fail txt disimpan dalam senarai yang sama dalam bentuk lajur aksara

3) Pengisihan data

combine_data=sum(data,[])
Salin selepas log masuk

Senarai digabungkan menjadi satu senarai

4) Pemadanan ungkapan biasa ditambah penyahduplikasian data

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))
Salin selepas log masuk

set() fungsi: Penyahduplikasi tidak tertib, cipta Set elemen tidak berulang yang tidak tertib

6) Eksport data dan simpan

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')
Salin selepas log masuk
  • Buku kerja(' encoding=utf-8'): Tetapkan Pengekodan buku kerja
  • add_sheet('sheet1',cell_overwrite_ok=True):Buat lembaran kerja yang sepadan
  • write(x,y,z):Parameter sepadan dengan baris, lajur dan nilai

[Cadangan berkaitan: Tutorial video Python3]

Atas ialah kandungan terperinci Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:jb51.net
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan