如何使用Python正規表示式進行CSV檔案處理

WBOY
發布: 2023-06-23 08:36:09
原創
1517 人瀏覽過

隨著大數據時代的到來,CSV檔案成為了非常重要的一種資料交換格式。在日常的數據處理中,我們經常需要對CSV檔案進行一些客製化的處理,例如過濾掉一些數據,替換一些關鍵字等等。而在Python中,使用正規表示式可以非常方便地完成這些任務。本文將介紹如何使用Python正規表示式進行CSV檔案處理。

  1. 讀取CSV檔案

首先,我們需要讀取CSV檔案。在Python中,使用csv模組可以輕鬆實現CSV檔案的讀取。

import csv

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
登入後複製

上述程式碼將讀取名為data.csv的CSV文件,並逐行列印其內容。參數delimiter指定了分隔符,quotechar指定了引號。

  1. 使用正規表示式過濾資料

接著,我們可以使用正規表示式對CSV檔案中的資料進行過濾。例如,我們可以只選擇第一列為數字的行。

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
登入後複製

上述程式碼使用了re模組的match函數,將所有第一列為數字的行列印出來。

  1. 取代關鍵字

除了過濾資料外,我們還可以使用正規表示式來取代CSV檔案中的關鍵字。例如,我們可以將所有以apple開頭的單字替換成orange。

import csv
import re

with open('data.csv', newline='') as csvfile:

reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
登入後複製

上述程式碼使用了re模組的sub函數,將所有以apple開頭的單字替換成orange。

  1. 寫入CSV檔案

最後,我們需要將處理過的資料寫入CSV檔案。在Python中,同樣使用csv模組可以實現CSV檔案的寫入。

import csv

data = [

['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
登入後複製

]

with open('output.csv', 'w', newline='') as csvfile:

writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
登入後複製

上述程式碼將data清單寫入名為output.csv的CSV檔案中,參數delimiter和quotechar等同於讀取CSV檔案的參數,而quoting參數指定了引號如何處理。

綜上,使用Python正規表示式進行CSV檔案處理非常簡單且方便。透過合理使用正規表示式,我們可以輕鬆實現一些複雜的CSV檔案處理任務。

以上是如何使用Python正規表示式進行CSV檔案處理的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!