masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > 关于Python读取文件的四种不同方法的比较

关于Python读取文件的四种不同方法的比较

黄舟

Lepaskan： 2017-05-22 23:23:20

asal

2149 orang telah melayarinya

Python的文本处理是经常碰到的一个问题，下面这篇文章主要给大家介绍了关于Python读取文件的几种不同方法比对的相关资料，文中给出了详细的示例代码供大家理解和学习，需要的朋友们下面来一起看看吧。

前言

大家都知道Python 读文件的方式多种多样，但是当需要读取一个大文件的时候，不同的读取方式会有不一样的效果。下面就来看看详细的介绍吧。

场景

逐行读取一个 2.9G 的大文件

CPU i7 6820HQ
RAM 32G

方法

对每一行的读取进行一次分割字符串操作

以下方法都使用 with…as 方法打开文件。

with 语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，释放资源，比如文件使用后自动关闭、线程中锁的自动获取和释放等。

方法一最通用的读文件方式

with open(file, &#39;r&#39;) as fh:
 for line in fh.readlines():
 line.split("|")

Salin selepas log masuk

运行结果：耗时 15.4346568584 秒

系统监视器中显示内存从 4.8G 一下子飙到了 8.4G， fh.readlines() 将读取的所有行数据存到内存，这种方法适合小文件。

方法二

with open(file, &#39;r&#39;) as fh:
 line = fh.readline()
 while line:
 line.split("|")

Salin selepas log masuk

运行结果：耗时 22.3531990051 秒

内存几乎没有变化，因为内存中只存取一行的数据，但是时间明显比上一次的长，对于进一步处理数据来说效率不高。

方法三

with open(file) as fh:
 for line in fh:
 line.split("|")

Salin selepas log masuk

运行结果：耗时 13.9956979752 秒

内存几乎没有变化，速度也比方法二快。

for line in fh 将文件对象 fh 视为可迭代的，它自动使用缓冲的 IO 和内存管理，因此您不必担心大文件。这是很 pythonic 的方式！

方法四 fileinput 模块

for line in fileinput.input(file):
 line.split("|")

Salin selepas log masuk

运行结果：耗时 26.1103110313 秒

内存增加了 200-300 MB，速度是以上最慢的。

总结

以上方法仅供参考，公认的大文件读取方法还是三最好。但是具体情况还是要根据机器的性能、处理数据的复杂度。

【相关推荐】

1. Python读取文件后n行的代码示例

2. 使用python读取文件小程序

Atas ialah kandungan terperinci 关于Python读取文件的四种不同方法的比较. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

Python，读取文件

sumber：php.cn

Artikel sebelumnya：python微信库itchat如何实现微信自动回复功能的代码实例 Artikel seterusnya：python中如何定义和调用类详解

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

从零开始打造自己的PHP框架的视频资料

2023-03-15 16:54:01
PHPMailer如何利用QQ邮箱完成邮件发送功能的实例分析

2023-03-15 12:26:02
php中关于IMAP如何收取邮件的方法介绍

2023-03-14 18:58:01
php如何快速实现数组去重的实例

2023-03-14 11:30:01
html中关于<a>标签的全部属性的使用总结

1970-01-01 08:00:00
php基础知识总结（新手入门必备）

2023-03-16 15:20:01
JavaScript中typeof的使用方法介绍

1970-01-01 08:00:00
JavaScript中confirm()方法的使用介绍

1970-01-01 08:00:00
HTML5 Placeholder属性的详情介绍

1970-01-01 08:00:00
ReactJS中表单的单选多选与反选的实现方法

1970-01-01 08:00:00

Isu terkini

Apakah amalan terbaik untuk memaparkan maklumat versi dalam aplikasi web? Saya sedang membangunkan aplikasi web. Apakah amalan terbaik untuk memaparkan maklumat ver...

daripada 2024-04-06 19:13:16

0

2

476

Kemungkinan untuk menyimpan kod ASP Classic sebagai rentetan dalam pangkalan data MYSQL Adakah mungkin untuk menyimpan kod klasik asp ke dalam pangkalan data MySQL dan minta ia m...

daripada 2024-04-06 13:38:43

0

1

358

Apl React Saya tidak akan dimuatkan selepas mengubah suai tetapan proxy_pass nginx Saya mempunyai backend dan nginx ReactappNodeJS. Saya telah memperoleh sijil dan memasangn...

daripada 2024-04-05 11:53:10

0

1

316

Muat semula paksa adalah akibat daripada mengakses laluan tidak ditentukan atau halaman ralat dalam Next.js Mengakses laluan atau halaman ralat yang tidak ditentukan menyebabkan Next.js melakukan mu...

daripada 2024-04-05 08:32:46

0

1

400

Dapatkan semula sejarah kaedah pembayaran untuk pelanggan WooCommerce Saya menjumpai skrip yang membantu saya mendapatkan maklumat yang saya perlukan: kaedah pe...

daripada 2024-04-04 14:57:11

0

1

428

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan