Mengira Baris dalam Fail dalam Java: Pendekatan Dioptimumkan
Dalam pemprosesan data, selalunya perlu menentukan bilangan baris dalam fail. Walaupun kaedah tradisional melibatkan membaca setiap baris secara individu, pendekatan ini boleh memakan masa. Di sini, kami meneroka penyelesaian yang lebih cekap.
Kunci untuk mengoptimumkan pengiraan baris terletak pada mengelakkan bacaan baris yang tidak perlu. Satu teknik ialah menggunakan aliran input buffer dan tatasusunan aksara untuk membaca data dalam ketulan. Semasa fail dibaca, setiap bait diperiksa dan pemisah baris dikira.
Satu pelaksanaan sedemikian, dikenali sebagai countLinesOld, melaksanakan tugas ini dengan cekap. Ia memulakan tatasusunan bait bersaiz 1024 dan membaca fail dalam ketulan saiz ini. Dengan memfokuskan hanya pada pemisah baris dalam bahagian ini, ia mengurangkan dengan ketara bilangan operasi bacaan.
Pengoptimuman yang lebih terkini, countLinesNew, menambah baik lagi pendekatan ini. Ia melakukan strategi yang sama seperti countLinesOld tetapi memastikan gelung dioptimumkan oleh pengkompil dengan menggunakan keadaan tertentu. Versi ini secara konsisten mengatasi penyelesaian lain, terutamanya untuk fail besar.
Hasil penanda aras menunjukkan keunggulan countLinesNew dan countLinesOld berbanding LineNumberReader yang biasa digunakan. Dalam ujian pada fail teks 1.3GB, countLinesNew secara konsisten menunjukkan prestasi terpantas, manakala countLinesOld mempunyai beberapa outlier tetapi juga mempamerkan prestasi yang lebih baik.
Atas ialah kandungan terperinci Bagaimanakah Kami Boleh Mengoptimumkan Pengiraan Talian di Java untuk Kecekapan Maksimum?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!