この状況では、Python は pickle または csv を使用する必要がありますか?

Question

データを保存するために何百もの M CSV ファイルが手元にあり、これらのデータを読み取ってプロットするために pandas と matplotlib を使用する必要がよくあります。通常、描画の前に前処理、スライスなどのクリーニング操作を実行する必要があります。図形を頻繁に操作したりレポートしたりする必要があるため、私は jupyter を使用します。

PHP中文网 · Answer

CSV は安全でなければなりません。pickle を別の Python バージョンに変更すると、読み取りエラーが発生する可能性があるようです。これは汎用形式ではありません。数百MB程度であれば、実際にCSVの読み込み速度は遅くありません。さらに、hdf5 という本格的なデータ交換フォーマットがあります。

天蓬老师 · Answer

csv では十分ではないと思われる場合は、hdf5 ファイルを試してみてください