파일 형식 HDF5(Hierarchical Data Format 5) 는 크고 복잡한 데이터 세트를 저장하고 처리하는 데 자주 사용됩니다. 다재다능하고 확장 가능하며 효과적이기 때문에 과학 및 산업 용도에 적합합니다. Python은 HDF5 파일을 생성하고 읽고 수정하는 데 사용할 수 있는 많은 프로그래밍 언어 중 하나입니다. 이 튜토리얼에서는 Python에서 HDF5 파일로 작업하는 방법을 보여줍니다.
"h5py" 패키지를 설치해야 합니다. Python의 패키지 설치 프로그램 pip를 사용하여 설치할 수 있습니다.
으아악Python에서 HDF5 파일을 생성하려면 먼저 "h5py.File" 클래스의 인스턴스를 생성해야 합니다. 그런 다음 이 인스턴스를 사용하여 파일의 데이터 세트와 그룹을 생성하고 조작할 수 있습니다.
으아악가져오기 h5py모듈
h5py 객체는 파일 형식의 헤더와 모드를 사용하여 생성되어야 합니다(쓰기는 "w", 읽기는 "r")
"데이터 세트 만들기" 및 "그룹 만들기" 기능을 사용하여 파일 내에 데이터 세트와 그룹을 만듭니다.
일반적인 NumPy 배열 표기법을 사용하여 데이터 세트를 채웁니다.
"닫기" 기술을 사용하여 개체 메모리를 확보하고 데이터를 파일로 플러시합니다.
단일 데이터 세트를 사용하여 HDF5 파일 만들기
으아악먼저 설치된 h5py 패키지를 가져옵니다. 쓰기 권한이 있는 "example.hdf5"라는 이름의 새 HDF5 파일을 만듭니다. 그런 다음 (10,) 형식을 갖고 데이터 유형이 정수인 "data"라는 컬렉션을 만듭니다. 그런 다음 루프를 사용하여 0~9 범위의 숫자를 데이터세트에 넣습니다. 메모리 누수를 방지하고 모든 데이터가 파일에 커밋되었음을 보장하기 위해 마지막에 이를 제거합니다. 이 코드는 Python h5py 모듈을 사용하여 새 HDF5 파일, 데이터세트를 생성하고 여기에 데이터를 추가하는 방법을 보여줍니다.
기존 HDF5 파일에서 데이터 읽기
으아악이렇게 하면 이전 예제에서 생성된 example.hdf5 파일을 읽고 암호를 해독한 후 콘솔에 인쇄합니다.
대규모 데이터 세트를 저장하고 배포하기 위한 강력한 파일 형식을 HDF5라고 합니다. 데이터 구성을 위한 계층화된 프레임워크를 제공하고 효율적인 저장을 위해 청크 및 압축을 지원합니다. h5py 모듈은 HDF5 파일을 생성하고 읽고 쓰기 위한 이해하기 쉬운 API를 제공하므로 HDF5를 Python 애플리케이션에 쉽게 통합할 수 있습니다. HDF5는 용도가 다양하기 때문에 Python에서 대용량 파일을 작업하는 모든 사람에게 유용한 도구입니다.
위 내용은 Python의 HDF5 파일의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!