> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame을 참가자별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?

Pandas DataFrame을 참가자별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?

DDD
풀어 주다: 2024-11-30 20:07:14
원래의
272명이 탐색했습니다.

How Can I Efficiently Split a Pandas DataFrame into Participant-Specific DataFrames?

데이터 프레임을 참가자별 데이터 프레임으로 분할

응답자 60명의 데이터가 포함된 대규모 데이터 프레임이 있으며 이를 여러 개의 데이터 프레임으로 나눌 방법을 찾고 있습니다. 각 참가자에 대한 개별 데이터프레임. 각 참가자의 고유 코드는 'name'이라는 변수에 저장됩니다.

처음에는 'name' 변수를 기반으로 데이터 프레임을 추가하는 사용자 지정 함수를 사용하려고 시도했지만 실행 시간이 비정상적으로 오래 걸렸습니다. .

더 효율적인 접근 방식은 Pandas DataFrame에서 슬라이싱을 활용하는 것입니다. 다음 코드는 솔루션을 제공합니다.

import pandas as pd
import numpy as np

# Create sample data with a 'Names' column
data = pd.DataFrame({'Names': ['Joe', 'John', 'Jasper', 'Jez'] * 4,
                     'Ob1': np.random.rand(16),
                     'Ob2': np.random.rand(16)})

# Create a unique list of names
UniqueNames = data.Names.unique()

# Create a dictionary to store the split dataframes
DataFrameDict = {elem: pd.DataFrame() for elem in UniqueNames}

# Iterate through UniqueNames and slice the original data
for key in DataFrameDict.keys():
    DataFrameDict[key] = data[data.Names == key]

# Access a specific dataframe using its name
specific_dataframe = DataFrameDict['Joe']
로그인 후 복사

이 접근 방식은 슬라이싱에 사용되는 '이름' 열을 사용하여 각 참가자에 대한 개별 데이터 프레임을 신속하게 생성합니다. 결과 데이터프레임은 DataFrameDict 사전 내에 구성되어 쉽게 액세스할 수 있습니다.

위 내용은 Pandas DataFrame을 참가자별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿