데이터 프레임을 참가자별 데이터 프레임으로 분할
응답자 60명의 데이터가 포함된 대규모 데이터 프레임이 있으며 이를 여러 개의 데이터 프레임으로 나눌 방법을 찾고 있습니다. 각 참가자에 대한 개별 데이터프레임. 각 참가자의 고유 코드는 'name'이라는 변수에 저장됩니다.
처음에는 'name' 변수를 기반으로 데이터 프레임을 추가하는 사용자 지정 함수를 사용하려고 시도했지만 실행 시간이 비정상적으로 오래 걸렸습니다. .
더 효율적인 접근 방식은 Pandas DataFrame에서 슬라이싱을 활용하는 것입니다. 다음 코드는 솔루션을 제공합니다.
import pandas as pd import numpy as np # Create sample data with a 'Names' column data = pd.DataFrame({'Names': ['Joe', 'John', 'Jasper', 'Jez'] * 4, 'Ob1': np.random.rand(16), 'Ob2': np.random.rand(16)}) # Create a unique list of names UniqueNames = data.Names.unique() # Create a dictionary to store the split dataframes DataFrameDict = {elem: pd.DataFrame() for elem in UniqueNames} # Iterate through UniqueNames and slice the original data for key in DataFrameDict.keys(): DataFrameDict[key] = data[data.Names == key] # Access a specific dataframe using its name specific_dataframe = DataFrameDict['Joe']
이 접근 방식은 슬라이싱에 사용되는 '이름' 열을 사용하여 각 참가자에 대한 개별 데이터 프레임을 신속하게 생성합니다. 결과 데이터프레임은 DataFrameDict 사전 내에 구성되어 쉽게 액세스할 수 있습니다.
위 내용은 Pandas DataFrame을 참가자별 DataFrame으로 효율적으로 분할하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!