GroupBy에서 목록을 생성하기 위해 DataFrame 행을 그룹화하는 방법
Pandas를 사용한 데이터 조작 영역에서는 DataFrame 행을 조작해야 하는 경우가 많습니다. 특정 형식으로. 일반적인 요구 사항 중 하나는 특정 열을 기준으로 행을 그룹화하고 다른 열의 값을 목록으로 검색하는 것입니다.
아래 표시된 대로 'a' 및 'b' 열이 있는 DataFrame을 고려해 보세요.
a b A 1 A 2 B 5 B 5 B 4 C 6
목표는 이 DataFrame을 행이 'a' 열로 그룹화되고 'b' 열의 값이 각 그룹에 대한 목록으로 변환되는 새로운 DataFrame으로 변환하는 것입니다. 원하는 출력은 다음과 같습니다.
A [1, 2] B [5, 5, 4] C [6]
이를 달성하기 위해 아래 설명과 같이 pandas 'groupby' 및 'apply' 기능을 활용할 수 있습니다.
# Import the pandas library import pandas as pd # Create a DataFrame from the provided data df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]}) # Group the DataFrame by column 'a' grouped = df.groupby('a') # Apply the list function to each group to get the 'b' values as lists group_b_lists = grouped['b'].apply(list) # Reset the index of the resulting Series to obtain a DataFrame df_result = group_b_lists.reset_index(name='b_lists') # Print the transformed DataFrame print(df_result)
이 코드는 효과적으로 원본 DataFrame을 'a' 열로 그룹화하고, 목록 함수를 각 그룹에 적용하고, 결과 목록을 'b_lists'라는 새 열에 할당합니다. 그런 다음 결과 DataFrame이 인쇄되어 원하는 출력을 표시합니다.
위 내용은 Pandas DataFrame 행을 그룹화하고 열 값을 목록으로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!