대형 Pandas DataFrame 분할
423244개 행으로 구성된 대형 Pandas DataFrame을 생각해 보세요. 이 DataFrame을 4개의 동일한 부분으로 나눌 필요가 있습니다. 그러나 np.split(df, 4)를 사용하려고 시도하면 "ValueError: 배열 분할로 인해 균등 분할이 발생하지 않습니다." 오류가 발생합니다.
이 문제를 해결하려면 np.array_split을 사용해야 합니다. np.split과 달리 np.array_split에서는 indices_or_sections가 동일한 축 분할을 생성하지 않는 정수가 될 수 있습니다.
<code class="python">import pandas as pd import numpy as np # Create a DataFrame df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}) # Split the DataFrame into three equal parts result = np.array_split(df, 3) # Print the results for i in range(len(result)): print(f"Part {i + 1}:") print(result[i]) print()</code>
이 코드는 DataFrame을 거의 동일한 세 부분으로 분할합니다. 필요에 따라 부품 수를 조정할 수 있습니다.
위 내용은 대형 Pandas DataFrame을 동일한 부분으로 분할하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!