정보를 보존하면서 열의 DataFrame 병합
Pandas를 사용하여 Python에서 데이터 작업을 할 때 공통 열을 기반으로 데이터 프레임을 병합하는 것은 일반적입니다. 일. 그러나 때로는 두 데이터 프레임의 정보를 유지해야 하는 경우도 있습니다. 특히 중복되지만 불완전한 데이터가 포함된 경우 더욱 그렇습니다. 이 문서에서는 기본 데이터 프레임의 정보가 보존되도록 하면서 열의 데이터 프레임을 병합하는 솔루션을 살펴봅니다.
문제 설명
두 개의 데이터 프레임 df1과 df2를 고려해 보세요. df1에는 개인의 연령에 대한 정보가 포함되고 df2에는 성별이 포함됩니다. 목표는 '이름' 열에서 df1과 df2를 병합하되 df1의 정보만 유지하는 것입니다. 개인이 두 데이터프레임 모두에 항상 존재하지 않을 수도 있습니다.
해결책
이를 달성하기 위해 인덱스를 설정하여 생성된 시리즈의 map() 메서드를 사용할 수 있습니다. 병합하려는 열에 하나의 데이터 프레임을 추가합니다. map() 메소드를 사용하면 매핑 함수를 적용할 수 있으며, 이 경우 다른 데이터 프레임에서 조회됩니다.
<code class="python"># Create the dataframes df1 = pd.DataFrame({'Name': ['Tom', 'Sara', 'Eva', 'Jack', 'Laura'], 'Age': [34, 18, 44, 27, 30]}) df2 = pd.DataFrame({'Name': ['Tom', 'Paul', 'Eva', 'Jack', 'Michelle'], 'Sex': ['M', 'M', 'F', 'M', 'F']}) # Set the index of df2 to Name df2.set_index('Name', inplace=True) # Perform the lookup using map df1['Sex'] = df1['Name'].map(df2['Sex']) # Display the merged dataframe print(df1)</code>
대체 솔루션: Left Join
또는 왼쪽 조인이 포함된 병합을 사용할 수 있습니다. 그러면 df2에 해당 행이 없더라도 df1의 모든 행이 병합된 데이터 프레임에 포함됩니다.
<code class="python"># Perform the left join df3 = df1.merge(df2, on='Name', how='left') # Display the merged dataframe print(df3)</code>
참고: 데이터 프레임에 병합할 여러 열이 포함된 경우 merge(on=['Year', 'Code'], How='left')를 사용하거나 왼쪽 병합 이후에 열을 지정합니다(예: df1.merge( df2[['연도', '코드', '값']], on=['연도', '코드'], 방법='왼쪽')).
중복 처리
병합에 사용된 열이 중복된 경우 중복된 값을 처리하여 모호성을 방지하는 것이 중요합니다. 이는 drop_duplicates()를 사용하거나 사전을 사용하여 매핑을 지정함으로써 수행할 수 있습니다.
위 내용은 기본 DataFrame의 정보를 보존하면서 열의 DataFrame을 병합하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!