Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁-파이썬 튜토리얼-php.cn

Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

Pandas 실용 가이드: 데이터 행을 빠르게 삭제하기 위한 팁

개요:
Pandas는 강력한 데이터 처리 및 조작 기능을 갖춘 Python에서 일반적으로 사용되는 데이터 분석 라이브러리입니다. 데이터 처리 중에 불필요한 행 데이터를 삭제해야 하는 경우가 많습니다. 이 기사에서는 팬더를 사용하여 행 데이터를 삭제하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다.

1. 특정 조건에서 행 데이터 삭제

특정 값이 있는 행 삭제:
Pandas에서는 DataFrame의 drop 메서드를 사용하여 특정 값이 있는 행을 삭제할 수 있습니다. 먼저 샘플 데이터 세트를 생성해야 합니다.

import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)

로그인 후 복사

이제 성별이 남성인 행을 삭제하려면 다음 코드를 사용하면 됩니다.

df = df.drop(df[df['Gender'] == 'Male'].index)

로그인 후 복사

실행 후 성별이 남성인 행 데이터가 삭제됩니다. df에서.
코드 분석:

df['Gender'] == 'Male'은 Gender 열에 Male 값이 있는 행을 나타내는 부울 계열 개체를 반환하는 조건부 판단문입니다.df['Gender'] == 'Male'是一个条件判断语句，返回一个布尔类型的Series对象，表示Gender列中值为Male的行；
df[df['Gender'] == 'Male'].index返回索引，即Gender为'Male'的行所在的索引位置；
df.drop()方法可以根据索引删除行。

删除空值行：
有时候需要删除包含空值的行数据，例如：

import pandas as pd import numpy as np data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, np.nan, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)

로그인 후 복사

我们可以使用dropna()方法删除包含空值的行：

df = df.dropna()

로그인 후 복사

运行后，df将删除包含空值的行数据。

删除重复行：
若数据集中包含重复的行，我们可以使用drop_duplicates()方法删除重复行数据：

import pandas as pd data = {'Name': ['Alice', 'Bob', 'Bob', 'David'], 'Age': [25, 30, 30, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)

로그인 후 복사

现在我们可以使用以下代码删除重复行：

df = df.drop_duplicates()

로그인 후 복사

二、根据行索引删除行
有时我们需要根据行索引进行删除，可以使用drop()df[df['Gender'] == 'Male'].index성별이 'Male'인 행의 인덱스 위치, 즉 인덱스를 반환합니다.

df .drop()메소드는 인덱스를 기반으로 행을 삭제할 수 있습니다.

null 값이 있는 행 삭제:

import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)

로그인 후 복사

dropna()<를 사용할 수 있습니다. /code> null 값이 포함된 행을 삭제하는 방법: 
df = df.drop(2)
로그인 후 복사
실행 후 df는 null 값이 포함된 행 데이터를 삭제합니다. 
중복 행 삭제: 데이터 세트에 중복 행이 포함된 경우 drop_duplicates()메서드를 사용하여 중복 행 데이터를 삭제할 수 있습니다.
        

        
        
         
          
           import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
           
            로그인 후 복사
           
          
          
           로그인 후 복사
          
         
         
          로그인 후 복사
         
        
        
이제 우리는 다음 코드는 중복 행을 삭제합니다.
        
        
         df = df.drop([1, 2])
         
          로그인 후 복사
         
        2. 행 인덱스를 기준으로 행 삭제 행 인덱스를 기준으로 삭제해야 하는 경우가 있습니다.
        drop()메서드를 사용하여 행 데이터를 삭제할 수 있습니다. 인덱스를 기준으로 합니다.
        
         df = df.drop(df.index[1:4])
         
          로그인 후 복사
         
        인덱스 2가 있는 행을 삭제한다고 가정하면 다음 코드를 사용할 수 있습니다. rrreee실행 후 인덱스 2가 있는 행이 삭제됩니다. 3. 여러 행 삭제 여러 행을 삭제해야 하는 경우가 있는데, 이는 인덱싱된 목록을 전달하거나 슬라이싱을 사용하여 수행할 수 있습니다. rrreee예 1: 인덱스 1과 2가 있는 행 삭제rrreee예 2: 인덱스 1~3이 있는 행 삭제rrreee위의 두 방법 모두 여러 행을 빠르게 삭제할 수 있습니다. 결론: 이 글에서는 Pandas를 사용하여 행 데이터를 삭제하는 기술을 소개하고 구체적인 코드 예제를 제공합니다. 데이터를 처리하는 동안 이러한 기술을 사용하면 불필요한 데이터 행을 빠르고 효율적으로 삭제하는 데 도움이 될 수 있습니다. 독자들이 실제 응용 분야에서 유연하게 활용하여 데이터 처리 속도와 정확성을 높일 수 있기를 바랍니다.
        위 내용은 Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!