Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

王林
풀어 주다: 2024-01-10 09:09:42
원래의
588명이 탐색했습니다.

Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁

Pandas 실용 가이드: 데이터 행을 빠르게 삭제하기 위한 팁

개요:
Pandas는 강력한 데이터 처리 및 조작 기능을 갖춘 Python에서 일반적으로 사용되는 데이터 분석 라이브러리입니다. 데이터 처리 중에 불필요한 행 데이터를 삭제해야 하는 경우가 많습니다. 이 기사에서는 팬더를 사용하여 행 데이터를 삭제하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다.

1. 특정 조건에서 행 데이터 삭제

  1. 특정 값이 있는 행 삭제:
    Pandas에서는 DataFrame의 drop 메서드를 사용하여 특정 값이 있는 행을 삭제할 수 있습니다. 먼저 샘플 데이터 세트를 생성해야 합니다.
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
로그인 후 복사
로그인 후 복사
로그인 후 복사

이제 성별이 남성인 행을 삭제하려면 다음 코드를 사용하면 됩니다.

df = df.drop(df[df['Gender'] == 'Male'].index)
로그인 후 복사

실행 후 성별이 남성인 행 데이터가 삭제됩니다. df에서.
코드 분석:

  • df['Gender'] == 'Male'은 Gender 열에 Male 값이 있는 행을 나타내는 부울 계열 개체를 반환하는 조건부 판단문입니다.df['Gender'] == 'Male'是一个条件判断语句,返回一个布尔类型的Series对象,表示Gender列中值为Male的行;
  • df[df['Gender'] == 'Male'].index返回索引,即Gender为'Male'的行所在的索引位置;
  • df.drop()方法可以根据索引删除行。
  1. 删除空值行:
    有时候需要删除包含空值的行数据,例如:
import pandas as pd import numpy as np data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, np.nan, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
로그인 후 복사

我们可以使用dropna()方法删除包含空值的行:

df = df.dropna()
로그인 후 복사

运行后,df将删除包含空值的行数据。

  1. 删除重复行:
    若数据集中包含重复的行,我们可以使用drop_duplicates()方法删除重复行数据:
import pandas as pd data = {'Name': ['Alice', 'Bob', 'Bob', 'David'], 'Age': [25, 30, 30, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
로그인 후 복사

现在我们可以使用以下代码删除重复行:

df = df.drop_duplicates()
로그인 후 복사

二、根据行索引删除行
有时我们需要根据行索引进行删除,可以使用drop()df[df['Gender'] == 'Male'].index성별이 'Male'인 행의 인덱스 위치, 즉 인덱스를 반환합니다.

df .drop()메소드는 인덱스를 기반으로 행을 삭제할 수 있습니다.

    null 값이 있는 행 삭제:

    때때로 null 값이 포함된 행 데이터를 삭제해야 하는 경우가 있습니다. 예:


    import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
    로그인 후 복사
    로그인 후 복사
    로그인 후 복사

    dropna()<를 사용할 수 있습니다. /code> null 값이 포함된 행을 삭제하는 방법:

    df = df.drop(2)
    로그인 후 복사

    실행 후 df는 null 값이 포함된 행 데이터를 삭제합니다.

      중복 행 삭제:

      데이터 세트에 중복 행이 포함된 경우 drop_duplicates()메서드를 사용하여 중복 행 데이터를 삭제할 수 있습니다.

      import pandas as pd data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'], 'Age': [25, 30, 35, 40], 'Gender': ['Female', 'Male', 'Male', 'Male']} df = pd.DataFrame(data)
      로그인 후 복사
      로그인 후 복사
      로그인 후 복사

      이제 우리는 다음 코드는 중복 행을 삭제합니다.

      df = df.drop([1, 2])
      로그인 후 복사
      2. 행 인덱스를 기준으로 행 삭제 행 인덱스를 기준으로 삭제해야 하는 경우가 있습니다. drop()메서드를 사용하여 행 데이터를 삭제할 수 있습니다. 인덱스를 기준으로 합니다.
      df = df.drop(df.index[1:4])
      로그인 후 복사
      인덱스 2가 있는 행을 삭제한다고 가정하면 다음 코드를 사용할 수 있습니다. rrreee실행 후 인덱스 2가 있는 행이 삭제됩니다. 3. 여러 행 삭제 여러 행을 삭제해야 하는 경우가 있는데, 이는 인덱싱된 목록을 전달하거나 슬라이싱을 사용하여 수행할 수 있습니다. rrreee예 1: 인덱스 1과 2가 있는 행 삭제rrreee예 2: 인덱스 1~3이 있는 행 삭제rrreee위의 두 방법 모두 여러 행을 빠르게 삭제할 수 있습니다. 결론: 이 글에서는 Pandas를 사용하여 행 데이터를 삭제하는 기술을 소개하고 구체적인 코드 예제를 제공합니다. 데이터를 처리하는 동안 이러한 기술을 사용하면 불필요한 데이터 행을 빠르고 효율적으로 삭제하는 데 도움이 될 수 있습니다. 독자들이 실제 응용 분야에서 유연하게 활용하여 데이터 처리 속도와 정확성을 높일 수 있기를 바랍니다.

      위 내용은 Pandas 실용 가이드: 행 데이터를 빠르게 삭제하기 위한 팁의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!