Pandas データフレームで重複する列を削除するにはどうすればよいですか?

DDD
リリース: 2024-11-01 14:08:02
オリジナル
288 人が閲覧しました

How to Remove Duplicate Columns in a Pandas Dataframe?

Pandas データフレームの重複する列を削除する

重複した列を含むデータフレームを扱う場合、データを有効にするにはこれらの冗長性を排除する必要があります。分析。この記事では、Pandas で重複する列を削除するための包括的なソリューションを提供し、問題のあらゆる側面に対処します。

重複した列名

重複した名前のみに基づいて列を削除するには、簡単な解決策は次のとおりです。

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
ログイン後にコピー

この行は重複する列名をチェックし、一意のもののみを保持します。

重複した列の値

重複値に基づいて列を削除することが目的の場合は、データフレームを転置せずに別のアプローチが必要です。

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
ログイン後にコピー

このメソッドは、各列内の重複値をチェックし、すべての値が重複している列を削除します。

重複したインデックス

重複したインデックスを削除するには、同様のアプローチに従います:

<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
ログイン後にコピー

追加のメモ

  • 提供されるソリューションは、データフレームが df という名前の変数に既に読み込まれていることを前提としています。
  • ~df.columns.duplicated() および ~df.index.duplicated() は、どの列またはインデックスが重複しています。
  • ~df.apply(lambda x: x.duplicated(),axis=1).all() の all() 関数は、列内のすべての値が重複しているかどうかを確認します。
  • .copy() メソッドは、変更を加えた新しいデータフレームを作成するために使用され、既存のデータフレームの変更に伴う問題を回避します。

以上がPandas データフレームで重複する列を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート