コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Pandas の特定の列にわたる重複行を効率的に削除するにはどうすればよいですか?

Pandas の特定の列にわたる重複行を効率的に削除するにはどうすればよいですか?

DDD

リリース： 2024-12-12 19:39:16

オリジナル

303 人が閲覧しました

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?

Python Pandas の複数の列にわたる重複行の削除

パンダの Drop_duplicates 関数は、データクレンジングのための貴重なツールである DataFrame から重複行を削除します。。この機能を拡張するには、一意性をチェックする列を指定できます。

たとえば、次の DataFrame について考えてみましょう。

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

ログイン後にコピー

列に同じ値を持つ行を削除するとします。「A」と「C」。この場合、行 0 と行 1 は削除されます。

以前は、このタスクには手動のフィルタリングまたは複雑な操作が必要でした。ただし、pandas の強化された Drop_duplicates 関数を使用すると、それが簡単になりました。 keep パラメータの導入により、重複の処理方法を制御できるようになります。

特定の列に一致する行を削除するには、subset パラメータを使用します。 keep を False に設定すると、すべての重複行を削除するようにパンダに指示します:

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

ログイン後にコピー

出力:

    A   B   C
2   foo 1   B
3   bar 1   A

ログイン後にコピー

ご覧のとおり、行 0 と 1 が正常に削除され、行 0 と 1 だけが残ります。列「A」および「C」の値に基づいて一意の行。

以上がPandas の特定の列にわたる重複行を効率的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース：php.cn

前の記事：範囲外のスライスによって Python 文字列でエラーが発生しないのはなぜですか? 次の記事：Selenium と Python を使用して新しいブラウザタブを効率的に開閉するにはどうすればよいですか?

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

Go で S3 オブジェクトを効率的にダウンロードするために io.WriterAt を実装するにはどうすればよいですか?

2024-12-12 21:46:11
C 一時オブジェクトは関数呼び出し内でどれくらい存続しますか?

2024-12-12 21:45:14
React エラー: 無効な要素タイプ: コンポーネントではなく「オブジェクト」を取得するのはなぜですか?

2024-12-12 21:44:16
Go でマップを使用して関数を動的に保存および呼び出すにはどうすればよいですか?

2024-12-12 21:43:09
jQuery での非同期 AJAX ファイルアップロードに FormData を使用するにはどうすればよいですか?

2024-12-12 21:42:14
Maven が maven-resources-plugin:2.5 プラグインの解決に失敗するのはなぜですか?その修正方法は?

2024-12-12 21:41:11
Java リストを配列に効率的に変換するにはどうすればよいですか?

2024-12-12 21:40:13
Java 仮想マシンで実行中のすべてのスレッドのリストを取得するにはどうすればよいですか?

2024-12-12 21:39:10
Java で JSONObject を使用して JSON オブジェクトを反復処理する方法

2024-12-12 21:38:16
テーブルを作成せずに MySQL で整数シーケンスを生成するにはどうすればよいですか?

2024-12-12 21:37:13

最新の問題

function_exists() はカスタム関数を決定できません Function test () {return true;} if (function_exists ('test')) {echo "テストは関数です";

から 2024-04-29 11:01:01

0

3

2165

Google Chromeのモバイル版を表示する方法こんにちは、先生、Google Chrome をモバイル版に変更するにはどうすればよいですか?

から 2024-04-23 00:22:19

0

11

2315

子ウィンドウは親ウィンドウを操作しますが、出力は応答しません。最初の 2 つの文は実行可能ですが、最後の文は実装できません。

から 2024-04-19 15:37:47

0

1

1950

親ウィンドウには出力がありません document.onclick = function(){ window.opener.document.write('私は子ウィンドウの出力です');

から 2024-04-18 23:52:34

0

1

1828

CSS マインドマッピングに関するコースウェアはどこにありますか? コースウェア

から 2024-04-16 10:10:18

0

0

1880

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート