以下は、複数属性の重複データを重複排除する Python の例です。これは、優れた参考値であり、皆さんの役に立つことを願っています。一緒に見てみましょう
Pythonのpandasモジュールでデータを重複排除する手順:
1) DataFrameのduplicateメソッドを使用して、各行に重複行があるかどうかを示すブール系列を返します。重複行は FALSE として表示され、重複行は TRUE として表示されます。
2) DataFrame の Drop_duplicates メソッドを使用して、重複行が削除された DataFrame を返します。
注:
duplicateメソッドとdrop_duplicatesメソッドにパラメータが設定されていない場合、これら2つのメソッド名に指定された属性名(または列)が追加されている場合、これら2つのメソッドはデフォルトですべてを判定します。たとえば、frame.drop_duplicates(['state']) のように、いくつかの列 (状態列) を指定して重複を特定します。
具体的な例は次のとおりです。
以上がPython は複数属性の重複データを重複排除しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。