ホームページ > バックエンド開発 > Python チュートリアル > Pandas シリーズ内の連続する重複を削除するにはどうすればよいですか?

Pandas シリーズ内の連続する重複を削除するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-11-13 01:49:02
オリジナル
441 人が閲覧しました

How to Remove Consecutive Duplicates in a Pandas Series?

Pandas での連続した重複の削除

Pandas シリーズから連続した重複を削除するには、いくつかの方法を使用できます。

方法 1: 使用するShift

最も効率的なアプローチは、shift() 関数を活用することです。

a.loc[a.shift() != a]
ログイン後にコピー

このメソッドは、シリーズをそれ自体のシフトされたバージョンと比較し、連続する重複が存在するブール マスクを作成します。

方法 2: を使用するDiff

別の方法は diff() 関数を使用することです:

a.loc[a.diff() != 0]
ログイン後にコピー

ただし、このアプローチは大規模なデータ セットの場合は若干遅くなります。

更新:

shift() をデフォルトの期間で使用することに注意することが重要です。 1 は、shift(1) と同等です。したがって、次のコードでも目的の出力が生成されます。

a.loc[a.shift(1) != a]
ログイン後にコピー

これらのメソッドを利用すると、pandas シリーズから連続する重複を効果的に削除し、個別の値のみが保持されるようにすることができます。

以上がPandas シリーズ内の連続する重複を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート