Pandas での連続した重複の削除
Pandas シリーズから連続した重複を削除するには、いくつかの方法を使用できます。
方法 1: 使用するShift
最も効率的なアプローチは、shift() 関数を活用することです。
a.loc[a.shift() != a]
このメソッドは、シリーズをそれ自体のシフトされたバージョンと比較し、連続する重複が存在するブール マスクを作成します。
方法 2: を使用するDiff
別の方法は diff() 関数を使用することです:
a.loc[a.diff() != 0]
ただし、このアプローチは大規模なデータ セットの場合は若干遅くなります。
更新:
shift() をデフォルトの期間で使用することに注意することが重要です。 1 は、shift(1) と同等です。したがって、次のコードでも目的の出力が生成されます。
a.loc[a.shift(1) != a]
これらのメソッドを利用すると、pandas シリーズから連続する重複を効果的に削除し、個別の値のみが保持されるようにすることができます。
以上がPandas シリーズ内の連続する重複を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。