python去重函数是什么-Tutorial Python-php.cn

python去重函数是什么

爱喝马黛茶的安东尼

Lepaskan： 2019-10-25 17:57:02

asal

8765 orang telah melayarinya

python去重函数是什么

数据去重可以使用duplicated()和drop_duplicates()两个方法。

DataFrame.duplicated（subset = None，keep =‘first’）返回boolean Series表示重复行

参数：

subset：列标签或标签序列，可选

仅考虑用于标识重复项的某些列，默认情况下使用所有列

keep：{‘first’，‘last’，False}，默认’first’

first：标记重复，True除了第一次出现。

last：标记重复，True除了最后一次出现。

错误：将所有重复项标记为True。

相关推荐：《Python基础教程》

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
df = pd.read_csv(&#39;./demo_duplicate.csv&#39;)
print(df)
print(df[&#39;Seqno&#39;].unique()) # [0. 1.]
# 使用duplicated 查看重复值
# 参数 keep 可以标记重复值 {&#39;first&#39;，&#39;last&#39;，False}
print(df[&#39;Seqno&#39;].duplicated())
&#39;&#39;&#39;
0    False
1     True
2     True
3     True
4    False
Name: Seqno, dtype: bool
&#39;&#39;&#39;
# 删除 series 重复数据
print(df[&#39;Seqno&#39;].drop_duplicates())
&#39;&#39;&#39;
0    0.0
4    1.0
Name: Seqno, dtype: float64
&#39;&#39;&#39;
# 删除 dataframe 重复数据
print(df.drop_duplicates([&#39;Seqno&#39;])) # 按照 Seqno 来去重
&#39;&#39;&#39;
   Price     Seqno   Symbol   time
0  1623.0    0.0   APPL  1473411962
4  1649.0    1.0   APPL  1473411963
&#39;&#39;&#39;
# drop_dujplicates() 第二个参数 keep 包含的值 有： first、last、False
print(df.drop_duplicates([&#39;Seqno&#39;], keep=&#39;last&#39;)) # 保存最后一个
&#39;&#39;&#39;
   Price     Seqno   Symbol   time
3  1623.0    0.0   APPL  1473411963
4  1649.0    1.0   APPL  1473411963
&#39;&#39;&#39;

Salin selepas log masuk

Atas ialah kandungan terperinci python去重函数是什么. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!