python - 一个关于过滤+去重的脚本疑问
巴扎黑
巴扎黑 2017-04-18 10:05:03
0
1
280

一个文件,每行都有起始ip的十进制整数,结束ip的十进制整数,地区名称三个字段。

因为地区字段可能重复,我想根据地区名称作为去重字段,并保留最小的起始ip,最大的结束ip。

目前是可以通过内存存对象,或者插数据库写sql来解决。

我想知道python是否有直接处理这种情况的库,魔法函数之类的?顺便问下awk是不是更适合处理这种文本?

巴扎黑
巴扎黑

reply all (1)
PHPzhong

Find a pandas module, code like this
result = data.groupby('region field')['start ip'].min()['end ip'].max(), I don't know if it can be implemented, go back You can study it

    Latest Downloads
    More>
    Web Effects
    Website Source Code
    Website Materials
    Front End Template
    About us Disclaimer Sitemap
    php.cn:Public welfare online PHP training,Help PHP learners grow quickly!