python - 一些常用的基础级的数据分析,比如 [连续 3 天有增长的排行榜单] 之类的算法用什么样的解决方案比较合适?
阿神
阿神 2017-04-18 09:37:43
0
2
365

数据表结构大概是这样:
日期 | ID | 销量 | 退货
2016-9-14 | 10001 | 100 | 15
2016-9-14 | 10002 | 71 | 4
2016-9-14 | 10003 | 10 | 4
2016-9-13 | 10001 | 50 | 18
2016-9-13 | 10002 | 31 | 28
2016-9-13 | 10003 | 40 | 23

需要做一些简单的数据统计,比如

  1. 找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ?

  2. 按照销量分级比如 [最近 3 天平均销量 0-50 件、 50-100 件、 100-200 件区间的商品,按照区间找出退货最高的 TOP10 ]

这种类型的统计,用什么样的解决方案比较合适?
把结果从 MYSQL 里面取出来,用 python 去处理好,还是直接在 MYSQL 里做完以后 python 只做呈现?

需求 1 : [找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ]
有没有比较好的实现思路或者代码参考? 有没有相关这类数据分析的资料推荐?

阿神
阿神

闭关修行中......

membalas semua(2)
洪涛

2 kaedah

  • Gunakan Excel

  • Gunakan modul panda

SQL bukan mudah untuk mengira data antara dua baris rekod

迷茫

Ia sangat mudah digunakan pandas
Fungsi groupby direka khas untuk mengendalikan keperluan anda

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan