数据表结构大概是这样:
日期 | ID | 销量 | 退货
2016-9-14 | 10001 | 100 | 15
2016-9-14 | 10002 | 71 | 4
2016-9-14 | 10003 | 10 | 4
2016-9-13 | 10001 | 50 | 18
2016-9-13 | 10002 | 31 | 28
2016-9-13 | 10003 | 40 | 23
需要做一些简单的数据统计,比如
找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ?
按照销量分级比如 [最近 3 天平均销量 0-50 件、 50-100 件、 100-200 件区间的商品,按照区间找出退货最高的 TOP10 ]
这种类型的统计,用什么样的解决方案比较合适?
把结果从 MYSQL 里面取出来,用 python 去处理好,还是直接在 MYSQL 里做完以后 python 只做呈现?
需求 1 : [找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ]
有没有比较好的实现思路或者代码参考? 有没有相关这类数据分析的资料推荐?
2 méthodes
Utiliser Excel
Utiliser le module pandas
SQL n'est pas facile de calculer les données entre deux lignes d'enregistrements
Il est très pratique à utiliser
pandas
La fonction
groupby
est spécialement conçue pour répondre à vos besoins