数据表结构大概是这样:
日期 | ID | 销量 | 退货
2016-9-14 | 10001 | 100 | 15
2016-9-14 | 10002 | 71 | 4
2016-9-14 | 10003 | 10 | 4
2016-9-13 | 10001 | 50 | 18
2016-9-13 | 10002 | 31 | 28
2016-9-13 | 10003 | 40 | 23
需要做一些简单的数据统计,比如
找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ?
按照销量分级比如 [最近 3 天平均销量 0-50 件、 50-100 件、 100-200 件区间的商品,按照区间找出退货最高的 TOP10 ]
这种类型的统计,用什么样的解决方案比较合适?
把结果从 MYSQL 里面取出来,用 python 去处理好,还是直接在 MYSQL 里做完以后 python 只做呈现?
需求 1 : [找出连续 n 天 sell_count 都在增长的商品,并且按照增长幅度排名的 top10 ]
有没有比较好的实现思路或者代码参考? 有没有相关这类数据分析的资料推荐?
2가지 방법
엑셀 사용
Pandas 모듈 사용
SQL은 두 행의 레코드 사이의 데이터를 계산하기가 쉽지 않습니다
사용이 매우 편리합니다
pandas
groupby
기능은 사용자의 요구 사항을 처리하도록 특별히 설계되었습니다