Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

Lepaskan: 2023-08-10 15:25:26
ke hadapan
1220 orang telah melayarinya

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!


Perayaan Bulan Pertengahan Musim Luruh, Perayaan Pertengahan Musim Luruh Festival Musim Luruh, Musim Luruh Festival Pertengahan Musim Luruh Perayaan, Perayaan Pemujaan Bulan, Perayaan Bulan Niang, Perayaan Bulan, Perayaan Reuni, dan lain-lain adalah perayaan tradisional kaum Cina. Sejak zaman dahulu, terdapat adat resam seperti menyembah bulan, menghargai bulan, makan kuih bulan, bermain tanglung, menghargai osmanthus, dan meminum arak osmanthus yang telah diwarisi sehingga kini dan bertahan lama. Dalam keluaran ini, kami menganalisis jualan Moubao Mid-Autumn Mooncakes untuk melihat
perisa kuih bulan yang manakah laris manis
, dan di mana tempat saya dapat menjual dengan baik kawan Membantu.
Perpustakaan yang terlibat:
  • Pyecharts — Visualisasi Data

  • jieba — Pembahagian perkataan
  • koleksi — Bahagian statistik

:

  • Bar — Carta bar
  • Carta pai — Pie
  • Peta— Peta
  • Stylecloud — Word Cloud
1. Import modul
import re
import jieba
import stylecloud
import numpy as np
import pandas as pd
from collections import Counter
from pyecharts.charts import Bar
from pyecharts.charts import Map 
from pyecharts.charts import Pie
from pyecharts.charts import Grid
from pyecharts.charts import Page
from pyecharts.components import Image
from pyecharts.charts import WordCloud
from pyecharts import options as opts 
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode
Salin selepas log masuk
2.

2.1 Baca data
df = pd.read_excel("月饼.xlsx")
df.head(10)
Salin selepas log masuk
Hasil:
Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!
2.2 去除重复值
print(df.shape)
df.drop_duplicates(inplace=True)
print(df.shape)
Salin selepas log masuk
(4520, 5)
(1885, 5)
Salin selepas log masuk
一共有4520条数据,去重后还有1885条数据(某宝一个店铺会在不同页面推荐,导致重复数据比较多)
2.3 空值处理
处理购买人数为空的记录:df['付款情况'] = df['付款情况'].replace(np.nan,'0人付款')
Salin selepas log masuk

2.4 处理付款情况字段

df[df['付款情况'].str.contains("万")]
Salin selepas log masuk
Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

付款人数超过10000后会直接用""替代,这里我们需要将其恢复:

# 提取数值
df['num'] = [re.findall(r'(\d+\.{0,1}\d*)', i)[0] for i in df['付款情况']] 
df['num'] = df['num'].astype('float')

# 提取单位(万)
df['unit'] = [''.join(re.findall(r'(万)', i)) for i in df['付款情况']] 
df['unit'] = df['unit'].apply(lambda x:10000 if x=='万' else 1)

# 计算销量
df['销量'] = df['num'] * df['unit']
df = df[df['地址'].notna()]
df['省份'] = df['地址'].str.split(' ').apply(lambda x:x[0])

# 删除多余的列
df.drop(['付款情况', 'num', 'unit'], axis=1, inplace=True)

# 重置索引
df = df.reset_index(drop=True)
Salin selepas log masuk

结果:

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!


3. Pyecharts数据可视化

3.1 月饼商品销量Top10

代码:

shop_top10 = df.groupby('商品名称')['销量'].sum().sort_values(ascending=False).head(10)
bar0 = (
    Bar()
        .add_xaxis(shop_top10.index.tolist()[::-1])
        .add_yaxis('sales_num', shop_top10.values.tolist()[::-1])
        .reversal_axis()
        .set_global_opts(title_opts=opts.TitleOpts(title='月饼商品销量Top10'),
                         xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-30))) 
        .set_series_opts(label_opts=opts.LabelOpts(position='right'))
)
Salin selepas log masuk

效果:

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

商品名称太长显示不全,我们调整一下边距

bar1 = (
    Bar()
        .add_xaxis(shop_top10.index.tolist()[::-1])
        .add_yaxis('sales_num', shop_top10.values.tolist()[::-1],itemstyle_opts=opts.ItemStyleOpts(color=JsCode(color_js)))
        .reversal_axis()
        .set_global_opts(title_opts=opts.TitleOpts(title='月饼商品销量Top10'),
             xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-30)),
             ) 
        .set_series_opts(label_opts=opts.LabelOpts(position='right'))
)
# 将图形整体右移
grid = (
    Grid()
        .add(bar1, grid_opts=opts.GridOpts(pos_left='45%', pos_right='10%')) 
)
Salin selepas log masuk
Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!
这样是不是好多了。

还可以来些其他(比如:形状)设置:

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

3.2 月饼销量排名TOP10店铺

代码:

shop_top10 = df.groupby('店铺名称')['销量'].sum().sort_values(ascending=False).head(10)
bar3 = (
    Bar(init_opts=opts.InitOpts(
        width='800px', height='600px',))
    .add_xaxis(shop_top10.index.tolist())
    .add_yaxis('', shop_top10.values.tolist(),
               category_gap='30%',
              )

    .set_global_opts(
        xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-30)),
        title_opts=opts.TitleOpts(
            title='月饼销量排名TOP10店铺',
            pos_left='center',
            pos_top='4%',
            title_textstyle_opts=opts.TextStyleOpts(
                color='#ed1941', font_size=16)
        ),
        visualmap_opts=opts.VisualMapOpts(
            is_show=False,
            max_=600000,
            range_color=["#CCD3D9", "#E6B6C2", "#D4587A","#FF69B4", "#DC364C"]
        ),
     )
)
bar3.render_notebook()
Salin selepas log masuk
效果:

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

稻香村的月饼销量遥遥领先。

3.3 全国各地区月饼销量

province_num = df.groupby('省份')['销量'].sum().sort_values(ascending=False) 
map_chart = Map(init_opts=opts.InitOpts(theme='light',
                                        width='800px',
                                        height='600px'))
map_chart.add('',
              [list(z) for z in zip(province_num.index.tolist(), province_num.values.tolist())],
              maptype='china',
              is_map_symbol_show=False,
              itemstyle_opts={
                  'normal': {
                      'shadowColor': 'rgba(0, 0, 0, .5)', # 阴影颜色
                      'shadowBlur': 5, # 阴影大小
                      'shadowOffsetY': 0, # Y轴方向阴影偏移
                      'shadowOffsetX': 0, # x轴方向阴影偏移
                      'borderColor': '#fff'
                  }
              }
              )
map_chart.set_global_opts(
    visualmap_opts=opts.VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        min_ = 0,
        max_ = 1,
        split_number = 5,
        series_index=0,
        pos_top='70%',
        pos_left='10%',
        range_text=['销量(份):', ''],
        pieces=[
            {'max':2000000, 'min':200000, 'label':'> 200000', 'color': '#990000'},
            {'max':200000, 'min':100000, 'label':'100000-200000', 'color': '#CD5C5C'},
            {'max':100000, 'min':50000, 'label':'50000-100000', 'color': '#F08080'},
            {'max':50000, 'min':10000, 'label':'10000-50000', 'color': '#FFCC99'},
            {'max':10000, 'min':0, 'label':'0-10000', 'color': '#FFE4E1'},
           ],
    ),
    legend_opts=opts.LegendOpts(is_show=False), 
    tooltip_opts=opts.TooltipOpts(
        is_show=True,
        trigger='item',
        formatter='{b}:{c}'
    ),
    title_opts=dict(
        text='全国各地区月饼销量',
        left='center',
        top='5%',
        textStyle=dict(
            color='#DC143C'))
)
map_chart.render_notebook()
Salin selepas log masuk

结果:

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

Daripada peta pengedaran geografi, kedai-kedai diedarkan terutamanya di Beijing, Shandong, Zhejiang, Guangdong, Yunnan dan kawasan tenggara yang lain.
3.4 Perkadaran jualan kuih bulan dalam julat harga yang berbeza

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

可以看到,50以下的月饼销量占比达到了52%,超过了半数的月饼售价在50元以内,100Nisbah jualan kuih bulan di bawah telah mencecah 85% Walaupun ada yang harganya melebihi 1,000 yuan, harga keseluruhannya masih agak berpatutan.
3.5 Agihan rasa kuih bulan

Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!

Liuxin, Lima biji, pes teratai kuning telur, pes kacang yyds! ! ! Gambar rajah awan 3.6 perkataan Boleh dijalankan secara dalam talian (termasuk semua kod)
:
Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!
https://www.heywhale.com/mw/project001

Atas ialah kandungan terperinci Visualisasi |. Python menganalisis kuih bulan Pertengahan Musim Gugur, perisa ini adalah yyds!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:Python当打之年
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!