Rumah > pembangunan bahagian belakang > Tutorial Python > Daripada Data kepada Strategi: Bagaimana Statistik Boleh Memacu Keputusan Pemasaran yang Boleh Dipercayai

Daripada Data kepada Strategi: Bagaimana Statistik Boleh Memacu Keputusan Pemasaran yang Boleh Dipercayai

Mary-Kate Olsen
Lepaskan: 2024-12-05 04:25:11
asal
287 orang telah melayarinya

statistik ialah alat berkuasa yang membolehkan kami menangani masalah yang rumit dan menjawab soalan yang timbul apabila memerhati data atau corak buat kali pertama. Contohnya boleh menganalisis personaliti pelanggan di pasar raya. Soalan seperti Adakah kumpulan ini benar-benar berbeza daripada yang lain? Setakat mana? Perlukah saya lebih fokus pada kumpulan ini untuk meningkatkan pengalaman mereka dan jualan saya? Mereka adalah kunci untuk membuat keputusan yang baik.

Walaupun visualisasi boleh membantu kami memahami data dengan cepat, ia tidak selalunya boleh dipercayai 100%. Kita boleh melihat perbezaan yang jelas antara kumpulan, tetapi perbezaan tersebut mungkin tidak signifikan secara statistik.

Di sinilah statistik berperanan: bukan sahaja ia membantu kami menganalisis data dengan lebih mendalam, tetapi ia memberi kami keyakinan untuk mengesahkan andaian kami. Sebagai saintis data atau profesional membuat keputusan, kita mesti sedar bahawa analisis yang salah boleh membawa kepada keputusan yang salah, mengakibatkan kehilangan masa dan wang. Oleh itu, adalah penting bahawa kesimpulan kami berasas, disokong oleh bukti statistik.

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

Kepuasan sebenar datang apabila kami melihat hasil analisis kami dicerminkan dalam perubahan berkesan dalam syarikat, peningkatan dalam pengalaman pelanggan dan, akhirnya, kesan positif terhadap jualan dan operasi. Sungguh satu perasaan yang luar biasa untuk menjadi sebahagian daripada proses itu!


Untuk membantu anda mengembangkan kemahiran ini, kami akan membangunkan dalam artikel ini dalam Analisis Personaliti pelanggan pasar raya, kami akan menggunakan Set Data Kaggle Analisis Personaliti Pelanggan: https://www.kaggle.com/datasets / imakash3011/analisis-personaliti-pelanggan

Dalam analisis ini, kami akan meneroka gelagat pelanggan pasar raya dengan tujuan mengekstrak maklumat berharga daripada data. Kami akan berusaha untuk menjawab soalan berikut:

  • Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan mengikut Pendidikan?
  • Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan sebanyak Bilangan kanak-kanak?
  • Adakah terdapat perbezaan yang ketara dalam jumlah perbelanjaan mengikut Status Perkahwinan?

Walaupun analisis ini boleh dipanjangkan lebih jauh, kami akan menumpukan pada menjawab tiga soalan ini, kerana ia menawarkan kuasa penjelasan yang hebat. Sepanjang artikel itu, kami akan menunjukkan kepada anda bagaimana kami boleh menangani soalan ini dan bagaimana, melalui pendekatan yang sama, kami boleh menjawab lebih banyak soalan.

Dalam artikel ini kita akan meneroka analisis statistik seperti ujian Kolmogorov-Smirnov, ujian Levene dan bagaimana untuk mengetahui masa untuk memohon ANOVA atau Kruskal -Wallis. Nama-nama ini mungkin terdengar asing bagi anda, tetapi jangan risau, saya akan menerangkannya dengan cara yang mudah supaya anda memahaminya tanpa komplikasi.

Seterusnya, saya akan menunjukkan kepada anda kod Python dan langkah-langkah yang perlu diikuti untuk melaksanakan analisis statistik ini dengan berkesan.

1. Bermula

Kami mengimport perpustakaan Python yang diperlukan.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk

Kini kami boleh memilih dua cara untuk memuat naik fail .csv, kami terus mendapatkan fail tersebut atau kami boleh mendapatkan pautan kaggle, terus pada butang muat turun.

#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk

De Datos a Estrategias: Cómo la Estadística Puede Impulsar Decisiones Confiables en Marketing

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo
Salin selepas log masuk
Salin selepas log masuk
ID Year_Birth Education Marital_Status Income Kidhome Teenhome Dt_Customer Recency MntWines MntFruits MntMeatProducts MntFishProducts MntSweetProducts MntGoldProds NumDealsPurchases NumWebPurchases NumCatalogPurchases NumStorePurchases NumWebVisitsMonth AcceptedCmp3 AcceptedCmp4 AcceptedCmp5 AcceptedCmp1 AcceptedCmp2 Complain Z_CostContact Z_Revenue Response
0 5524 1957 Graduation Single 58138.0 0 0 04-09-2012 58 635 88 546 172 88 88 3 8 10 4 7 0 0 0 0 0 0 3 11 1
1 2174 1954 Graduation Single 46344.0 1 1 08-03-2014 38 11 1 6 2 1 6 2 1 1 2 5 0 0 0 0 0 0 3 11 0
2 4141 1965 Graduation Together 71613.0 0 0 21-08-2013 26 426 49 127 111 21 42 1 8 2 10 4 0 0 0 0 0 0 3 11 0

Untuk mendapatkan idea yang lebih baik tentang set data yang akan kami analisis, saya akan menunjukkan maksud setiap lajur.

Lajur:

  • Orang:

    • ID: pengecam unik pelanggan
    • Tahun_Lahir: tahun kelahiran pelanggan.
    • Pendidikan: tahap pendidikan klien.
    • Status_Perkahwinan: status perkahwinan pelanggan
    • Pendapatan: pendapatan tahunan isi rumah pelanggan
    • Kidhome: Bilangan kanak-kanak di rumah pelanggan
    • Rumah Remaja: Bilangan remaja di rumah pelanggan
    • Dt_Customer: Tarikh pendaftaran pelanggan dalam syarikat
    • Keterkinian: bilangan hari sejak pembelian terakhir pelanggan.
    • Aduan: 1 jika pelanggan mengadu dalam 2 tahun lepas, 0 sebaliknya
  • Produk:

    • MntWines: Amaun yang dibelanjakan untuk wain dalam tempoh 2 tahun yang lalu.
    • MntFruits: Amaun yang dibelanjakan untuk buah-buahan dalam tempoh 2 tahun yang lalu.
    • MntMeatProducts: Amaun yang dibelanjakan untuk daging dalam tempoh 2 tahun yang lalu.
    • MntFishProducts: jumlah yang dibelanjakan untuk ikan dalam tempoh 2 tahun yang lalu.
    • MntSweetProducts: jumlah yang dibelanjakan untuk gula-gula dalam 2 tahun lepas.
    • MntGoldProds: jumlah yang dibelanjakan untuk emas dalam tempoh 2 tahun lepas.
  • Promosi:

    • NumDealsPurchases: Bilangan pembelian yang dibuat dengan diskaun.
    • AcceptedCmp1: 1 jika pelanggan menerima tawaran dalam kempen pertama, 0 sebaliknya.
    • AcceptedCmp2: 1 jika pelanggan menerima tawaran dalam kempen kedua, 0 sebaliknya.
    • AcceptedCmp3: 1 jika pelanggan menerima tawaran dalam kempen ketiga, 0 sebaliknya.
    • AcceptedCmp4: 1 jika pelanggan menerima tawaran dalam kempen keempat, 0 sebaliknya.
    • AcceptedCmp5: 1 jika pelanggan menerima tawaran dalam kempen kelima, 0 sebaliknya.
    • Jawapan: 1 jika pelanggan menerima tawaran dalam kempen terakhir, 0 sebaliknya
  • Tempat:

    • NumWebPurchases: Bilangan pembelian yang dibuat melalui tapak web syarikat.
    • NumCatalogPurchases: Bilangan pembelian yang dibuat melalui katalog.
    • NumStorePurchases: Bilangan pembelian yang dibuat terus di kedai.
    • NumWebVisitsMonth: Bilangan lawatan ke tapak web syarikat pada bulan lepas.

Ya, terdapat banyak lajur, namun di sini kami hanya akan menggunakan beberapa, supaya tidak memanjangkan terlalu banyak, dalam apa jua keadaan anda boleh menggunakan langkah yang sama untuk lajur lain.

Sekarang, kami akan mengesahkan bahawa kami tidak mempunyai data nol

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import os
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk
#pip install kagglehub
import kagglehub

# Download latest version
path = kagglehub.dataset_download("imakash3011/customer-personality-analysis")

print("Path to dataset files:", path)
Salin selepas log masuk
Salin selepas log masuk
Salin selepas log masuk

Kami dapat melihat bahawa kami mempunyai 24 data nol dalam lajur Pendapatan, namun lajur ini tidak akan digunakan dalam analisis ini oleh itu kami tidak akan melakukan apa-apa dengannya, sekiranya anda ingin menggunakannya, anda mesti mengesahkan melaksanakan salah satu daripada dua pilihan ini:

  • Imput data yang hilang jika ia tidak mewakili lebih daripada 5% daripada jumlah data (pengesyoran).
  • Padamkan data nol.

2. Konfigurasikan Set Data untuk analisis

Kami akan menyimpan lajur yang menarik minat kami, seperti pendidikan, anak, status perkahwinan, jumlah perbelanjaan bagi setiap kategori produk, antara lain.

#Obtenemos el nombre del archivo
nombre_archivo = os.listdir(path)[0]
nombre_archivo
Salin selepas log masuk
Salin selepas log masuk

Kami mengira jumlah perbelanjaan dengan menambah perbelanjaan semua kategori produk.

'marketing_campaign.csv'
Salin selepas log masuk

Atas ialah kandungan terperinci Daripada Data kepada Strategi: Bagaimana Statistik Boleh Memacu Keputusan Pemasaran yang Boleh Dipercayai. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan