Comment utiliser Seaborn pour la visualisation de données statistiques
Introduction :
La visualisation des données statistiques est une partie très importante de l'analyse des données. Elle peut nous aider à mieux comprendre les données et à découvrir les modèles qui s'y cachent. Seaborn est une bibliothèque de visualisation de données Python basée sur Matplotlib. Elle fournit des fonctions avancées de dessin statistique pour rendre le processus de visualisation de données plus concis et plus beau.
Cet article expliquera comment utiliser Seaborn pour la visualisation de données statistiques et démontrera son utilisation à travers un exemple de code.
1. Installez la bibliothèque Seaborn
Avant de commencer, nous devons d'abord installer la bibliothèque Seaborn. Il peut être installé via la commande pip :
pip install seaborn
2. Importez la bibliothèque Seaborn et les autres bibliothèques nécessaires
Une fois l'installation terminée, nous devons importer la bibliothèque Seaborn et les autres bibliothèques nécessaires dans le code. Généralement, nous importons également les bibliothèques NumPy et Pandas pour le traitement des données, ainsi que la bibliothèque Matplotlib pour le traçage personnalisé.
import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt
3. Charger des exemples d'ensembles de données
La bibliothèque Seaborn fournit des exemples d'ensembles de données pour démontrer diverses fonctions de dessin. Dans cet article, nous utiliserons l'ensemble de données « astuces » fourni avec Seaborn. Vous pouvez utiliser le code suivant pour charger cet ensemble de données :
tips = sns.load_dataset("tips")
L'ensemble de données Tips est un ensemble de données sur la consommation du restaurant, y compris la quantité de consommation, la durée de consommation, le sexe, le statut de fumeur et d'autres informations.
4. Dessinez des graphiques statistiques
Ensuite, nous pouvons commencer à dessiner des graphiques statistiques. La bibliothèque Seaborn fournit une variété de fonctions de traçage, notamment l'affichage de données discrètes et continues à une et deux dimensions.
distplot()
de Seaborn peut dessiner simultanément des histogrammes et des tracés d'estimation de la densité du noyau.distplot()
函数可以同时绘制直方图和核密度估计图。sns.distplot(tips['total_bill'], bins=10, kde=True) plt.show()
通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill
是Tips数据集中的一个字段,bins
参数指定了直方图的柱子数量,kde
参数可以控制是否绘制核密度估计图。
scatterplot()
函数可以绘制散点图。sns.scatterplot(x='total_bill', y='tip', data=tips) plt.show()
通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x
参数指定了x轴上的变量,y
参数指定了y轴上的变量,data
参数指定了要使用的数据集。
countplot()
函数可以绘制柱状图。sns.countplot(x='day', data=tips) plt.show()
通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x
参数指定了x轴上的变量,data
参数指定了要使用的数据集。
boxplot()
函数可以绘制盒图。sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips) plt.show()
通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x
参数指定了x轴上的变量,y
参数指定了y轴上的变量,hue
参数指定了用于分类的变量,data
参数指定了要使用的数据集。
五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。
set_style()
函数进行设置。sns.set_style("ticks")
通过上述代码,我们可以将图表风格设置为"ticks"。
set_palette()
sns.set_palette("husl", 4)
total_bill
est un champ de l'ensemble de données Tips, le paramètre
bins
spécifie le nombre de bacs dans l'histogramme et le paramètre
kde
peut contrôler s'il faut dessiner un diagramme d'estimation de la densité du noyau.
Un nuage de points peut être utilisé pour montrer la relation entre deux variables continues. La fonctionscatterplot()
de Seaborn peut dessiner des nuages de points.
Avec le code ci-dessus, nous pouvons tracer un nuage de points entre le montant total dépensé au restaurant et le pourboire. Parmi eux, le paramètrex
spécifie la variable sur l'axe des x, le paramètrey
spécifie la variable sur l'axe des y et le paramètredata
Le paramètre > spécifie l'ensemble de données à utiliser.
countplot()
de Seaborn peut dessiner un histogramme. rrreeeAvec le code ci-dessus, on peut tracer un histogramme du nombre de consommation sur différents jours. Parmi eux, le paramètre
x
spécifie la variable sur l'axe des x, et le paramètre
data
spécifie l'ensemble de données à utiliser.
boxplot()
de Seaborn peut dessiner des boîtes à moustaches. rrreeeAvec le code ci-dessus, nous pouvons tracer une boîte à moustaches du montant de la consommation sur différents jours et la classer en fonction du statut de fumeur. Parmi eux, le paramètre
x
spécifie la variable sur l'axe des x, le paramètre
y
spécifie la variable sur l'axe des y et le paramètre
teinte
Le paramètre > spécifie la variable utilisée pour la classification Variable, le paramètre
data
spécifie l'ensemble de données à utiliser. 5. Style de graphique personnaliséLa bibliothèque Seaborn fournit également de nombreuses fonctions pour personnaliser les styles de graphique, ce qui peut nous aider à créer de plus beaux graphiques. Définir le style de graphiqueLa bibliothèque Seaborn fournit une variété de styles de graphiques intégrés, qui peuvent être définis à l'aide de la fonction
set_style()
avant de dessiner. rrreeeAvec le code ci-dessus, nous pouvons définir le style du graphique sur "tics".
set_palette()
. rrreeeAvec le code ci-dessus, nous pouvons définir la palette de couleurs sur "husl" et utiliser 4 couleurs. 6. RésuméCet article explique comment utiliser Seaborn pour la visualisation de données statistiques. Tout d'abord, nous avons installé la bibliothèque Seaborn et importé les bibliothèques requises. Ensuite, l’échantillon de données a été chargé. Ensuite, les fonctions de dessin de Seaborn sont démontrées en dessinant des histogrammes, des nuages de points, des graphiques à barres et des diagrammes en boîte. Enfin, il explique également comment définir le style du graphique et la palette de couleurs. Grâce aux riches fonctions de dessin et aux options de personnalisation fournies par la bibliothèque Seaborn, nous pouvons facilement créer des graphiques statistiques magnifiques et informatifs, fournissant des outils plus puissants et un support pour l'analyse des données. J'espère que cet article vous aidera !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!