Comment utiliser Seaborn pour la visualisation de données statistiques

WBOY
Libérer: 2023-08-03 10:52:51
original
1077 Les gens l'ont consulté

Comment utiliser Seaborn pour la visualisation de données statistiques

Introduction :
La visualisation des données statistiques est une partie très importante de l'analyse des données. Elle peut nous aider à mieux comprendre les données et à découvrir les modèles qui s'y cachent. Seaborn est une bibliothèque de visualisation de données Python basée sur Matplotlib. Elle fournit des fonctions avancées de dessin statistique pour rendre le processus de visualisation de données plus concis et plus beau.

Cet article expliquera comment utiliser Seaborn pour la visualisation de données statistiques et démontrera son utilisation à travers un exemple de code.

1. Installez la bibliothèque Seaborn
Avant de commencer, nous devons d'abord installer la bibliothèque Seaborn. Il peut être installé via la commande pip :

pip install seaborn
Copier après la connexion

2. Importez la bibliothèque Seaborn et les autres bibliothèques nécessaires
Une fois l'installation terminée, nous devons importer la bibliothèque Seaborn et les autres bibliothèques nécessaires dans le code. Généralement, nous importons également les bibliothèques NumPy et Pandas pour le traitement des données, ainsi que la bibliothèque Matplotlib pour le traçage personnalisé.

import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt
Copier après la connexion

3. Charger des exemples d'ensembles de données
La bibliothèque Seaborn fournit des exemples d'ensembles de données pour démontrer diverses fonctions de dessin. Dans cet article, nous utiliserons l'ensemble de données « astuces » fourni avec Seaborn. Vous pouvez utiliser le code suivant pour charger cet ensemble de données :

tips = sns.load_dataset("tips")
Copier après la connexion

L'ensemble de données Tips est un ensemble de données sur la consommation du restaurant, y compris la quantité de consommation, la durée de consommation, le sexe, le statut de fumeur et d'autres informations.

4. Dessinez des graphiques statistiques
Ensuite, nous pouvons commencer à dessiner des graphiques statistiques. La bibliothèque Seaborn fournit une variété de fonctions de traçage, notamment l'affichage de données discrètes et continues à une et deux dimensions.

  1. Dessiner un histogramme
    Les histogrammes peuvent être utilisés pour montrer la distribution de données unidimensionnelles. La fonctiondistplot()de Seaborn peut dessiner simultanément des histogrammes et des tracés d'estimation de la densité du noyau.distplot()函数可以同时绘制直方图和核密度估计图。
sns.distplot(tips['total_bill'], bins=10, kde=True) plt.show()
Copier après la connexion

通过上述代码,我们可以绘制餐厅消费总金额的直方图。其中,total_bill是Tips数据集中的一个字段,bins参数指定了直方图的柱子数量,kde参数可以控制是否绘制核密度估计图。

  1. 绘制散点图
    散点图可以用来展示两个连续变量之间的关系。Seaborn中的scatterplot()函数可以绘制散点图。
sns.scatterplot(x='total_bill', y='tip', data=tips) plt.show()
Copier après la connexion

通过上述代码,我们可以绘制餐厅消费总金额与小费之间的散点图。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,data参数指定了要使用的数据集。

  1. 绘制柱状图
    柱状图可以用来展示离散变量的频率分布情况。Seaborn中的countplot()函数可以绘制柱状图。
sns.countplot(x='day', data=tips) plt.show()
Copier après la connexion

通过上述代码,我们可以绘制不同天的消费次数的柱状图。其中,x参数指定了x轴上的变量,data参数指定了要使用的数据集。

  1. 绘制盒图
    盒图可以用来展示一组数据的概要统计信息,包括中位数、四分位数、异常值等。Seaborn中的boxplot()函数可以绘制盒图。
sns.boxplot(x='day', y='total_bill', hue='smoker', data=tips) plt.show()
Copier après la connexion

通过上述代码,我们可以绘制不同天的消费金额的盒图,并根据抽烟情况进行了分类。其中,x参数指定了x轴上的变量,y参数指定了y轴上的变量,hue参数指定了用于分类的变量,data参数指定了要使用的数据集。

五、定制图表风格
Seaborn库还提供了很多定制图表风格的函数,可以帮助我们创建更具美感的图表。

  1. 设置图表风格
    Seaborn库提供了多种内置的图表风格,可以在绘图之前使用set_style()函数进行设置。
sns.set_style("ticks")
Copier après la connexion

通过上述代码,我们可以将图表风格设置为"ticks"。

  1. 调整调色板
    Seaborn库提供了多种预设的调色板,可以使用set_palette()
  2. sns.set_palette("husl", 4)
    Copier après la connexion
    Avec le code ci-dessus, on peut tracer un histogramme du montant total dépensé au restaurant. Parmi eux, total_billest un champ de l'ensemble de données Tips, le paramètre binsspécifie le nombre de bacs dans l'histogramme et le paramètre kdepeut contrôler s'il faut dessiner un diagramme d'estimation de la densité du noyau.

      Dessinez un nuage de points

      Un nuage de points peut être utilisé pour montrer la relation entre deux variables continues. La fonctionscatterplot()de Seaborn peut dessiner des nuages de points.

      rrreee

      Avec le code ci-dessus, nous pouvons tracer un nuage de points entre le montant total dépensé au restaurant et le pourboire. Parmi eux, le paramètrexspécifie la variable sur l'axe des x, le paramètreyspécifie la variable sur l'axe des y et le paramètredataLe paramètre > spécifie l'ensemble de données à utiliser.

        Dessiner un histogrammeUn histogramme peut être utilisé pour montrer la distribution de fréquence de variables discrètes. La fonction countplot()de Seaborn peut dessiner un histogramme. rrreeeAvec le code ci-dessus, on peut tracer un histogramme du nombre de consommation sur différents jours. Parmi eux, le paramètre xspécifie la variable sur l'axe des x, et le paramètre dataspécifie l'ensemble de données à utiliser.
          Dessiner une boîte à moustachesUne boîte à moustaches peut être utilisée pour afficher des statistiques récapitulatives d'un ensemble de données, y compris la médiane, les quartiles, les valeurs aberrantes, etc. La fonction boxplot()de Seaborn peut dessiner des boîtes à moustaches. rrreeeAvec le code ci-dessus, nous pouvons tracer une boîte à moustaches du montant de la consommation sur différents jours et la classer en fonction du statut de fumeur. Parmi eux, le paramètre xspécifie la variable sur l'axe des x, le paramètre yspécifie la variable sur l'axe des y et le paramètre teinteLe paramètre > spécifie la variable utilisée pour la classification Variable, le paramètre dataspécifie l'ensemble de données à utiliser. 5. Style de graphique personnaliséLa bibliothèque Seaborn fournit également de nombreuses fonctions pour personnaliser les styles de graphique, ce qui peut nous aider à créer de plus beaux graphiques. Définir le style de graphiqueLa bibliothèque Seaborn fournit une variété de styles de graphiques intégrés, qui peuvent être définis à l'aide de la fonction set_style()avant de dessiner. rrreeeAvec le code ci-dessus, nous pouvons définir le style du graphique sur "tics".
            Ajuster la palette de couleursLa bibliothèque Seaborn fournit une variété de palettes de couleurs prédéfinies, qui peuvent être définies à l'aide de la fonction set_palette(). rrreeeAvec le code ci-dessus, nous pouvons définir la palette de couleurs sur "husl" et utiliser 4 couleurs. 6. RésuméCet article explique comment utiliser Seaborn pour la visualisation de données statistiques. Tout d'abord, nous avons installé la bibliothèque Seaborn et importé les bibliothèques requises. Ensuite, l’échantillon de données a été chargé. Ensuite, les fonctions de dessin de Seaborn sont démontrées en dessinant des histogrammes, des nuages de points, des graphiques à barres et des diagrammes en boîte. Enfin, il explique également comment définir le style du graphique et la palette de couleurs. Grâce aux riches fonctions de dessin et aux options de personnalisation fournies par la bibliothèque Seaborn, nous pouvons facilement créer des graphiques statistiques magnifiques et informatifs, fournissant des outils plus puissants et un support pour l'analyse des données. J'espère que cet article vous aidera !

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!