Python est un langage de programmation très populaire. Ses puissantes capacités de calcul scientifique et de traitement de données le rendent largement utilisé dans les domaines de l'analyse de données et de l'apprentissage automatique. Cet article présentera comment utiliser la régression linéaire univariée en Python pour la modélisation et la prédiction des données, et démontrera son application pratique à travers un exemple.
Tout d’abord, qu’est-ce que la régression linéaire ? En statistiques et en apprentissage automatique, la régression linéaire est une méthode utilisée pour établir une relation entre deux variables. Dans la régression linéaire univariée, nous n'avons qu'une seule variable explicative (variable indépendante) et une seule variable de réponse (variable dépendante).
Ensuite, nous présenterons comment utiliser la bibliothèque scikit-learn en Python pour implémenter la régression linéaire univariée. scikit-learn est une bibliothèque d'apprentissage automatique populaire qui contient de nombreux outils de modélisation et de visualisation de données.
Étape 1 : Importer des bibliothèques et des données
Tout d'abord, nous devons importer certaines bibliothèques. Dans cet article, nous utiliserons NumPy, Pandas, Matplotlib et Scikit-learn.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
Ensuite, nous devons préparer les données à analyser. Dans cet exemple, nous utiliserons un ensemble de données sur la taille et le prix de la maison, qui est un ensemble de données très simple.
df = pd.dataframe ({'zone': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],
'价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})
print (df)
La sortie est comme suit :
面积 价格
0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000
4 1100 199000
5 1550 219000
6 235 0 40 5000
7 2450 324000
8 1425 319000
9 1700 255000
Étape 2 : Analyse et visualisation des données
Une fois que nous avons importé les données, nous pouvons commencer à analyser et visualiser les données. Dessinons un nuage de points où l'axe horizontal est la superficie de la maison et l'axe vertical est les ventes. prix.
plt.scatter(df['Area' ], df['price'])
plt.xlabel('area')
plt.ylabel('price')
plt.show()
Sortie :
Ce nuage de points nous indique qu'à mesure que la superficie des maisons augmente, le prix de vente augmente également. Par conséquent, il peut y avoir une relation linéaire entre ces deux variables.
Étape 3 : Ajuster le modèle de régression linéaire
Maintenant, nous pouvons commencer. en adaptant le modèle de régression linéaire dans scikit-learn. pour construire un modèle linéaire, vous devez utiliser la fonction LinearRegression()
X = df[['area']]
Y = df['price']
model = LinearRegression. ().fit(X, Y)
ici, nous attribuons la zone à la variable indépendante model.coef_)
print('Intercept:', model.intercept_)
Sortie :
Pente : [126.88610769]
Interception : 36646.35077294225
Étape 4 : Résultats de visualisation
.
y_pred = model.predict([[2000]])
plt.scatter(df['area'], df['price'] )
plt.show()
Sortie :
Comme on peut le voir, notre ligne de régression correspond à notre point de données, nous pouvons utiliser le modèle ajusté pour prédire le prix de vente de la superficie d'une nouvelle maison.
Cet article explique comment utiliser la bibliothèque scikit-learn en Python pour implémenter la régression linéaire univariée, y compris la préparation des données, l'analyse et la visualisation des données, l'ajustement des modèles de régression linéaire et la prévision des résultats. La régression linéaire est un outil simple mais puissant qui peut être utilisé pour étudier la relation entre deux variables et faire des prédictions. Elle a de nombreuses applications dans l'analyse des données et l'apprentissage automatique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!