Python中的梯度提升(GBM)算法实例

WBOY
Lepaskan: 2023-06-10 16:51:07
asal
1683 orang telah melayarinya

Python中的梯度提升(GBM)算法实例

梯度提升(GBM)是一种机器学习方法,通过迭代地训练模型来逐步减少损失函数。它在回归和分类问题中都有良好的应用效果,并且是一种强大的集成学习算法。本文将以Python为例,介绍如何使用GBM算法对一个回归问题进行建模。

首先我们需要导入一些常用的Python库,如下所示:

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.metrics import mean_squared_error
Salin selepas log masuk

本次案例中,我们将使用Car Evaluation数据集进行建模,该数据集包含6个属性和1个类别变量。我们将用这些属性变量来预测车辆的价格。首先,我们需要将CSV文件读入Pandas DataFrame中,如下所示:

data=pd.read_csv("car_data_1.csv")
Salin selepas log masuk

接下来,我们需要将原始数据划分为训练集和测试集。我们将80%的数据作为训练集,20%的数据作为测试集。

train_data, test_data, train_label, test_label = train_test_split(data.iloc[:,:-1], data.iloc[:,-1], test_size=0.2, random_state=1)
Salin selepas log masuk

然后我们需要进行特征工程,将分类变量编码成哑变量(Dummy Variable)。这里我们使用Pandas的get_dummies函数。

train_data = pd.get_dummies(train_data)
test_data = pd.get_dummies(test_data)
Salin selepas log masuk

现在我们可以建立一个GBM模型。首先,我们初始化模型,然后进行参数设置。在这里,我们设置了模型的迭代次数(n_estimators)为100,并将学习率参数(learning_rate)设置为0.1。

model = GradientBoostingRegressor(n_estimators=100, learning_rate=0.1, random_state=1)
Salin selepas log masuk

接下来,我们用训练集数据拟合模型:

model.fit(train_data,train_label)
Salin selepas log masuk

接下来,我们使用测试集数据评估模型的性能。在这里,我们使用均方误差(MSE)来评价模型的性能。代码如下所示:

pred=model.predict(test_data)
mse=mean_squared_error(test_label, pred)
print("MSE:",mse)
Salin selepas log masuk

最后,我们可以进一步探索GBM模型中变量的重要性。我们可以使用sklearn的feature_importances_函数来得到。

feat_imp = pd.Series(model.feature_importances_, index=train_data.columns).sort_values(ascending=False)
print(feat_imp)
Salin selepas log masuk

总之,本文演示了如何使用Python的sklearn库实现GBM算法。我们使用Car Evaluation数据集来预测车辆的价格,并评估了模型的性能,并且我们还可以得到变量的重要性分数。GBM在机器学习中具有良好的应用效果,并且是一种强大的集成学习算法。

Atas ialah kandungan terperinci Python中的梯度提升(GBM)算法实例. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!