又一機器學習模型解釋神器：Shapash-人工智慧-PHP中文網

又一機器學習模型解釋神器：Shapash

什麼是Shapash

#模型可解釋性和可理解性一直是許多研究論文和開源專案的關注的重點。而且很多專案中都配備了資料專家和訓練有素的專業人員。

Shapash 適用於大多數 sklearn、lightgbm、xgboost、catboost 模型，並可用於分類和迴歸任務。它利用 Shap 後端來計算特徵的局部貢獻度，但是，這可以用其他一些計算局部貢獻度的策略來取代。資料科學家可以利用 Shapash 解釋器對他們的模型進行調查和故障排除，或部署以提供每個推測的可視化。並且它還可以用於製作可以為最終客戶和企業家帶來巨大價值的 Web 應用程式。

又一機器學習模型解釋神器：Shapash

shabash 函式庫

Shapash的目標

1. 顯示清晰合理的結果

繪圖與輸出使用每個元件及其模式的標籤：

又一機器學習模型解釋神器：Shapash

2. Web 應用程式

資料科學家可以透過使用Web 應用程式輕鬆探索全域和局部鄰域之間的邏輯，從而快速理解他們的模型，並了解各種關鍵點如何發揮作用：

又一機器學習模型解釋神器：Shapash

#shapash 庫webapp

3. 總結並導出解釋

Shapash 提出了一個簡短而清晰的解釋。它允許每個客戶（無論他們的背景是什麼），都能理解對託管模型清晰的解釋，因為對 Shapash 特徵進行了總結和清晰的說明。

又一機器學習模型解釋神器：Shapash

4. 完整的資料科學報告

這裡有完整的資料報告可以查看：https://shapash-demo.ossbymaif.fr/

Shapash 功能

Shapash 的一些功能如下所示：

1.機器學習模式：它適用於分類（二元或多類別問題）和迴歸問題。它支援多種模型，如 Catboost、Xgboost、LightGBM、Sklearn Ensemble、線性模型和 SVM。

2.特徵編碼：它支援大量的編碼技術來處理我們資料集中的分類特徵，如單熱編碼、序數編碼、Base N 編碼、目標編碼或二進位編碼等。

3.SklearnColumnTransformer： OneHotEncoder、OrdinalEncoder、StandardScaler、QuantileTransformer 或 PowerTransformer

# 4.視覺化：提供一組視覺效果以輕鬆解釋你的結果，並顯示可理解和清晰的結果。

5.它與 Lime 和 Shap 相容。它使用 Shap 後端只需幾行程式碼即可顯示結果。

6.它為參數提供了許多選項，以簡潔地獲得結果。

7.Shapash 安裝簡單且使用方便：它提供了一個 SmartExplainer 類別來理解你的模型並用簡單的語法總結澄清。

8.部署：對於操作使用的調查和部署（透過 API 或批次模式）很重要。輕鬆建立 Web 應用程式以從全域導航到本機。

9.高度通用性：要顯示結果，需要進行非常多次的爭論。但如果你在清理和歸檔資料方面做得越多，最終客戶得到的結果就越清楚。

又一機器學習模型解釋神器：Shapash

Shapash 如何運作

Shapash 是一個使機器學習易於理解和解釋的Python函式庫。數據愛好者可以輕鬆理解並分享他們的模型。 Shapash 使用 Lime 和 Shap 作為後端，只需幾行程式碼即可顯示結果。 Shapash 依賴於建立機器學習模型以使結果合理的各種重要進展。下圖顯示了 shapash 套件的工作流程：

又一機器學習模型解釋神器：Shapash

Shapash 是如何運作的

工作原理

首先，它編譯每個步驟的元素，如資料準備、特徵工程、模型擬合、模型評估和模型理解。
其次，它提供了一個 WebApp 和圖表來更好地理解模型。可以與客戶分享和討論模型的結果。
最後，它為您提供了可解釋性的摘要。

安裝

可以使用以下程式碼安裝Shapash：

<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">shapash</span>

登入後複製

對於Jupyter Notebook：如果你正在使用jupyter notebook 並且想要查看內聯圖，那麼你需要使用另一個指令：

<span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">pip</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">install</span> <span style="color: rgb(89, 89, 89); margin: 0px; padding: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);">ipywidgets</span>

登入後複製

入門

在這裡我們將使用資料集房價預測來探索Shapash 。這是一個回歸問題，我們必須預測房價。首先我們分析資料集，包括單變量和雙變量分析，然後使用特徵重要性、特徵貢獻、局部和比較圖對可解釋性建模，然後是模型效能，最後是 WebApp。

分析資料集

單變數分析

使用可以查看下圖，了解名為First Floor Square Feet的要素。我們可以看到一個表格，其中顯示了我們的訓練和測試資料集的多種統計數據，例如平均值、最大值、最小值、標準差、中位數等等。在右側圖中可以看到訓練和測試資料集的分佈圖。 Shapash 也提到了我們的特徵是分類的還是數位的，它還提供了下拉選項，在下拉式選單中所有功能都可用。

又一機器學習模型解釋神器：Shapash