資料探勘六大步驟是什麼?
資料探勘就是從大量資料中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,步驟為:
1、定義問題;
2、準備資料;
3、瀏覽資料;
4、生成模型;
5、瀏覽和驗證模型;
6、部署和更新模型。
資料探勘通常需要資料收集,資料集成,資料規約,資料清理,資料變換,資料探勘實施過程,模式評估和知識表示
1.數據收集:根據所得的數據,抽像出數據的特徵信息,將收集到的信息存入數據庫。選擇一個適當的資料儲存和管理的資料倉儲類型
2.資料整合:把不同來源,格式的資料進行分類
3.資料規約:當資料量和資料的值比較大的時候,我們可以用規約技術來得到資料集的規約表示,例如(資料值-資料平均值)/資料方差,這是資料就變小了很多但接近原資料的完整性,在規約後資料探勘的結果和規約前的結果基本上一致。
4.資料清理:有些資料是不完整的如:有些有缺失值(值不存在),有些含雜訊(錯誤,孤立點),有些是不一致的(如單位不同等),我們可以使用工具進行資料清理,得到完整,正確,一致的資料。
5.資料變換:透過平滑聚集,資料概化,標準化等方式將資料轉換成適用於資料探勘的資料集。
6.特徵提取或特徵選擇:特徵提取多應用於電腦視覺和影像處理中,特徵選擇是提出不相關和冗餘的特徵,防止過擬合,提高模型精確度,常用方法有PCA等。
7.資料探勘過程:分析資料倉儲中的資料訊息,選擇合適的資料探勘工具,應用統計方法,使用對應的資料探勘演算法。 。
8.從業務上,驗證資料分析和資料探勘的結果正確性。
9.知識表示,將資料探勘所得結果以視覺化的方式呈現給使用者。
推薦教學:《PHP》
以上是資料探勘六大步驟是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!