社群學習工具庫休閒

繁体中文

首頁 > 常見問題 > 資料歸一化處理的目的是什麼

資料歸一化處理的目的是什麼

青灯夜游

發布： 2023-01-13 00:36:05

原創

27836 人瀏覽過

資料歸一化處理的目的在於：使得預處理的資料被限定在一定的範圍內，從而消除奇異樣本資料所導致的不良影響。資料歸一化處理後，可加快梯度下降求最優解的速度，且有可能提高精度（如KNN）。

資料歸一化處理的目的是什麼

本教學操作環境：windows7系統、Dell G3電腦。

#在機器學習領域中，不同評估指標（即特徵向量中的不同特徵就是所述的不同評價指標）#往往有不同的量綱和量綱單位，這樣的情況會影響到資料分析的結果，為了消除指標之間的量綱影響，需要進行資料標準化處理，以解決資料指標之間的可比性。原始資料經過資料標準化處理後，各指標為同一數量級，適合進行綜合對照評估。 其中，最典型的就是資料的歸一化處理。（可參考學習：資料標準化/歸一化）

簡而言之，歸一化的目的就是使得預處理的資料被限定在一定的範圍內（例如[0,1]或[-1,1]），從而消除 #奇異樣本資料導致的不良影響。

1）在統計學中，歸一化的具體作用是歸納統一樣本的統計分佈性。歸一化在0~1之間是統計的機率分佈，歸一化在-1~ 1之間是統計的座標分佈。

2）奇異樣本資料是指相對於其他輸入樣本特別大或特別小的樣本向量（即特徵向量），譬如，下面為具有兩個特徵的樣本資料x1、x2、x3、x4、x5、x6（特徵向量—>列向量）,其中x6這個樣本的兩個特徵相對其他樣本而言相差比較大，因此，x6認為是奇異樣本資料。

奇異樣本資料的存在會造成訓練時間增大，同時也可能導致無法收斂，因此，

當存在奇異樣本資料時，在進行訓練之前需要對預處理資料進行歸一化

；反之，當不存在奇異樣本資料時，則可以不進行歸一化。

#-- 如果不進行歸一化，那麼由於特徵向量中不同特徵的取值相差較大，會導致目標函數變成「扁」。這樣

在進行梯度下降的時候，梯度的方向就會偏離最小值的方向，走很多彎路，也就是訓練時間過長。

##########

--如果進行歸一化以後，目標函數會呈現比較“圓”，這樣訓練速度大大加快，少走很多彎路。

綜上可知，歸一化有以下好處，即

1）歸一化後加快了梯度下降求最優解的速度；

2）歸一化有可能提高精確度（如KNN）

###沒有一種資料標準化的方法，放在每一個問題，放在每一個模型，都能提高演算法精度和加速演算法的收斂速度。 ###############更多相關知識，請造訪###常見問題###欄位！ ###

以上是資料歸一化處理的目的是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

數據歸一化

來源：php.cn

上一篇：在資料庫物理設計階段，為資料表建立索引的目的是什麼下一篇：ppt檔如何直接嵌入word文件

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

深入搞懂Redis中的哨兵

2023-04-26 17:59:18
【整理分享】7個熱門的React狀態管理工具

2023-04-26 17:47:48
一文討論Vue2中key和Vue3中key的差別

2023-04-26 17:41:42
一文聊聊Node中的記憶體控制

2023-04-26 17:37:05
實用Excel技巧分享：4種刪除重複值的小妙招！

2023-04-26 17:31:25
實用Word技巧分享：簡繁轉換功能竟然可以這樣用！

2023-04-26 17:27:32
如何解決跨域？常見解決方案淺析

2023-04-25 19:57:58
一文理解JavaScript中的單例模式

2023-04-25 19:53:11
深入了解Node中的Buffer

2023-04-25 19:49:11
探討如何在Vue3中撰寫單元測試

2023-04-25 19:41:54

最新問題

匹配單字的正規表示式我有一個腳本，我試圖將新的職位名稱與資料庫中的現有職位名稱進行配對。 SELECTa.titleASJobTitle,j.DescriptionASMatchedJobTitle,...

來自於 2024-04-06 21:24:04

0

1

606

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

MySQL從多個表中取得數據我有一個eg_design表，其中包含以下幾列：和eg_domains表，其中包含以下列：和eg_fonts表，其中包含以下幾列：現在，基於$domain_id我想獲取eg_des...

來自於 2024-04-06 18:42:44

0

2

479

依照ID對MySQL結果進行分組以便循環遍歷我有一個表，其中有mysql中的航班資料。我正在編寫一個php程式碼，它將使用codeigniter3對資料進行分組和顯示journey_idair_idFlightDuratio...

來自於 2024-04-06 17:27:56

0

1

406

Laravel 8 - 如何將 /{editable_text} 路由重新導向到 /{user} 路由我一直在嘗試建立重定向路由來引導我存取用戶個人資料。重定向路由應該是來自使用者資料庫的字串/文本，並且應該重定向到相同的使用者個人資料頁面。例如，假設我的user1有一個名為“ed...

來自於 2024-04-06 17:26:11

0

1

410

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板