機器學習是專門研究電腦如何模擬或實現人類的學習行為,以獲得新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。機器學習能解決的問題:1、分類問題;2、迴歸問題;3、聚類問題。
本教學操作環境:windows7系統、Dell G3電腦。
什麼是機器學習?
機器學習就是對電腦一部分資料進行學習,然後對其他一些資料進行預測與判斷。
機器學習的核心是「使用演算法解析數據,從中學習,然後對新數據做出決定或預測」。也就是說電腦利用以取得的資料來得出某一模型,然後利用此模型進行預測的一種方法,這個過程跟人的學習過程有些類似,例如人獲取一定的經驗,可以對新問題進行預測。
我們舉個例子,我們都知道支付寶春節的「集五福」活動,我們用手機掃「福」字照片辨識福字,這就是用了機器學習的方法。我們可以為電腦提供「福」字的照片數據,透過演算法模型機型訓練,系統不斷更新學習,然後輸入一張新的福字照片,機器自動辨識這張照片上是否有福字。
機器學習是一門多領域交叉學科,涉及機率論、統計學、電腦科學等多門學科。機器學習的概念就是透過輸入海量訓練資料來訓練模型訓練,使模型掌握資料所蘊含的潛在規律,進而對新輸入的資料進行精確的分類或預測。如下圖:
機器學習能解決什麼樣的問題?
從功能的角度分類,機器學習在一定量級的資料上,可以解決下列問題:
1、分類問題:根據資料樣本上抽取的特徵,判定其屬於有限個類別中的哪一個。例如:垃圾郵件識別(結果類別:1、垃圾郵件 2、正常郵件)。
2、迴歸問題:根據資料樣本上抽取的特徵,預測一個連續值的結果。例如:星爺《美人魚》票房
3、聚類問題:根據資料樣本上抽取的特徵,讓樣本抱抱團(相近/相關的樣本在一團內)。如:google的新聞分類。
我們再把上述常見問題劃到機器學習最典型的2個分類。
分類與迴歸問題需要用已知結果的資料做訓練,屬於「監督學習」
聚類的問題不需要已知標籤,屬於「非監督學習」。
如果在IT行業(尤其是互聯網)裡溜達一圈,你會發現機器學習在以下熱點問題中有廣泛應用:
更多相關知識,請造訪常見問題欄位!
以上是什麼是機器學習?機器學習能解決什麼樣的問題?的詳細內容。更多資訊請關注PHP中文網其他相關文章!