全面的機器學習術語指南-Python教學-PHP中文網

Comprehensive Machine Learning Terminology Guide

介紹

歡迎來到綜合機器學習術語指南！無論您是機器學習領域的新手，還是希望溫習詞彙的經驗豐富的從業者，本指南都旨在成為您了解構成 ML 基礎的關鍵術語和概念的首選資源。

基礎概念

機器學習 (ML)：人工智慧的一個子集，專注於建立可以從資料中學習並根據資料做出決策的系統。

人工智慧（AI）：創造可以模擬人類思考能力和行為的智慧機器的更廣泛領域。

深度學習：基於多層人工神經網路的機器學習子集。

資料集：用於訓練和測試機器學習模型的資料集合。

特徵：所觀察到的現象的單一可測量屬性或特徵。

標籤：我們在監督學習中嘗試預測的目標變數。

模型：從資料中學習的現實世界過程的數學表示。

演算法：解決問題的逐步過程或公式。

訓練：教導模型根據資料做出預測或決策的過程。

推理：使用經過訓練的模型對新的、未見過的資料進行預測。

機器學習的類型

監督學習：從標記資料中學習以預測不可預見資料的結果。

無監督學習：在沒有標記回應的情況下尋找輸入資料中隱藏的模式或內在結構。

半監督學習：從標記和未標記資料的組合中學習。

強化學習：學習透過與環境互動來做決策。

遷移學習：將從一項任務中獲得的知識應用於相關任務。

模型評估和指標

準確度：正確預測佔所檢查個案總數的比例。

Precision：真陽性預測佔所有陽性預測的比例。

Recall：真實陽性預測佔所有實際陽性案例的比例。

F1 分數：精確率和召回率的調和平均值。

ROC 曲線：說明二元分類器系統的診斷能力的圖形。

AUC（曲線下面積）：衡量分類器區分類別的能力。

混淆矩陣：用於描述分類模型表現的表格。

交叉驗證：用於在有限資料樣本上評估機器學習模型的重採樣過程。

過度擬合：當模型對訓練資料學習得太好時，包括雜訊和波動。

欠擬合：當模型太簡單而無法捕捉資料的底層結構。

神經網路和深度學習

神經元：神經網路的基本單位，鬆散地模仿生物神經元。

激活函數：在給定輸入或一組輸入的情況下確定神經元輸出的函數。

權重：神經網路中決定神經元之間連接強度的參數。

偏差：神經網路中的附加參數，用於調整輸出以及神經元輸入的加權和。

反向傳播：一種透過根據預測誤差迭代調整網路權重來訓練神經網路的演算法。

梯度下降：一種最佳化演算法，用於透過沿著最陡下降的方向迭代移動來最小化損失函數。

Epoch：一次完整地遍歷整個訓練資料集。

Batch：模型訓練的一次迭代中使用的訓練資料的子集。

學習率：一個超參數，控制每次更新模型權重時響應估計誤差而改變模型的程度。

卷積神經網路（CNN）：一種常用於影像辨識和處理的神經網路。

반복 신경망(RNN): 데이터 시퀀스의 패턴을 인식하도록 설계된 신경망 유형입니다.

장단기 기억(LSTM): 장기 종속성을 학습할 수 있는 RNN 유형입니다.

Transformer: 입력과 출력 간의 전역 종속성을 끌어내기 위해 주의 메커니즘에 전적으로 의존하는 모델 아키텍처입니다.

기능 엔지니어링 및 선택

Feature Engineering: 도메인 지식을 사용하여 원시 데이터에서 특징을 추출하는 프로세스입니다.

Feature Selection: 모델 구성에 사용할 관련 기능의 하위 집합을 선택하는 프로세스입니다.

차원성 감소: 데이터 세트의 입력 변수 수를 줄이는 기술.

주성분 분석(PCA): 직교 변환을 사용하여 상관관계가 있을 수 있는 변수의 관측값 집합을 선형적으로 상관되지 않은 변수의 값 집합으로 변환하는 통계 절차입니다.

앙상블 방법

Ensemble Learning: 여러 모델을 결합하여 컴퓨팅 지능 문제를 해결하는 프로세스입니다.

Bagged: 훈련 데이터의 여러 하위 집합을 사용하여 다양한 모델을 훈련하는 앙상블 방법입니다.

Boosting: 약한 학습자를 결합하여 강한 학습자를 만드는 앙상블 방식입니다.

Random Forest: 다수의 의사결정 트리를 구성하는 앙상블 학습 방법

자연어 처리(NLP)

토큰화: 텍스트를 개별 단어나 하위 단어로 분해하는 프로세스입니다.

Stemming: 굴절된 단어를 단어 어간 또는 어근 형태로 줄이는 과정입니다.

Lemmatization: 단어의 다양한 굴절 형태를 그룹화하는 과정입니다.

Word Embedding: 비슷한 의미를 가진 단어가 비슷한 표현을 갖는 텍스트에 대한 학습된 표현입니다.

명명된 엔터티 인식(NER): 텍스트에서 명명된 엔터티를 식별하고 분류하는 작업입니다.

감정 분석: 자연어 처리를 사용하여 텍스트에서 주관적인 정보를 식별하고 추출합니다.

강화 학습

Agent: 강화 학습 시나리오의 학습자 또는 의사결정자입니다.

Environment: 에이전트가 작동하고 학습하는 세계

State: 환경에 있는 에이전트의 현재 상황이나 상태입니다.

Action: 에이전트가 내린 움직임이나 결정

Reward: 에이전트가 취한 조치를 평가하기 위한 환경의 피드백입니다.

Policy: 에이전트가 현재 상태를 기반으로 다음 작업을 결정하는 데 사용하는 전략입니다.

고급 개념

GAN(Generative Adversarial Network): 두 개의 신경망이 서로 경쟁하는 기계 학습 프레임워크 클래스입니다.

Attention Mechanism: 인지적 주의를 모방하여 입력 데이터의 중요한 부분을 강화하고 관련 없는 부분을 줄이는 기술입니다.

전이 학습: 하나의 문제를 해결하고 이를 다른 관련 문제에 적용하면서 얻은 지식을 저장하는 데 초점을 맞춘 기계 학습의 연구 문제입니다.

Few-Shot Learning: 단 몇 가지 예를 통해 새로운 클래스를 인식하도록 모델을 훈련하는 기계 학습 유형입니다.

설명 가능한 AI(XAI): 인간이 결과를 이해할 수 있는 인공 지능 시스템

Federated Learning: 로컬 데이터 샘플을 보유한 여러 분산 장치 또는 서버에서 알고리즘을 교육하는 기계 학습 기술입니다.

AutoML: 기계 학습을 실제 문제에 적용하는 엔드투엔드 프로세스를 자동화하는 프로세스입니다.

결론

이 글을 읽고 계시다면 정말 감사드립니다! 정말 감사드립니다 ❤️.

ML에 대한 정기적인 업데이트, 통찰력 및 흥미로운 대화를 보려면 Twitter appyzdl5에서 나를 팔로우하세요.

miniGit 및 ML 알고리즘과 같은 프로젝트가 처음부터 포함된 내 Github: @appyzdl

以上是全面的機器學習術語指南的詳細內容。更多資訊請關注PHP中文網其他相關文章！

php8，我來也

30分鐘學會網站佈局

尚觀Oracle入門到精通視頻教程

你的第一行UNI-APP程式碼

Flutter 從頭到應用程式啟動

兄弟連新版Linux視頻教程

AXURE 9影片教學（適用於產品經理互動產品設計UI）

零基礎PS影片教學

16天帶你入門UI視頻教程

PS技巧和切片技巧影片教學

阿裡雲環境搭建以及項目上線視頻教程

電腦網路概述－程式設計師必須掌握的基礎知識

程式設計師必備教學——HTTP協定講解

Websocket影片教學

全面的機器學習術語指南

介紹