全面的機器學習術語指南

WBOY
發布: 2024-07-26 12:58:51
原創
246 人瀏覽過

Comprehensive Machine Learning Terminology Guide

介紹

歡迎來到綜合機器學習術語指南!無論您是機器學習領域的新手,還是希望溫習詞彙的經驗豐富的從業者,本指南都旨在成為您了解構成 ML 基礎的關鍵術語和概念的首選資源。


基礎概念

機器學習 (ML):人工智慧的一個子集,專注於建立可以從資料中學習並根據資料做出決策的系統。

人工智慧(AI):創造可以模擬人類思考能力和行為的智慧機器的更廣泛領域。

深度學習:基於多層人工神經網路的機器學習子集。

資料集:用於訓練和測試機器學習模型的資料集合。

特徵:所觀察到的現象的單一可測量屬性或特徵。

標籤:我們在監督學習中嘗試預測的目標變數。

模型:從資料中學習的現實世界過程的數學表示。

演算法:解決問題的逐步過程或公式。

訓練:教導模型根據資料做出預測或決策的過程。

推理:使用經過訓練的模型對新的、未見過的資料進行預測。


機器學習的類型

監督學習:從標記資料中學習以預測不可預見資料的結果。

無監督學習:在沒有標記回應的情況下尋找輸入資料中隱藏的模式或內在結構。

半監督學習:從標記和未標記資料的組合中學習。

強化學習:學習透過與環境互動來做決策。

遷移學習:將從一項任務中獲得的知識應用於相關任務。


模型評估和指標

準確度:正確預測佔所檢查個案總數的比例。

Precision:真陽性預測佔所有陽性預測的比例。

Recall:真實陽性預測佔所有實際陽性案例的比例。

F1 分數:精確率和召回率的調和平均值。

ROC 曲線:說明二元分類器系統的診斷能力的圖形。

AUC(曲線下面積):衡量分類器區分類別的能力。

混淆矩陣:用於描述分類模型表現的表格。

交叉驗證:用於在有限資料樣本上評估機器學習模型的重採樣過程。

過度擬合:當模型對訓練資料學習得太好時,包括雜訊和波動。

欠擬合:當模型太簡單而無法捕捉資料的底層結構。


神經網路和深度學習

神經元:神經網路的基本單位,鬆散地模仿生物神經元。

激活函數:在給定輸入或一組輸入的情況下確定神經元輸出的函數。

權重:神經網路中決定神經元之間連接強度的參數。

偏差:神經網路中的附加參數,用於調整輸出以及神經元輸入的加權和。

反向傳播:一種透過根據預測誤差迭代調整網路權重來訓練神經網路的演算法。

梯度下降:一種最佳化演算法,用於透過沿著最陡下降的方向迭代移動來最小化損失函數。

Epoch:一次完整地遍歷整個訓練資料集。

Batch:模型訓練的一次迭代中使用的訓練資料的子集。

學習率:一個超參數,控制每次更新模型權重時響應估計誤差而改變模型的程度。

卷積神經網路(CNN):一種常用於影像辨識和處理的神經網路。

반복 신경망(RNN): 데이터 시퀀스의 패턴을 인식하도록 설계된 신경망 유형입니다.

장단기 기억(LSTM): 장기 종속성을 학습할 수 있는 RNN 유형입니다.

Transformer: 입력과 출력 간의 전역 종속성을 끌어내기 위해 주의 메커니즘에 전적으로 의존하는 모델 아키텍처입니다.


기능 엔지니어링 및 선택

Feature Engineering: 도메인 지식을 사용하여 원시 데이터에서 특징을 추출하는 프로세스입니다.

Feature Selection: 모델 구성에 사용할 관련 기능의 하위 집합을 선택하는 프로세스입니다.

차원성 감소: 데이터 세트의 입력 변수 수를 줄이는 기술.

주성분 분석(PCA): 직교 변환을 사용하여 상관관계가 있을 수 있는 변수의 관측값 집합을 선형적으로 상관되지 않은 변수의 값 집합으로 변환하는 통계 절차입니다.


앙상블 방법

Ensemble Learning: 여러 모델을 결합하여 컴퓨팅 지능 문제를 해결하는 프로세스입니다.

Bagged: 훈련 데이터의 여러 하위 집합을 사용하여 다양한 모델을 훈련하는 앙상블 방법입니다.

Boosting: 약한 학습자를 결합하여 강한 학습자를 만드는 앙상블 방식입니다.

Random Forest: 다수의 의사결정 트리를 구성하는 앙상블 학습 방법


자연어 처리(NLP)

토큰화: 텍스트를 개별 단어나 하위 단어로 분해하는 프로세스입니다.

Stemming: 굴절된 단어를 단어 어간 또는 어근 형태로 줄이는 과정입니다.

Lemmatization: 단어의 다양한 굴절 형태를 그룹화하는 과정입니다.

Word Embedding: 비슷한 의미를 가진 단어가 비슷한 표현을 갖는 텍스트에 대한 학습된 표현입니다.

명명된 엔터티 인식(NER): 텍스트에서 명명된 엔터티를 식별하고 분류하는 작업입니다.

감정 분석: 자연어 처리를 사용하여 텍스트에서 주관적인 정보를 식별하고 추출합니다.


강화 학습

Agent: 강화 학습 시나리오의 학습자 또는 의사결정자입니다.

Environment: 에이전트가 작동하고 학습하는 세계

State: 환경에 있는 에이전트의 현재 상황이나 상태입니다.

Action: 에이전트가 내린 움직임이나 결정

Reward: 에이전트가 취한 조치를 평가하기 위한 환경의 피드백입니다.

Policy: 에이전트가 현재 상태를 기반으로 다음 작업을 결정하는 데 사용하는 전략입니다.


고급 개념

GAN(Generative Adversarial Network): 두 개의 신경망이 서로 경쟁하는 기계 학습 프레임워크 클래스입니다.

Attention Mechanism: 인지적 주의를 모방하여 입력 데이터의 중요한 부분을 강화하고 관련 없는 부분을 줄이는 기술입니다.

전이 학습: 하나의 문제를 해결하고 이를 다른 관련 문제에 적용하면서 얻은 지식을 저장하는 데 초점을 맞춘 기계 학습의 연구 문제입니다.

Few-Shot Learning: 단 몇 가지 예를 통해 새로운 클래스를 인식하도록 모델을 훈련하는 기계 학습 유형입니다.

설명 가능한 AI(XAI): 인간이 결과를 이해할 수 있는 인공 지능 시스템

Federated Learning: 로컬 데이터 샘플을 보유한 여러 분산 장치 또는 서버에서 알고리즘을 교육하는 기계 학습 기술입니다.

AutoML: 기계 학습을 실제 문제에 적용하는 엔드투엔드 프로세스를 자동화하는 프로세스입니다.


결론

이 글을 읽고 계시다면 정말 감사드립니다! 정말 감사드립니다 ❤️.

ML에 대한 정기적인 업데이트, 통찰력 및 흥미로운 대화를 보려면 Twitter appyzdl5에서 나를 팔로우하세요.

miniGit 및 ML 알고리즘과 같은 프로젝트가 처음부터 포함된 내 Github: @appyzdl

以上是全面的機器學習術語指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!