包括的な機械学習用語ガイド

WBOY
リリース: 2024-07-26 12:58:51
オリジナル
246 人が閲覧しました

Comprehensive Machine Learning Terminology Guide

導入

包括的な機械学習用語ガイドへようこそ!機械学習の分野の初心者であっても、語彙を磨きたい経験豊富な実践者であっても、このガイドは、ML の基礎を形成する重要な用語と概念を理解するための頼りになるリソースとなるように設計されています。


基本的な概念

機械学習 (ML): データから学習し、データに基づいて意思決定を行うシステムの構築に焦点を当てた人工知能のサブセットです。

人工知能 (AI): 人間の思考能力や行動をシミュレートできるインテリジェントなマシンを作成する広範な分野。

ディープラーニング: 複数の層を持つ人工ニューラルネットワークに基づく機械学習のサブセット。

データセット: 機械学習モデルのトレーニングとテストに使用されるデータのコレクション

特徴: 観察されている現象の個々の測定可能な特性または特性。

ラベル: 教師あり学習で予測しようとしているターゲット変数。

モデル: データから学習した、現実世界のプロセスの数学的表現。

アルゴリズム: 問題を解決するための段階的な手順または公式。

トレーニング: データに基づいて予測や決定を行うようにモデルを教えるプロセス。

推論: トレーニングされたモデルを使用して、新しい未知のデータについて予測を行います。


機械学習の種類

教師あり学習: ラベル付きデータから学習して、予期せぬデータの結果を予測します。

教師なし学習: ラベル付き応答を使用せずに、入力データ内の隠れたパターンまたは固有の構造を見つけます。

半教師あり学習: ラベル付きデータとラベルなしデータの組み合わせから学習します。

強化学習: 環境と対話することで意思決定を行うことを学びます。

転移学習: 1 つのタスクから得た知識を関連するタスクに適用します。


モデルの評価と指標

精度: 検査されたケースの総数における正しい予測の割合。

精度: すべての肯定的な予測のうちの真の肯定的な予測の割合。

思い出してください: すべての実際の陽性ケース中の真陽性予測の割合。

F1 スコア: 精度と再現率の調和平均。

ROC 曲線: バイナリ分類器システムの診断能力を示すグラフです。

AUC (Area Under the Curve): クラス間を区別する分類器の能力の尺度です。

混同行列: 分類モデルのパフォーマンスを説明するために使用される表。

相互検証: 限られたデータサンプルで機械学習モデルを評価するために使用されるリサンプリング手順

過学習: モデルがノイズや変動を含むトレーニング データを学習しすぎる場合。

アンダーフィッティング: モデルが単純すぎてデータの基礎となる構造を捕捉できない場合。


ニューラルネットワークとディープラーニング

ニューロン: 生物学的ニューロンを大まかにモデル化した、ニューラル ネットワークの基本単位です。

活性化関数: 入力または入力のセットが与えられたニューロンの出力を決定する関数。

重み: ニューロン間の接続の強さを決定するニューラル ネットワーク内のパラメーター。

バイアス: ニューロンへの入力の加重合計とともに出力を調整するために使用されるニューラル ネットワークの追加パラメーターです。

バックプロパゲーション: 予測誤差に基づいてネットワークの重みを繰り返し調整することにより、ニューラル ネットワークをトレーニングするためのアルゴリズムです。

勾配降下法: 最急降下方向に反復的に移動することで損失関数を最小化するために使用される最適化アルゴリズム

エポック: トレーニング データセット全体を通る 1 つの完全なパス。

バッチ: モデル トレーニングの 1 回の反復で使用されるトレーニング データのサブセット。

学習率: モデルの重みが更新されるたびに、推定誤差に応じてモデルをどの程度変更するかを制御するハイパーパラメーターです。

畳み込みニューラル ネットワーク (CNN): 画像の認識と処理に一般的に使用されるニューラル ネットワークの一種です。

Recurrent Neural Network (RNN): Sejenis rangkaian neural yang direka untuk mengenali corak dalam jujukan data.

Memori Jangka Pendek Panjang (LSTM): Sejenis RNN yang mampu mempelajari kebergantungan jangka panjang.

Transformer: Seni bina model yang bergantung sepenuhnya pada mekanisme perhatian untuk menarik kebergantungan global antara input dan output.


Kejuruteraan dan Pemilihan Ciri

Kejuruteraan Ciri: Proses menggunakan pengetahuan domain untuk mengekstrak ciri daripada data mentah.

Pemilihan Ciri: Proses memilih subset ciri yang berkaitan untuk digunakan dalam pembinaan model.

Pengurangan Dimensi: Teknik untuk mengurangkan bilangan pembolehubah input dalam set data.

Analisis Komponen Utama (PCA): Prosedur statistik yang menggunakan transformasi ortogon untuk menukar satu set pemerhatian pembolehubah yang mungkin berkorelasi kepada satu set nilai pembolehubah tidak berkorelasi linear.


Kaedah Ensemble

Pembelajaran Ensemble: Proses menggabungkan pelbagai model untuk menyelesaikan masalah kecerdasan pengiraan.

Bagging: Kaedah ensemble yang menggunakan berbilang subset data latihan untuk melatih model yang berbeza.

Meningkatkan: Kaedah ensemble yang menggabungkan pelajar yang lemah untuk mencipta pelajar yang kuat.

Hutan Rawak: Kaedah pembelajaran ensemble yang membina pelbagai pokok keputusan.


Pemprosesan Bahasa Semulajadi (NLP)

Tokenisasi: Proses memecahkan teks kepada perkataan atau subkata individu.

Stemming: Proses mengurangkan perkataan infleksi kepada bentuk batang atau akar kata.

Lemmatisasi: Proses menghimpunkan bentuk infleksi yang berbeza bagi sesuatu perkataan.

Pembenaman Perkataan: Perwakilan yang dipelajari untuk teks di mana perkataan dengan makna yang serupa mempunyai perwakilan yang serupa.

Pengiktirafan Entiti Dinamakan (NER): Tugas mengenal pasti dan mengelaskan entiti yang dinamakan dalam teks.

Analisis Sentimen: Penggunaan pemprosesan bahasa semula jadi untuk mengenal pasti dan mengekstrak maklumat subjektif daripada teks.


Pembelajaran Pengukuhan

Agen: Pelajar atau pembuat keputusan dalam senario pembelajaran pengukuhan.

Persekitaran: Dunia di mana ejen beroperasi dan belajar.

Nyatakan: Keadaan atau keadaan semasa ejen di persekitaran.

Tindakan: Satu langkah atau keputusan yang dibuat oleh ejen.

Ganjaran: Maklum balas daripada persekitaran untuk menilai tindakan yang diambil oleh ejen.

Polisi: Strategi yang digunakan oleh ejen untuk menentukan tindakan seterusnya berdasarkan keadaan semasa.


Konsep Lanjutan

Generative Adversarial Network (GAN): Kelas rangka kerja pembelajaran mesin di mana dua rangkaian saraf bertanding antara satu sama lain.

Mekanisme Perhatian: Teknik yang meniru perhatian kognitif, meningkatkan bahagian penting data input dan mengurangkan bahagian yang tidak berkaitan.

Pembelajaran Pemindahan: Masalah penyelidikan dalam pembelajaran mesin yang menumpukan pada menyimpan pengetahuan yang diperoleh semasa menyelesaikan satu masalah dan menerapkannya kepada masalah yang berbeza tetapi berkaitan.

Pembelajaran Sedikit Tangkapan: Sejenis pembelajaran mesin di mana model dilatih untuk mengenali kelas baharu daripada hanya beberapa contoh.

AI Boleh Dijelaskan (XAI): Sistem kecerdasan buatan di mana hasilnya boleh difahami oleh manusia.

Pembelajaran Bersekutu: Teknik pembelajaran mesin yang melatih algoritma merentas berbilang peranti atau pelayan terdesentralisasi yang memegang sampel data setempat.

AutoML: Proses mengautomasikan proses hujung ke hujung menerapkan pembelajaran mesin kepada masalah dunia sebenar.


Kesimpulan

Jika anda membaca ini, terima kasih banyak-banyak! Saya sangat menghargainya ❤️.

Ikuti saya di Twitter appyzdl5 untuk mendapatkan kemas kini biasa, cerapan dan perbualan yang menarik tentang ML.

Github saya dengan projek seperti miniGit dan ML algos dari awal: @appyzdl

以上が包括的な機械学習用語ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:dev.to
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!