包括的な機械学習用語ガイド-Python チュートリアル-php.cn

Comprehensive Machine Learning Terminology Guide

導入

包括的な機械学習用語ガイドへようこそ!機械学習の分野の初心者であっても、語彙を磨きたいと考えている経験豊富な実践者であっても、このガイドは、ML の基礎を形成する重要な用語と概念を理解するための頼りになるリソースとなるように設計されています。

基本的な概念

機械学習 (ML): データから学習し、データに基づいて意思決定を行うシステムの構築に焦点を当てた人工知能のサブセット。

人工知能 (AI): 人間の思考能力や行動をシミュレートできるインテリジェントマシンを作成する広範な分野。

深層学習: 複数の層を持つ人工ニューラルネットワークに基づく機械学習のサブセット。

データセット: 機械学習モデルのトレーニングとテストに使用されるデータのコレクション。

特徴: 観察されている現象の個々の測定可能な特性または特性。

ラベル: 教師あり学習で予測しようとしているターゲット変数。

モデル: データから学習された、現実世界のプロセスの数学的表現。

アルゴリズム: 問題を解決するための段階的な手順または公式。

トレーニング: データに基づいて予測や決定を行うようにモデルを教えるプロセス。

推論: トレーニングされたモデルを使用して、新しい未知のデータに対して予測を行います。

機械学習の種類

教師あり学習: ラベル付きデータから学習して、予期せぬデータの結果を予測します。

教師なし学習: ラベル付き応答を使用せずに、入力データ内の隠れたパターンまたは固有の構造を見つけます。

半教師あり学習: ラベル付きデータとラベルなしデータの組み合わせから学習します。

強化学習: 環境と対話することによって意思決定を行うことを学習します。

転移学習: 1 つのタスクから得た知識を関連タスクに適用します。

モデルの評価と指標

精度: 検査されたケースの総数のうち、正しい予測の割合。

精度: すべての肯定的な予測のうちの真の肯定的な予測の割合。

再現: すべての実際の陽性ケースのうちの真陽性予測の割合。

F1 スコア: 精度と再現率の調和平均。

ROC 曲線: バイナリ分類システムの診断能力を示すグラフ。

AUC (曲線下面積): クラス間を区別する分類器の能力の尺度。

混同行列: 分類モデルのパフォーマンスを説明するために使用される表。

相互検証: 限られたデータサンプルで機械学習モデルを評価するために使用されるリサンプリング手順。

過学習: モデルがノイズや変動を含むトレーニングデータを学習しすぎる場合。

アンダーフィッティング: モデルが単純すぎてデータの基礎となる構造を捕捉できない場合。

ニューラルネットワークとディープラーニング

ニューロン: 生物学的ニューロンを大まかにモデル化したニューラルネットワークの基本単位。

活性化関数: 入力または入力のセットが与えられたニューロンの出力を決定する関数。

重み: ニューロン間の接続の強さを決定するニューラルネットワーク内のパラメーター。

バイアス: ニューロンへの入力の加重合計とともに出力を調整するために使用されるニューラルネットワークの追加パラメーター。

バックプロパゲーション: 予測誤差に基づいてネットワークの重みを繰り返し調整することにより、ニューラルネットワークをトレーニングするためのアルゴリズム。

Gradient Descent: 最急降下方向に反復的に移動することで損失関数を最小化するために使用される最適化アルゴリズム。

エポック: トレーニングデータセット全体を通る 1 つの完全なパス。

バッチ: モデルトレーニングの 1 回の反復で使用されるトレーニングデータのサブセット。

学習率: モデルの重みが更新されるたびに、推定誤差に応じてモデルをどの程度変更するかを制御するハイパーパラメーターです。

畳み込みニューラルネットワーク (CNN): 画像の認識と処理に一般的に使用されるニューラルネットワークの一種。

リカレントニューラルネットワーク (RNN): データのシーケンス内のパターンを認識するように設計されたニューラルネットワークの一種。

長短期記憶 (LSTM): 長期依存関係を学習できる RNN の一種。

トランスフォーマー: アテンションメカニズムに完全に依存して、入力と出力の間にグローバルな依存関係を描画するモデルアーキテクチャ。

特徴量エンジニアリングと選択

特徴エンジニアリング: ドメイン知識を使用して生データから特徴を抽出するプロセス。

特徴選択: モデル構築で使用する関連特徴のサブセットを選択するプロセス。

次元削減: データセット内の入力変数の数を削減する手法。

主成分分析 (PCA): 直交変換を使用して、相関関係がある可能性のある変数の観測値のセットを、線形に相関のない変数の値のセットに変換する統計手順。

アンサンブルメソッド

アンサンブル学習: 複数のモデルを組み合わせて計算知能の問題を解決するプロセス。

バギング: トレーニングデータの複数のサブセットを使用してさまざまなモデルをトレーニングするアンサンブル手法。

ブースティング: 弱い学習器を組み合わせて強い学習器を作成するアンサンブル手法。

ランダムフォレスト: 多数の決定木を構築するアンサンブル学習手法。

自然言語処理 (NLP)

トークン化: テキストを個々の単語またはサブワードに分解するプロセス。

ステミング: 活用された単語を語幹または語根の形に減らすプロセス。

見出し語化: 単語のさまざまな語形変化をグループ化するプロセス。

単語の埋め込み: 同様の意味を持つ単語が同様の表現を持つ、テキストの学習された表現です。

固有表現認識 (NER): テキスト内の固有表現を識別および分類するタスク。

感情分析: 自然言語処理を使用して、テキストから主観的な情報を識別および抽出します。

強化学習

エージェント: 強化学習シナリオの学習者または意思決定者。

環境: エージェントが動作し、学習する世界。

状態: 環境内のエージェントの現在の状況または状態。

アクション: エージェントによって行われた動きまたは決定。

報酬: エージェントがとったアクションを評価するための環境からのフィードバック。

ポリシー: 現在の状態に基づいて次のアクションを決定するためにエージェントによって使用される戦略。

高度な概念

敵対的生成ネットワーク (GAN): 2 つのニューラルネットワークが互いに競合する機械学習フレームワークのクラス。

注意メカニズム: 認知的注意を模倣し、入力データの重要な部分を強調し、無関係な部分を削除する手法。

転移学習: 1 つの問題を解決する際に得られた知識を保存し、それを別の関連する問題に適用することに焦点を当てた機械学習の研究問題。

フューショット学習: ほんの数例から新しいクラスを認識するようにモデルがトレーニングされる機械学習のタイプ。

Explainable AI (XAI): 結果が人間に理解できる人工知能システム。

フェデレーテッドラーニング: ローカルデータサンプルを保持する複数の分散デバイスまたはサーバーにわたってアルゴリズムをトレーニングする機械学習手法。

AutoML: 現実世界の問題に機械学習を適用するエンドツーエンドのプロセスを自動化するプロセス。

結論

これを読んでくださっている方、本当にありがとうございます！とても感謝しています❤️。

Twitter appyzdl5 をフォローして、ML に関する定期的な最新情報、洞察、魅力的な会話を入手してください。

miniGit や ML アルゴなどのプロジェクトをゼロから作成した私の Github: @appyzdl

以上が包括的な機械学習用語ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。