기계 학습 알고리즘을 통해 소프트 센서를 설계하는 방법은 무엇입니까?-일체 포함-php.cn

기계 학습 알고리즘을 통해 소프트 센서를 설계하는 방법은 무엇입니까?

WBOY

풀어 주다： 2024-04-12 17:55:15

앞으로

759명이 탐색했습니다.

엔지니어는 기계 학습 알고리즘의 기능을 이해함으로써 애플리케이션에 효과적인 소프트 센서를 생성할 수 있습니다.

기계 학습 알고리즘을 통해 소프트 센서를 설계하는 방법은 무엇입니까?

가상 센서라고도 알려진 소프트 센서는 수백 개의 측정 데이터를 종합적으로 처리할 수 있는 소프트웨어입니다. 소프트 센서를 추가하려는 공장 관리자는 소프트 센서와 작동하는 기계 학습의 범위에 혼란을 겪을 수 있습니다. 그러나 주제를 더 깊이 살펴보면 대부분의 소프트 센서 설계에 기본이 되는 몇 가지 핵심 알고리즘이 있음을 알 수 있습니다.

이러한 모델의 선택, 교육 및 구현은 데이터 과학자의 업무인 경우가 많지만, 공장 관리자 및 기타 운영 전문가도 해당 모델의 역량을 익히고 싶어할 것입니다.

소프트 센서 이해

소프트 센서는 소프트웨어 환경에서 생성되지만 실제 센서와 동일한 이점을 제공할 수 있습니다. 어떤 경우에는 실제 센서보다 소프트 센서가 더 선호될 수도 있습니다.

운영 전문가와 데이터 과학자가 협력하여 센서를 설계해야 하는 데는 여러 가지 이유가 있습니다. 한 가지 이유는 특정 결과에 필요한 주요 매개변수를 실시간 또는 거의 실시간으로 측정하려는 욕구 때문입니다. 이러한 측정은 전반적인 성능을 향상시키는 데 중요합니다.

소프트 센서의 기타 사용 사례는 다음과 같습니다.

공장 직원 부족. 일부 공정에서는 실험실 직원이 특정 물리적 또는 화학적 특성의 매개변수를 샘플링하거나 분석해야 합니다. 여기에는 점도, 분자량 및 조성이 포함될 수 있습니다. 측정할 사람이 충분하지 않은 경우 소프트 센서를 사용하여 이러한 값을 추정할 수 있습니다.
중복 센서. 열악한 환경에서는 센서 오염이 발생할 수 있습니다. 소프트 센서는 프로세스를 계속 진행하기 위해 디지털 센서를 교체할 수 있을 때까지 디지털 센서의 판독값을 제공할 수 있습니다.
추가 센서. 때로는 더 많은 센서가 필요할 수도 있고 프로세스에 자체 센서가 부족할 수도 있습니다. 이러한 경우 소프트 센서는 모든 올바른 센서를 사용하여 동일한 자산을 모방할 수 있습니다.

머신러닝 모델의 주요 유형

머신러닝 실습에서는 순환 패턴을 따르는 경우가 많습니다. 먼저 데이터를 준비하고 정리합니다. 다음으로, 데이터 과학자는 모델의 기반이 되는 알고리즘을 선택합니다. 그런 다음 데이터 과학자는 처리되지 않거나 전처리된 시계열 및 상황별 데이터를 사용하여 모델 교육을 시작합니다. 마지막으로 모델이 테스트되고 배포됩니다. 그런 다음 다시 순환하여 모델을 개선합니다.

일반적으로 선택할 수 있는 모델에는 두 가지 주요 유형이 있습니다.

다른 변수와 비교하려면 레이블이 지정된 데이터 세트가 필요한 감독 모델.
비지도 모델은 주로 여러 변수 간의 관계를 설명하는 데 사용됩니다.

이러한 모델 중에서 지도 모델은 소프트 센서를 개발하거나 예측 라벨을 생성하는 데 더 나은 선택입니다. 수백 개의 지도 기계 학습 모델이 있지만 회귀 알고리즘이라는 클래스의 일부 모델만이 소프트 센서를 만드는 데 유용합니다. 다음은 각 모델에 대한 설명입니다.

선형 회귀

이는 소프트 센서를 만드는 가장 유용하고 간단한 방법 중 하나입니다. 그러나 중합체 점도 측정과 같은 일부 절차는 선형 회귀 분석에 비해 너무 복잡합니다. 이 알고리즘은 목표 변수의 값을 예측하는 함수를 생성합니다. 하나 이상의 변수 집합을 선형으로 결합한 함수입니다. 하나의 변수를 사용하는 경우를 일변량 선형 회귀라고 합니다. 다중 변수는 다중 선형 회귀라는 이름을 부여합니다. 이 모델을 사용할 때의 이점은 명확성입니다. 어떤 변수가 목표에 가장 큰 영향을 미치는지 쉽게 판단할 수 있습니다. 이를 특성 중요도라고 합니다.

결정 트리

이론적으로 결정 트리에는 데이터를 맞추는 데 필요한 만큼의 규칙과 분기가 있을 수 있습니다. 이들은 일련의 기능이라고 하는 독립 변수의 이러한 규칙을 사용합니다. 결과는 목표 값의 조각별 상수 추정치입니다. 많은 규칙과 분기를 가질 수 있으므로 매우 유연할 수 있습니다.

반면에 데이터를 과적합할 위험도 있습니다. 과적합은 모델을 너무 오랫동안 훈련할 때 발생합니다. 이를 통해 모델은 데이터 세트의 노이즈에 적응하기 시작하고 이를 정상적으로 처리하기 시작할 수 있습니다. 데이터에 과소적합이 발생할 수도 있습니다. 이 경우, 알고리즘은 충분히 오랫동안 훈련되지 않았으므로 독립 변수가 목표 변수와 어떻게 관련될 수 있는지, 또는 독립 변수가 목표 변수에 어떤 영향을 미칠 수 있는지 판단할 만큼 충분한 데이터가 없었습니다.

데이터 과적합과 과소적합 모두 모델 실패의 원인이 됩니다. 모델은 더 이상 새로운 데이터를 처리할 수 없으며 소프트 센서와 함께 사용할 수 없습니다. 데이터 과적합 및 과소적합 개념은 의사결정 트리 모델에만 국한되지 않습니다.

Random Forest

이것은 본질적으로 하나의 모델에 여러 의사결정 트리 모델을 결합한 것입니다. 이는 더 많은 유연성을 제공하고 더 많은 기능을 허용하며 더 큰 예측력을 제공합니다. 그러나 이는 데이터에 과적합될 위험도 높습니다.

Gradient Boosting

기계 학습에서는 Gradient Boosting을 종종 앙상블 모델이라고 합니다. Random Forest와 마찬가지로 Gradient Boosting은 여러 의사결정 트리를 결합합니다. 그러나 이것이 다른 점은 마지막으로 계산된 손실 함수를 최소화하기 위해 각 트리를 최적화한다는 것입니다. 이러한 모델은 매우 효과적일 수 있지만 시간이 지남에 따라 해석하기가 더욱 어려워집니다.

Neural Network

소위 딥러닝은 신경망 회귀 모델의 개념입니다. 이 모델은 입력 변수를 받아들이고 회귀 문제에 적용될 때 목표 변수에 대한 값을 생성합니다. 가장 기본적인 신경망은 다층 퍼셉트론입니다. 이 모델에서는 단일 배열의 뉴런만 사용됩니다. 보다 일반적으로 신경망에는 입력 레이어, 하나 이상의 숨겨진 레이어(각각 많은 뉴런이 있음) 및 값을 얻기 위한 출력 레이어가 있습니다.

히든 레이어의 각 뉴런 내 가중치 입력 값을 합산하여 활성화 함수(예: 시그모이드 함수)를 통해 전달합니다. 이 기능은 모델을 비선형으로 만듭니다. 함수가 모델을 통과하면 단일 뉴런이 포함된 출력 레이어에 도달합니다. 모델을 훈련할 때 특성과 목표 값에 가장 잘 맞는 가중치와 편향을 결정하세요.