타이밍 분석에서 일반적으로 사용되는 알고리즘이 모두 여기에 있습니다.-일체 포함-php.cn

시계열 분석은 과거 기간의 이벤트 특성을 사용하여 미래 기간의 이벤트 특성을 예측하는 것입니다. 이는 회귀분석 모델의 예측과는 다른 비교적 복잡한 예측 모델링 문제입니다. 시계열 모델은 사건이 발생하는 순서에 따라 달라지는데, 같은 크기의 값이라도 순서가 바뀌면 다른 결과가 나옵니다. 시계열 문제는 모두 회귀 문제로 간주되지만 회귀 방법(선형 회귀, 트리 모델) , 딥러닝 등) 특정한 차이점이 있습니다.

타이밍 분석에서 일반적으로 사용되는 알고리즘이 모두 여기에 있습니다. 타이밍 분석에는 정적 타이밍 분석(STA)과 동적 타이밍 분석이 포함됩니다.

다음은 몇 가지 일반적인 타이밍 분석 알고리즘입니다

1 딥 러닝 타이밍 분석

RNN(Recurrent Neural Network)

반복 신경망은 시간이 지남에 따라 반복적으로 발생하는 구조를 말합니다. 자연어 처리(NLP), 음성 이미지 및 기타 분야에서 매우 광범위한 응용 분야를 보유하고 있습니다. RNN 네트워크와 다른 네트워크의 가장 큰 차이점은 RNN이 특정 "메모리 기능"을 달성할 수 있으며 시계열 분석을 위한 최선의 선택이라는 것입니다. 인간이 과거의 기억을 바탕으로 세상을 더 잘 이해할 수 있는 것처럼. 또한 RNN은 인간의 뇌와 유사한 메커니즘을 구현하여 처리된 정보에 대한 메모리를 보유할 수 없는 다른 유형의 신경망과 달리 처리된 정보에 대해 일정량의 메모리를 보유합니다.

장점:

이 방법은 시간을 기억할 수 있으며 시계열의 간격이 짧은 문제를 해결하는 데 적합합니다.

단점:

긴 단계 데이터는 기울기 소멸 및 기울기 폭발 문제가 발생하기 쉽습니다

LSTM (Long Short-Term Memory Network)

LSTM(Long Short-Term Memory)은 기존 순환 신경망(RNN)에 존재하는 장기 의존성 문제를 해결하기 위해 설계된 시간 순환 신경망입니다. 모든 RNN은 일련의 반복되는 신경망 모듈로 구성됩니다.

강점:

매우 긴 간격과 지연이 있는 시계열의 중요한 이벤트를 처리하고 예측하는 데 적합합니다. disadvantages :

too 많은 모델 매개 변수는 과적으로 문제를 초래할 것입니다. 2 전통적인 시계열 분석 모델

auto 회귀 (AR)

빙 평균 (Moving Average, MA)

자기회귀 이동평균(ARMA)
자기회귀 통합 이동 평균(ARIMA)
계절 자기회귀 통합 이동 평균(계절 자기회귀 통합 이동 평균, SARIMA)
외생 회귀변수를 사용한 계절별 자기회귀 통합 이동 평균 ( SARIMAX)
자기회귀모델 AR
강점:

단순성: AR 모델은 이해하고 구현하기 쉬운 선형 모델입니다. 과거 관측값만 독립 변수로 사용하며 다른 복잡한 요인은 고려하지 않습니다.

모델링 기능: AR 모델은 시계열 데이터의 자기상관 구조, 즉 현재 관측치와 과거 관측치 간의 관계를 포착할 수 있습니다. 이는 미래 관찰에 대한 예측을 제공하고 데이터의 추세와 패턴을 드러냅니다.

단점:
- 정상 계열에만 적용 가능: AR 모델에서는 시계열이 고정적이어야 합니다. 즉, 평균, 분산 및 자기 상관이 시간에 따라 변하지 않아야 합니다. 계열이 비정상적이면 미분 작업을 수행하거나 다른 모델을 사용하여 비정상성을 처리해야 할 수도 있습니다.
- 과거 관측값에 민감함: AR 모델의 예측 결과는 과거 관측값의 영향을 받기 때문에 장기 예측을 처리할 때 오류 누적 문제가 발생할 수 있습니다. 차수가 클수록 모델의 과적합이 발생할 수 있고, 차수가 작을수록 시계열의 복잡한 역학을 포착하지 못할 수 있습니다.
- 계절 데이터 처리 불가: AR 모델은 계절성이 뚜렷한 시계열을 직접 처리할 수 없습니다. 계절성 패턴이 있는 데이터의 경우 계절성 AR 모델(SAR) 또는 ARIMA 모델을 사용하여 모델링할 수 있습니다.
이동 평균 방법(MA)

이동 평균 방법(MA): 이 방법은 데이터의 평균을 기반으로 하며 미래 값과 과거 값 사이에 일정한 안정성을 가정합니다.

강점:

시계열 데이터의 이동 평균 관계를 캡처합니다. MA 모델은 과거 시간 단계의 백색 잡음 오류 항의 선형 조합을 활용하여 현재 관측치를 예측하고 이에 따라 데이터의 이동 평균 특성을 포착합니다.

상대적으로 간단하고 직관적입니다. MA 모델의 매개변수는 과거 시간 단계의 백색잡음 오차항의 가중치를 나타내며, 이러한 가중치를 추정하여 모델을 피팅할 수 있습니다.

단점:
- 이동 평균 관계만 포착할 수 있고 자기회귀 관계는 포착할 수 없습니다. MA 모델은 과거 시간 단계 관찰을 무시하고 데이터의 자기 상관을 포착하지 못할 수 있습니다.
- 일부 시계열 데이터의 경우 MA 모델은 데이터를 잘 맞추기 위해 더 높은 차수가 필요할 수 있으므로 모델 복잡성이 증가할 수 있습니다.
Autoregressive Moving Average Model

Autoregressive Moving Average Model(ARMA 모델, Auto-Regression 및 Moving AverageModel)은 시계열을 연구하는 데 중요한 방법으로 자기회귀 모델(AR 모델)과 이동 평균 모델(MA)로 구성됩니다. ). 모델)을 기반으로 적용 범위가 넓고 예측 오차가 작은 특성을 가지고 있습니다.

Autoregressive Integrated Moving Average (ARIMA)

ARIMA 모델은 Autoregressive Differential Moving Average 모델의 약자로, 정식 이름은 Autoregressive Integrated Moving Average Model입니다. 이 모델은 크게 자기회귀모델(AR), 차이과정(I), 이동평균모델(MA)의 세 부분으로 구성됩니다. ARIMA 모델의 기본 아이디어는 데이터 자체의 과거 정보를 활용하는 것입니다. 미래를 예측하기 위해. 특정 시점의 태그 값은 과거 기간의 태그 값과 과거 기간의 우연한 사건 모두의 영향을 받습니다. 즉, ARIMA 모델은 태그 값이 시간의 일반적인 추세를 중심으로 변동한다고 가정합니다. 추세는 과거 레이블의 영향을 받고, 변동은 일정 기간 내의 우연한 사건에 의해 영향을 받으며, 일반적인 추세 자체가 반드시 안정적인 것은 아닙니다

ARIMA 모델은 데이터를 자기상관과 차이를 모델로 분석하는 시계열 분석 방법입니다. 데이터에 숨겨진 시계열 패턴을 추출하고 미래 데이터를 예측합니다

AR 부분은 시계열의 자기회귀 부분을 처리하는 데 사용되며, 이는 여러 과거 기간의 관찰을 고려합니다. 현재 값.
- I 부분은 1차 또는 2차 차분 처리를 통해 시계열의 추세 및 계절 요인을 제거하는 데 사용됩니다.
- MA 부분은 과거 예측 오류가 현재 값에 미치는 영향을 고려하는 시계열의 이동 평균 부분을 처리하는 데 사용됩니다.
- ARIMA 모델은 이 세 부분을 결합하여 데이터의 추세 변화를 포착할 수 있을 뿐만 아니라 일시적이고 급격한 변화 또는 높은 노이즈가 있는 데이터를 처리할 수 있습니다. 따라서 ARIMA 모델은 다양한 시계열 예측 문제에서 좋은 성능을 발휘합니다.
강점:
모델 구성은 다른 외생 변수에 의존하지 않고 내생 변수만 사용하여 매우 간단합니다. 소위 내생변수는 다른 변수의 지원이 필요한 회귀모델과 달리 데이터 자체에만 의존하는 변수를 말합니다

단점:
시계열 데이터는 안정해야 하거나, 차등 처리 후에 안정되어야 합니다.

기본적으로 선형 관계만 캡처할 수 있고 비선형 관계는 캡처할 수 없습니다.

계절 자기회귀 통합 이동 평균 모델 SARIMA

SARIMA는 일반적으로 사용되는 시계열 분석 방법으로 계절 데이터에 대한 ARIMA 모델을 확장한 것입니다. SARIMA 모델은 연간 매출이나 주간 웹사이트 방문과 같은 계절별 시계열 데이터를 예측하는 데 사용할 수 있습니다. SARIMA 모델의 장점과 단점은 다음과 같습니다.

강점:
- SARIMA 모델은 시계열 데이터의 계절적 요인을 고려하므로 계절 데이터를 잘 처리할 수 있습니다.
- SARIMA 모델은 데이터의 추세와 주기적 변화를 포착할 수 있기 때문에 시계열 데이터에 대한 장기 예측을 할 수 있습니다.
- SARIMA 모델은 여러 변수 간의 관계를 동시에 고려할 수 있기 때문에 다변수 시계열 데이터에 사용할 수 있습니다.
단점:
- SARIMA 모델은 학습을 위해 많은 양의 과거 데이터가 필요하므로 데이터 양이 적을 때는 적합하지 않을 수 있습니다.
- SARIMA 모델은 이상값에 민감하므로 이상값을 처리해야 합니다.
- SARIMA 모델은 계산 복잡도가 높고 많은 계산과 최적화가 필요합니다.
계절 자기회귀 통합 이동 평균 모델 SARIMAX with 외생 회귀 분석

계절 자기 회귀 통합 이동 평균 모델(SARIMAX)은 차등 이동 자기 회귀 모델(ARIMA)과 외생 회귀 모델을 기반으로 합니다. 주기적이고 계절적인 특성이 뚜렷한 시계열 데이터에 적합합니다

3 기타 시계열 모델

이러한 유형의 방법은 lightgbm 및 xgboost로 표현되며 일반적으로 시계열 문제는 지도 학습으로 변환되며 기능을 통해 이루어집니다. 이 모델을 예측하기 위한 엔지니어링 및 기계 학습 방법은 가장 복잡한 시계열 예측 모델을 해결할 수 있습니다. 복잡한 데이터 모델링, 다변수 공동 회귀 및 비선형 문제를 지원합니다.

특성 엔지니어링의 중요성은 자명하며 머신러닝의 성공에 핵심적인 역할을 합니다. 그러나 기능 엔지니어링은 간단한 작업이 아니며 복잡한 수동 처리와 고유한 전문 지식이 필요합니다. 특성 엔지니어링 수준에 따라 기계 학습의 상한이 결정되는 경우가 많으며, 기계 학습 알고리즘은 이 상한에 최대한 가깝습니다. 기능 엔지니어링이 완료되면 트리 모델 알고리즘(lightgbm 및 xgboost)을 직접 적용할 수 있습니다. 이 두 모델은 매우 일반적이고 효율적인 모델링 방법입니다. 또한 다음과 같은 특징도 있습니다.
- 빠른 계산 및 높은 모델 정확도
- 결측값을 처리할 필요가 없어
- 범주 변수 지원;
- 기능 교차를 지원합니다.
구체적인 선택 방법은 데이터의 성격, 문제의 특성, 본인의 경험과 능력 등을 종합적으로 고려하여 결정해야 합니다.

특정 데이터 특성, 문제 요구 사항 및 자신의 역량을 기반으로 적절한 시계열 예측 방법을 선택해야 합니다. 경우에 따라 여러 방법을 결합하면 예측의 정확성과 안정성이 향상될 수 있습니다. 동시에, 더 나은 모델을 선택하고 예측 결과를 평가하기 위해서는 데이터의 시각적 분석과 모델 진단을 수행하는 것도 중요합니다.