번역가 | Bugatti
리뷰어 | Sun Shujuan
양자 기계 학습의 세계에 오신 것을 환영합니다! 이 튜토리얼에서는 샘플 데이터 세트를 사용하는 시작 프로젝트를 통해 코드에 대한 단계별 지침을 제공합니다. 이 튜토리얼이 끝나면 양자 컴퓨터를 사용하여 기계 학습 작업을 수행하고 첫 번째 양자 모델을 구축하는 방법에 대한 기본적인 이해를 갖게 됩니다.
하지만 이 튜토리얼을 시작하기 전에 양자 기계 학습이 무엇인지, 왜 그렇게 흥미로운지 알아보겠습니다.
양자 머신러닝은 양자컴퓨팅과 머신러닝이 만나는 분야입니다. 양자 컴퓨터를 사용하여 분류, 회귀, 클러스터링과 같은 기계 학습 작업을 수행합니다. 양자 컴퓨터는 정보를 저장하고 처리하기 위해 기존 비트 대신 양자 비트(큐비트)를 사용하는 강력한 시스템입니다. 이를 통해 기존 컴퓨터보다 훨씬 빠르게 특정 작업을 수행할 수 있으므로 특히 대용량 데이터와 관련된 기계 학습 작업에 적합합니다.
지금 튜토리얼을 시작하세요!
이 튜토리얼에서는 양자 기계 학습을 위해 PennyLane 라이브러리, 수치 계산을 위해 NumPy, 데이터 시각화를 위해 Matplotlib를 사용할 것입니다. 다음 명령을 실행하여 pip를 사용하여 이러한 라이브러리를 설치할 수 있습니다.
!pip install pennylane !pip install numpy !pip install matplotlib
이 튜토리얼에서는 꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비의 네 가지 특징을 지닌 붓꽃 샘플 150개로 구성된 붓꽃 데이터세트를 사용합니다. 데이터 세트는 sklearn 라이브러리에 포함되어 있으므로 다음 코드를 사용하여 로드할 수 있습니다.
from sklearn import datasets # Load the iris dataset iris = datasets.load_iris() X = iris['data'] y = iris['target']
우리는 훈련 세트를 사용하여 양자 모델을 훈련하고 테스트 세트를 사용하여 성능을 평가할 것입니다. sklearn.model_selection 모듈의 train_test_split 함수를 사용하여 데이터 세트를 분할할 수 있습니다.
from sklearn.model_selection import train_test_split # Split the dataset into training and test sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
데이터를 사용하여 양자 모델을 교육하려면 먼저 데이터를 전처리해야 합니다. 일반적인 전처리 단계는 정규화로, 평균과 단위 분산이 0이 되도록 데이터를 조정합니다. sklearn.preprocessing 모듈의 StandardScaler 클래스를 사용하여 정규화를 수행할 수 있습니다.
from sklearn.preprocessing import StandardScaler # Initialize the scaler scaler = StandardScaler() # Fit the scaler to the training data scaler.fit(X_train) # Scale the training and test data X_train_scaled = scaler.transform(X_train) X_test_scaled = scaler.transform(X_test)
이 코드는 StandardScaler 개체를 초기화하고 fit 메서드를 사용하여 훈련 데이터에 맞춥니다. 그런 다음 변환 메서드를 사용하여 훈련 및 테스트 데이터를 조정합니다.
정규화는 데이터의 모든 특징이 동일한 규모로 유지되도록 보장하여 양자 모델의 성능을 향상시킬 수 있기 때문에 중요한 전처리 단계입니다.
이제 PennyLane 라이브러리를 사용하여 양자 모델을 정의할 준비가 되었습니다. 첫 번째 단계는 필요한 함수를 가져오고 양자 장치를 만드는 것입니다.
import pennylane as qml # Choose a device (e.g., 'default.qubit') device = qml.device('default.qubit')
다음으로 데이터를 입력으로 받아들이고 예측을 반환하는 양자 함수를 정의합니다. 단 하나의 양자 뉴런 층으로 구성된 간단한 양자 신경망을 사용하겠습니다.
@qml.qnode(device) def quantum_neural_net(weights, data): # Initialize the qubits qml.templates.AmplitudeEmbedding(weights, data) # Apply a layer of quantum neurons qml.templates.StronglyEntanglingLayers(weights, data) # Measure the qubits return qml.expval(qml.PauliZ(0))
이 양자 함수는 두 가지 변수, 즉 가중치(양자 신경망의 매개변수)와 데이터(입력 데이터)를 사용합니다.
첫 번째 줄은 PennyLane의 AmplitudeEmbedding 템플릿을 사용하여 큐비트를 초기화합니다. 템플릿은 데이터 포인트 사이의 거리가 유지되도록 데이터를 큐비트의 진폭에 매핑합니다.
두 번째 줄은 StronglyEntanglingLayers 템플릿을 사용하여 양자 뉴런 레이어를 적용합니다. 템플릿은 일련의 얽힘 작업을 큐비트에 적용한 다음 범용 양자 컴퓨팅을 구현하는 데 사용할 수 있습니다.
마지막 줄은 Pauli-Z 미터법 기반으로 큐비트를 측정하고 예상 값을 반환합니다.
양자 모델을 훈련하려면 모델 성능을 측정하는 비용 함수를 정의해야 합니다. 이 튜토리얼에서는 평균 제곱 오차(MSE)를 비용 함수로 사용합니다.
def cost(weights, data, labels): # Make predictions using the quantum neural network predictions = quantum_neural_net(weights, data) # Calculate the mean squared error mse = qml.mean_squared_error(labels, predictions) return mse
이 비용 함수는 세 가지 변수, 즉 가중치(양자 모델의 매개변수), 데이터(양자 모델의 매개변수)를 사용합니다. 입력 데이터) 및 레이블(이것은 데이터의 실제 레이블입니다). 양자 신경망을 사용하여 입력 데이터를 기반으로 예측을 수행하고 예측과 실제 레이블 간의 MSE를 계산합니다.
MSE는 예측 값과 실제 값 간의 평균 제곱 차이를 측정하는 기계 학습의 일반적인 비용 함수입니다. MSE가 작을수록 모형이 데이터에 더 잘 맞는다는 것을 나타냅니다.
이제 경사하강법을 사용하여 양자 모델을 훈련할 준비가 되었습니다. PennyLane의 AdamOptimizer 클래스를 사용하여 최적화를 수행합니다.
# Initialize the optimizer opt = qml.AdamOptimizer(stepsize=0.01) # Set the number of training steps steps = 100 # Set the initial weights weights = np.random.normal(0, 1, (4, 2)) # Train the model for i in range(steps): # Calculate the gradients gradients = qml.grad(cost, argnum=0)(weights, X_train_scaled, y_train) # Update the weights opt.step(gradients, weights) # Print the cost if (i + 1) % 10 == 0: print(f'Step {i + 1}: cost = {cost(weights, X_train_scaled, y_train):.4f}')
이 코드는 단계 크기 0.01로 최적화 프로그램을 초기화하고 훈련 단계 수를 100으로 설정합니다. 그런 다음 모델의 초기 가중치를 평균이 0이고 표준편차가 1인 정규 분포에서 추출한 임의의 값으로 설정합니다.
각 훈련 단계에서 코드는 qml.grad 함수를 사용하여 가중치에 대한 비용 함수의 기울기를 계산합니다. 그런 다음 opt.step 메소드를 사용하여 가중치를 업데이트하고 10단계마다 비용을 출력합니다.
梯度下降法是机器学习中常见的优化算法,它迭代更新模型参数以最小化成本函数。AdamOptimizer是梯度下降的一种变体,它使用自适应学习率,这可以帮助优化更快地收敛。
我们已经训练了量子模型,可以评估它在测试集上的性能。我们可以使用以下代码来测试:
# Make predictions on the test set predictions = quantum_neural_net(weights, X_test_scaled) # Calculate the accuracy accuracy = qml.accuracy(predictions, y_test) print(f'Test accuracy: {accuracy:.2f}')
这段代码使用量子神经网络基于测试集做预测,并使用qml.accuracy 函数计算预测准确性。然后,它输出测试准确性。
最后,我们可以使用Matplotlib直观显示量子模型的结果。比如说,我们可以对照真实标签绘制出测试集的预测结果:
import matplotlib.pyplot as plt # Plot the predictions plt.scatter(y_test, predictions) # Add a diagonal line x = np.linspace(0, 3, 4) plt.plot(x, x, '--r') # Add axis labels and a title plt.xlabel('True labels') plt.ylabel('Predictions') plt.title('Quantum Neural Network') # Show the plot plt.show()
这段代码将对照真实标签创建预测的散点图,增添对角线以表示完美预测。然后它为散点图添加轴线标签和标题,并使用plt.show函数来显示。
现在,我们已成功地构建了一个量子机器学习模型,并在示例数据集上评估了性能。
为了测试量子模型的性能,我们运行了教程中提供的代码,获得了以下结果:
Step 10: cost = 0.5020 Step 20: cost = 0.3677 Step 30: cost = 0.3236 Step 40: cost = 0.3141 Step 50: cost = 0.3111 Step 60: cost = 0.3102 Step 70: cost = 0.3098 Step 80: cost = 0.3095 Step 90: cost = 0.3093 Step 100: cost = 0.3092 Test accuracy: 0.87
这些结果表明,量子模型能够从训练数据中学习,并基于测试集做出准确的预测。在整个训练过程中,成本稳步下降,这表明模型在学习过程中不断改进。最终的测试准确率为0.87,表现相当好,这表明该模型能够正确地分类大部分测试样例。
量子机器学习是一个令人兴奋的领域,有许多潜在的应用,从优化供应链到预测股价,不一而足。我们希望本教程能让您了解量子计算机和机器学习的可能性,并激励您深入了解这个诱人的话题。
原文标题:Quantum Machine Learning: A Beginner’s Guide,作者:SPX
위 내용은 양자 기계 학습: 초보자 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!