人工智慧解釋：訓練和推理的關鍵階段-常見問題-PHP中文網

人工智慧（AI）、機器學習和生成式AI已成為現代企業技術工具箱的重要組成部分。 AI涵蓋廣泛技術，包括即時語言翻譯、臉部辨識、語音助理、個人化推薦系統和詐欺偵測。 AI訓練和推理過程對於理解模型的功能至關重要。訓練涉及使用資料集訓練模型，使模型能夠從處理的資訊中學習並做出預測或決策。推理階段將訓練後的模型應用於新數據，使其能夠執行任務，例如圖像識別、語言翻譯或決策。

人工智慧解釋：訓練和推理的關鍵階段

人工智慧、機器學習以及最近的生成式人工智慧現已成為所有從事數位創新的公司的技術和方法工具包的一部分。人工智慧包括能夠執行通常需要人類智慧的任務的廣泛技術，例如即時語言翻譯、臉部辨識、語音助理、個人化推薦系統或詐欺檢測，以及從放射影像識別疾病的電腦輔助醫療診斷。

讓我們討論人工智慧訓練和推理過程，以便更好地了解模型 (*) 的功能。 AI訓練圖

注意：標示 (*) 的術語在本文末的「術語表」部分定義。

人工智慧培訓

簡而言之，人工智慧訓練是在大量測試資料的基礎上開發機器學習模型的過程。

它涉及向模型提供資料集 (*)，使其能夠根據其處理的資訊進行學習並做出預測 (*) 或決策 (*)。模型在此階段獲得執行特定任務所需的知識和技能。

#無論是解釋自然語言（*）或是執行複雜的計算，這一步都是基礎。事實上，它決定了模型的準確性、效率和整體性能，從而決定了將使用它的應用程式。

AI模型訓練過程涉及幾個步驟。

1. 資料準備

此步驟涉及以允許有效使用的格式收集、清理和組織資料。確保模型輸入資料的品質和可靠性非常重要。

2. 演算法

第二步驟涉及選擇最適合解決我們想要解決的問題的適當演算法（*）或神經網路（*）架構。

3. 細化

一旦選擇了模型，第三個步驟就是迭代精簡。這涉及多次訓練和測試模型，以根據性能調整其參數，提高其準確性並減少錯誤。

AI訓練類別圖片圖片

人工智慧訓練：挑戰

訓練人工智慧模型面臨真正的挑戰，例如：

資料品質

模型的好壞取決於訓練資料的品質。不準確、不完整或有偏見的資料集可能會導致糟糕的預測。

資訊科技資源

訓練所需的運算資源需要高處理能力和大量內存，特別是對於深度學習網路等複雜模型(*)。過度擬合（*）等現象可能會降低預測或分類任務的品質。

為了說明訓練 AI 模型所需的運算資源，請考慮訓練像 GPT-3 這樣的複雜深度學習網路需要大量運算能力來合併其 1750 億個參數。

人工智慧推理

在此階段，將經過訓練的機器學習(*) 模型應用於新數據，使其能夠執行預測、分類、推薦或在現實應用中做出決策等任務。

換句話說，推理是使人工智慧模型能夠提供預期好處的階段，例如識別圖像中的物件、翻譯語言、提供產品推薦或引導自動駕駛車輛。

區分訓練與推理

推理過程與人工智慧訓練的差異有兩個主要標準：

即時處理資料的重要性

對效率和低延遲的需求

在實踐中，自動駕駛或即時詐欺偵測系統必須擁有能夠快速解釋新數據並迅速採取行動的模型。

需要克服的挑戰

推理階段需要專注於資源效率、在各種環境中保持一致的性能以及在速度方面優化模型。人工智慧模型必須具有適應性，同時又不能犧牲準確性或可靠性。這需要採用模型剪枝（*）或量化（*）等技術來減少計算負載，同時避免降低模型效能。

範例

具體例子說明推理的實際應用如下：

網路安全性

一旦接受了大量電子郵件互動資料集的訓練，應用程式就可以識別並標記傳入電子郵件中潛在的垃圾郵件或網路釣魚嘗試，從而保護使用者免受網路安全威脅。

自動駕駛汽車

同樣，自動駕駛汽車領域也嚴重依賴人工智慧的推理能力。在這種情況下，從無數小時的駕駛資料中訓練出來的模型被即時應用於道路導航、識別交通標誌並做出瞬間決策。

訓練與推理：比較分析

訓練和推理是人工智慧模型開發中兩個關鍵且互補的階段，每個階段都滿足特定的需求。訓練階段讓模型從歷史資料中獲取知識。這一步驟需要大量的運算能力來調整模型的參數以實現準確的預測。

另一方面，推理將經過訓練的模型應用於新資料以即時做出預測或決策，凸顯了效率和低延遲的重要性。

需要記住的要點

平衡模型複雜性、全面訓練和推理效率對於開發人工智慧系統至關重要。

複雜的模型可以更好地理解和預測，但需要更多的資源來訓練和推理。

開發人員必須產生一個足夠複雜、準確且足夠高效的模型，以便即時使用。

剪枝、量化和遷移學習等技術可以在準確性和效率方面優化模型。

基礎設施需求

訓練和推理階段的基礎設施要求導致對硬體效能的嚴重依賴。

訓練深度學習模型的運算量特別大，需要專用資源來提供強大的運算能力。此階段通常需要高效能 GPU 來管理大型資料集，而模型的準確性和效率取決於此。

相反，推理階段對運算能力要求較低，但需要低延遲、高吞吐量的效能。其基礎設施需要效率和回應能力，以實現接近資料產生來源的即時資料處理，就像自動駕駛汽車或我們的電子郵件伺服器一樣，而且在醫療保健診斷中也引入了一個新的例子。

結論

了解人工智慧訓練和推理的微妙之處揭示了透過人工智慧模型獲取知識和在具體應用中部署這些知識之間的複雜性。

人工智慧不僅需要強大，而且具有適應性。為了實現這一目標，必須在大量訓練資源的使用和快速、高效推理的需求之間取得平衡。隨著人工智慧在醫療保健、金融和工業等領域的進步，這些訓練和推理階段至關重要，因為它們支援創建應用於具體業務案例的人工智慧。

還有一件事...

碳足跡怎麼樣？

為了推動機器學習和人工智慧，顯然有必要專注於開發更有效率的人工智慧模型、優化硬體基礎設施，以及更廣泛地採用創新策略。同時，也許還必須考慮人工智慧的生態足跡。

「未來人工智慧需要能源突破，它消耗的電力將遠遠超出人們的預期。」

- OpenAI 執行長Sam Altman

DAVOS，瑞士； 2024 年1 月16 日

事實上，隨著訓練人工智慧模式對環境的影響受到密切關注，永續性成為一個重要議題。隨著企業和公眾的採用，需要更多的電力和大量的水來為科技巨頭的設備平台供電和冷卻。例如，研究人員估計，製造 GPT-3 消耗了 1,287 兆瓦時的電力，並產生了 552 噸二氧化碳當量，相當於 123 輛汽油客車一年的行駛量。

努力實現技術進步與生態責任和諧共存的更永續的未來可能是人工智慧演化的最終目標。

(*) 術語表

#演算法：一組定義的、逐步的計算程序或規則，旨在執行特定任務或解決特定問題
資料集：資料點或記錄的集合，通常採用表格形式，用於訓練、測試或驗證機器學習模型，包括特徵（自變數）和監督學習中的標籤（因變數或結果）。
決策：在機器學習中，這是指模型在分析資料後得出的結論，例如垃圾郵件過濾器決定電子郵件是垃圾郵件（並將其移至垃圾郵件資料夾）或不是垃圾郵件（將其留在收件匣中）。
深度學習：機器學習的一個子集，涉及稱為多層神經網路的模型，能夠從大量資料中自動學習複雜的模式和表示
#標記資料：這是指每個實例都標記有結果或類別的資料集，為機器學習模型在訓練過程中提供明確的指導。
機器學習：人工智慧的一個分支，涉及訓練演算法來識別模式並根據資料做出決策，而無需針對每個特定任務進行明確編程
模型：在資料集上訓練的數學和計算表示，能夠透過學習訓練資料中的模式和關係來對新的、未見過的資料進行預測和分類
#模型修剪：聯邦學習中的一種技術，透過在訓練期間自適應地修剪參數來減少模型的大小，以減少對客戶端設備的計算和通訊需求，而不顯著影響模型的準確性
自然語言：人類相互溝通的方式，無論是口頭或書面，包含人類語言表達固有的複雜性、細微差別和規則
神經網路：一種受人腦結構啟發的計算模型，由互連的節點或神經元組成，透過從資料中學習來處理和傳輸訊號以解決複雜的任務，例如模式識別與決策
過度擬合：當機器學習模型過於密切地學習訓練資料時，使其無法概括和準確預測未見過的資料的結果
模式：（在機器學習的背景下）模型學習識別的資料中可辨別的規律，可用於對新的、未見過的資料進行預測或決策
預測：（在機器學習中）使用經過訓練的模型根據訓練階段學到的模式來估計新的、未見過的實例最可能的結果或值的過程
#量化：（在深度學習中）將模型中的權重和激活的精度降低到2 位、3 位或4 位的過程，使模型能夠在推理時更有效率地運行，同時將準確性損失降到最低。
監督/無監督：監督學習和無監督學習之間的區別在於監督學習訓練中存在標記資料（*），指導模型學習從輸入到輸出的映射，而無監督學習涉及在資料中尋找模式或結構，而無需明確的結果標籤。