光を使用してニューラル ネットワークをトレーニングする清華大学の結果が、最近 Nature に掲載されました。
逆伝播アルゴリズムを適用できない場合はどうすればよいですか?
彼らは、物理的な光学システムでトレーニング プロセスを直接実行し、従来のデジタル コンピューター シミュレーションの制限を克服する完全順方向モード (FFM) トレーニング方法を提案しました。
簡単に言うと、以前は物理システムを詳細にモデル化し、それらのモデルをコンピューター上でシミュレートしてネットワークをトレーニングする必要がありました。 FFM 手法ではモデリング プロセスが不要になり、システムが実験データを学習と最適化に直接使用できるようになります。
これは、トレーニングで各層を後ろから前にチェックする必要がなくなり (バックプロパゲーション)、ネットワークのパラメーターを前から後ろに直接更新できることも意味します。
たとえば、バックプロパゲーションはパズルと同じように、最初に最終的な画像 (出力) を確認し、それを逆に 1 つずつチェックして復元する必要がありますが、FFM 手法は部分的に完成したパズルに似ており、単にそれを行うだけです。いくつかの軽い原則 (対称互恵性) に従う必要があります。前のパズルのピースを確認するために戻らずに入力を続けます。
このように、FFM を使用する利点も明らかです。
まず、数学的モデルへの依存が減り、不正確なモデルによって引き起こされる問題を回避できます。次に、時間が節約されます (エネルギー消費が少なくなります)。 , 光学システムを使用すると、大量のデータと操作を並行して処理できるようになり、バックプロパゲーションが排除されるため、ネットワーク全体で確認および調整が必要なステップの数も削減されます。
論文の共著者は清華大学のXue Zhiwei氏とZhou Tiankui氏、責任著者は清華大学のFang Lu教授と院士のDai Qionghai氏です。さらに、清華大学電子学部の Xu Zhihao 氏と志江研究所の Yu Shaoliang 氏もこの研究に参加しました。
逆伝播を排除する
FFM 原理を一文で要約すると:
光学システムをパラメータ化されたオンサイト ニューラル ネットワークにマッピングし、出力ライト フィールドを測定して勾配を計算し、勾配降下法アルゴリズムを使用してパラメータを更新します。
簡単に言うと、光学システムに学習させ、光がどのように処理されるかを観察して (つまり、出力ライトフィールドの測定)、光学システム自体の性能を理解し、この情報を使用してその設定 (パラメーター) を徐々に調整することを意味します。
次の図は、光学システムにおける FFM の動作メカニズムを示しています:
ここで、a は従来の設計手法の制限、b は光学システムの構成、c は光学システムのニューラル ネットワークへのマッピングです。 。
展開すると、自由空間レンズ光学系と集積フォトニクスを含む一般的な光学系 (b) は、変調領域 (濃い緑色) と伝播領域 (薄緑色) で構成されます。これらの領域では、変調領域の屈折率は調整可能ですが、伝播領域の屈折率は固定されています。
そして、ここでの変調領域と伝播領域は、ニューラル ネットワークの重みとニューロン接続にマッピングできます。
ニューラル ネットワークでは、これらの調整可能な部分はニューロン間の接続ポイントのようなもので、学習する強度 (重み) を変更できます。
空間対称相反性の原理を使用すると、データと誤差の計算で同じ順方向物理伝播プロセスと測定方法を共有できます。
それは鏡の反射に似ており、システムのすべての部分が同じように光の伝播とエラーフィードバックに反応します。これは、システムにどのような光が入っても、システムは一貫した方法で光を処理し、結果に基づいて自らを調整することを意味します。
このようにして、勾配を現場で直接計算し、設計領域内の屈折率を更新するために使用できるため、システムのパフォーマンスが最適化されます。
オンサイト勾配降下法により、光学システムは最適な状態に達するまでパラメータを徐々に調整できます。
原文では、上記の完全順モード勾配降下法(バックプロパゲーションに代わる)を最終的に次のように表現する方程式を使用しています。
光ニューラルネットワーク学習法
光ニューラルネットワーク学習法としては、FFM
理想モデルに匹敵する精度
FFM を使用すると、自由空間光ニューラル ネットワーク (ONN) で効果的な自己学習プロセスを実現できます。
この結論を説明するために、研究者らはまず単層 ONN を使用して、ベンチマーク データ セット (a) でオブジェクト分類トレーニングを実行しました。
具体的には、手書きの数字の写真 (MNIST データセット) を使用してこのシステムをトレーニングし、結果を視覚化しました (b)。
結果は、FFM 学習によって訓練された ONN が実験的な光場と理論的な光場の間で非常に高い類似性を持っていることを示しています (SSIM は 0.97 を超えています)。
言い換えれば、それは非常によく学習するので、与えられた例をほぼ完璧にコピーすることができます。
ただし、研究者らは次のことも注意しています:
システムの不完全性により、理論的に計算されたライト フィールドと勾配は実際の物理現象を完全に正確に反映することはできません。
次に、研究者らはより複雑な画像 (Fashion-MNIST データセット) を使用して、さまざまなファッション アイテムを認識するようにシステムをトレーニングしました。
最初、層の数が 2 から 8 に増加したとき、コンピューターで訓練されたネットワークの平均精度は理論上の精度のほぼ半分でした。
FFM学習手法により、システムのネットワーク精度は理論値に近い92.5%まで向上しました。
これは、ネットワーク層の数が増加するにつれて、従来の方法で学習されたネットワークのパフォーマンスが低下する一方で、FFM 学習は高い精度を維持できることを示しています。
同時に、FFM 学習に非線形活性化を組み込むことで、ONN のパフォーマンスをさらに向上させることができます。実験では、非線形 FFM 学習により分類精度を 90.4% から 93.0% に向上させることができました。
研究により、非線形 ONN のバッチ トレーニングによってエラー伝播プロセスが簡素化され、トレーニング時間は 1 ~ 1.7 倍しか増加しないことがさらに証明されました。
高解像度の集束機能
FFM は、実用的なアプリケーションでも高品質のイメージングを実現でき、複雑な散乱環境でも物理限界に近い解像度を実現します。
まず第一に、光波が散乱媒体(霧、煙、生物組織など)に入ると、集束は複雑になりますが、媒体内での光波の伝播は特定の対称性を維持することがよくあります。
FFM は、光波の伝播経路と位相を最適化することでこの対称性を利用し、集束に対する散乱効果の悪影響を軽減します。
この効果も非常に重要です。図 b は、FFM と PSO (粒子群最適化) の 2 つの最適化手法の比較を示しています。
具体的には、実験では 2 つの散乱媒体を使用しました。1 つはランダム位相板 (Scatterer-I)、もう 1 つは透明テープ (Scatterer-II) です。
どちらのメディアでも、FFM はわずか 25 回の設計反復後に収束 (最適解をより速く見つける) を達成し、収束損失値はそれぞれ 1.84 と 2.07 でした (低いほどパフォーマンスが向上します)。
PSO 手法では、収束に達するまでに少なくとも 400 回の設計反復が必要で、最終収束時の損失値は 2.01 と 2.15 です。
同時に、図 c は、FFM が継続的に最適化することができ、焦点が徐々に進化し、初期のランダムな分布から厳密な焦点に収束するように設計されていることを示しています。
研究者らは、3.2 mm × 3.2 mm の設計領域内で、FFM および PSO に最適化された焦点をさらに均一にサンプリングし、FWHM (半値全幅) と PSNR (ピーク信号対雑音比) を比較しました。
結果は、FFM がより高い焦点精度とより良い画像品質を備えていることを示しています。
図 e は、散乱媒体の背後にある解像度マップをスキャンする際の、設計されたフォーカス アレイのパフォーマンスをさらに評価します。
その結果は驚くべきもので、FFM 設計の焦点サイズは、光学イメージングの理論上の最高解像度標準である 64.5 μm の回折限界に近づきました。
視線外の物体を並行して画像化可能
散乱媒体に非常に強力であるため、研究者らは物体が視界から隠れる非視線(NLOS)シナリオも試しました。
FFM は、隠れた物体から観察者までの光路の空間対称性を利用し、システムがフィールド内の動的な隠れた物体を全光学的な方法で再構築および分析できるようにします。
入力波面を設計することにより、FFM はオブジェクト内のすべてのメッシュをターゲット位置に同時に投影することができ、隠れたオブジェクトの並行回復を実現します。
実験では文字型の隠れたクロムターゲット「T」、「H」、「U」が使用され、これらの動的イメージングを迅速に実現するために露光時間(1ミリ秒)と光パワー(0.20 mW)が設定されました。ターゲット。
結果は、FFM 設計の波面がないと、画像がひどく歪むことを示しています。 FFM で設計された波面は 3 つの文字すべての形状を復元できましたが、SSIM (構造類似性指数) は 1.0 に達し、元の画像との類似性が高いことを示しました。
さらに、フォトン効率と分類パフォーマンスの点で人工ニューラル ネットワーク (ANN) と比較すると、FFM は、特に低フォトン条件下で ANN よりも大幅に優れています。
具体的には、フォトンの数が制限されている状況 (反射面や拡散度の高い面など) では、FFM は波面の歪みを適応的に補正し、正確な分類に必要なフォトンの数を減らすことができます。
非エルミート系における外れ値の自動検索
FFM 手法は、自由空間光学系に適用できるだけでなく、統合フォトニック システムの自己設計にも拡張できます。
研究者らは、直列および並列に構成された対称フォトニックコアを使用して統合ニューラルネットワーク(a)を構築しました。
実験では、異なる重みをシミュレートするために異なる減衰係数を実現するために、異なるレベルの注入電流を介して可変光減衰器 (VOA) を使用して対称コアを構成しました。
Sur la figure c, la fidélité des valeurs matricielles programmées dans le noyau symétrique est très élevée, avec des écarts types de dérive temporelle de 0,012 %, 0,012 % et 0,010 % respectivement, indiquant que les valeurs matricielles sont très stables.
Et les chercheurs ont visualisé l’erreur pour chaque couche. En comparant le gradient expérimental avec la valeur théorique de simulation, l'écart moyen est de 3,5 %.
Après environ 100 itérations (époques), le réseau atteint la convergence.
Les résultats expérimentaux montrent que sous trois configurations de rapport de symétrie différentes (1,0, 0,75 ou 0,5), la précision de classification du réseau est respectivement de 94,7 %, 89,2 % et 89,0 %.
La précision de classification obtenue en utilisant le réseau neuronal selon la méthode FFM est de 94,2%, 89,2% et 88,7%.
En revanche, si des méthodes traditionnelles de simulation informatique sont utilisées pour concevoir le réseau, la précision de la classification de l'expérience sera inférieure, respectivement 71,7 %, 65,8 % et 55,0 %.
Enfin, les chercheurs ont également démontré que FFM peut auto-concevoir des systèmes non hermitiens et réaliser la traversée de points singuliers sans avoir besoin de modèles physiques grâce à la simulation numérique.
Le système non hermitien est un concept de physique qui implique des systèmes dans des domaines tels que la mécanique quantique et l'optique, qui ne satisfont pas aux conditions hermitiennes.
Les propriétés hermitiennes sont liées à la symétrie du système et au nombre réel d'énergie. Les systèmes non hermitiens ne remplissent pas ces conditions. Ils peuvent avoir certains phénomènes physiques particuliers, comme les points exceptionnels (Exceptional Points), qui sont la dynamique. du système. Où le comportement d’apprentissage subit d’étranges changements à certains moments.
Pour résumer l'article complet, FFM est une méthode permettant de mettre en œuvre des processus de formation intensifs en calcul sur des systèmes physiques, capable d'exécuter efficacement la plupart des opérations d'apprentissage automatique en parallèle.
Pour des paramètres expérimentaux plus détaillés et le processus de préparation des ensembles de données, veuillez vous référer à l'article original.
Code :
https://zenodo.org/records/10820584
Texte original de "Nature" :
https://www.nature.com/articles/s41586-024-07687-4
以上が清華光学のAIがNatureに登場!物理ニューラル ネットワーク、バックプロパゲーションは不要になりましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。