Microsoft a récemment annoncé l'ajout de la technologie WebGPU à son ONNX Runtime Web, qui contribuera à améliorer les performances d'exécution de modèles d'apprentissage automatique complexes dans les navigateurs Web. Actuellement, les navigateurs Chrome et Edge ont commencé à prendre en charge cette technologie, même si elle n’en est qu’à ses débuts.
ONNX Runtime Web est une bibliothèque Javascript lancée par Microsoft pour aider les développeurs Web à déployer des modèles d'apprentissage automatique directement dans les navigateurs Web et à fournir une prise en charge de plusieurs backends basée sur l'accélération matérielle. WebGPU est une interface de programmation d'applications (API) réseau émergente qui peut fournir une accélération matérielle pour les modèles d'apprentissage automatique, permettant ainsi un fonctionnement plus efficace dans les navigateurs Web. Auparavant, en raison de la puissance de calcul limitée des navigateurs Web, l'efficacité des modèles d'apprentissage automatique complexes, en particulier les grands modèles génératifs, était limitée dans les navigateurs Web. Cependant, avec l’introduction de la technologie WebGPU, ce problème devrait être résolu. WebGPU libère la puissance des GPU des appareils afin que ces modèles complexes d'apprentissage automatique puissent s'exécuter efficacement dans les navigateurs Web, améliorant ainsi considérablement les performances.
Selon l'éditeur, Microsoft a déclaré que WebGPU peut gérer des charges de travail complexes d'apprentissage automatique de manière plus efficace à l'aide de fonctionnalités avancées telles que les shaders de calcul. De plus, la prise en charge de la demi-précision (FP16) par WebGPU réduit également l'utilisation de la mémoire GPU et les besoins en bande passante, accélérant ainsi davantage le calcul. Grâce à ces optimisations, WebGPU devrait déduire des applications d'apprentissage automatique plus efficaces et évolutives directement dans le navigateur Web.
Actuellement Chrome 113 et Edge 113 pour Mac, Windows, ChromeOS et Chrome pour Android La prise en charge de 121 WebGPU est incluse par défaut. Cela signifie que les développeurs peuvent essayer le runtime ONNX Web appelle les ressources d'accélération WebGPU pour améliorer les performances d'exécution de son modèle d'apprentissage automatique dans les navigateurs Web. À mesure que cette technologie continue de se développer et de s’améliorer, nous devrions voir à l’avenir des applications d’apprentissage automatique plus efficaces et plus pratiques mises en œuvre dans les navigateurs Web.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!