NVIDIA présente les microservices NIM pour l'IA générative au Japon et à Taiwan
Alvin Lang 27 août 2024 02:52 NVIDIA lance des microservices NIM pour prendre en charge l'IA générative au Japon et à Taiwan, en améliorant les modèles linguistiques régionaux et les applications d'IA locales.
NVIDIA a introduit ses microservices NIM pour les applications d'IA générative au Japon et à Taiwan, dans le but de renforcer les modèles linguistiques régionaux et de soutenir le développement d'applications d'IA générative.
Annoncés samedi dans un article de blog NVIDIA, les nouveaux microservices sont conçus pour aider les développeurs à créer et à déployer des applications d'IA génératives sensibles aux langues locales et aux nuances culturelles. Les microservices prennent en charge des modèles communautaires populaires, améliorant les interactions des utilisateurs grâce à une meilleure compréhension et des réponses basées sur les langues régionales et le patrimoine culturel.
Selon ABI Research, les revenus des logiciels d'IA générative dans la région Asie-Pacifique devraient atteindre 48 milliards de dollars d'ici 2030, contre 5 milliards de dollars en 2024. Les nouveaux microservices de NVIDIA devraient jouer un rôle important dans cette croissance en fournissant des outils avancés pour Développement de l'IA.
Parmi les nouvelles offres figurent les modèles Llama-3-Swallow-70B et Llama-3-Taiwan-70B, formés respectivement sur les données japonaises et mandarines. Ces modèles sont conçus pour fournir une compréhension plus approfondie des lois, réglementations et coutumes locales.
La famille de modèles RakutenAI 7B, construite sur Mistral-7B, a été formée sur des ensembles de données anglais et japonais et est disponible sous forme de microservices NIM pour les fonctionnalités Chat et Instruct. Ces modèles ont obtenu les meilleurs scores moyens parmi les grands modèles de langage japonais ouverts dans le benchmark LM Evaluation Harness de janvier à mars 2024.
Plusieurs organisations au Japon et à Taiwan utilisent déjà les microservices NIM de NVIDIA pour développer et déployer des applications d'IA générative.
Par exemple, l'Institut de technologie de Tokyo a affiné le modèle Llama-3-Swallow 70B à l'aide de données en langue japonaise. Preferred Networks, une société japonaise d'IA, utilise ce modèle pour développer une IA spécifique aux soins de santé, formée sur des données médicales japonaises, obtenant les meilleurs scores à l'examen national japonais pour les médecins.
À Taïwan, l'hôpital Chang Gung Memorial construit un service d'inférence d'IA personnalisé pour héberger de manière centralisée les applications LLM au sein du système hospitalier, en utilisant le modèle Llama-3-Taiwan 70B pour améliorer la communication médicale. Pegatron, un fabricant d'électronique basé à Taiwan, adopte ce modèle pour les applications internes et externes, en l'intégrant à son système d'IA agentique PEGAAi pour améliorer l'efficacité de la fabrication et des opérations.
Les développeurs peuvent désormais déployer ces modèles d'IA souverains, conditionnés sous forme de microservices NIM, en production à grande échelle tout en améliorant les performances. Les microservices, disponibles avec NVIDIA AI Enterprise, sont optimisés pour l'inférence avec la bibliothèque open source NVIDIA TensorRT-LLM, offrant un débit jusqu'à 5 fois supérieur et réduisant le coût total d'exécution des modèles en production.
Les nouveaux microservices NIM sont disponibles aujourd'hui sous forme d'interfaces de programmation d'applications (API) hébergées.
Pour en savoir plus sur la façon dont NVIDIA NIM peut accélérer les résultats de l'IA générative, visitez la page produit ici.
Les modèles d'IA générative, tels que les LLM, ont gagné en popularité en raison de leur capacité à effectuer diverses tâches, notamment la génération de texte, de code, d'images et de vidéos. Cependant, le déploiement de ces modèles peut s'avérer difficile, en particulier pour les organisations qui exigent des résultats rapides et précis.
Pour répondre à ce besoin, NVIDIA propose une gamme de solutions, notamment la plate-forme logicielle NVIDIA AI Enterprise et NVIDIA AI Registry, qui assurent la sécurité, l'optimisation des performances et la gestion centralisée des modèles d'IA génératifs.
Grâce à ces solutions, les organisations peuvent déployer des modèles rapidement et efficacement, garantissant des performances et une fiabilité optimales pour leurs applications.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Stock Market GPT
Recherche d'investissement basée sur l'IA pour des décisions plus intelligentes

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

OneXGPU 2 est le premier eGPU à intégrer la Radeon RX 7800M, un GPU que même AMD n'a pas encore annoncé. Comme l'a révélé One-Netbook, le fabricant de la solution de carte graphique externe, le nouveau GPU AMD est basé sur l'architecture RDNA 3 et dispose du Navi

L’une des fonctionnalités les plus remarquables de Cyberpunk 2077 est le traçage de chemin, mais il peut nuire lourdement aux performances. Même les systèmes dotés de cartes graphiques raisonnablement performantes, tels que le RTX 4080 (Gigabyte AERO OC curr. 949,99 $ sur Amazon), ont du mal à offrir une interface stable.

Nvidia a introduit pour la première fois la technologie de taux de rafraîchissement variable (VRR) G-Sync en 2013 pour éliminer les déchirures d'écran, les saccades et le décalage d'entrée dans les jeux. Cela fonctionnait essentiellement en synchronisant les images par seconde de sortie du GPU avec le taux de rafraîchissement du moniteur. Exigences b

Les substrats en verre sont reconnus comme une technologie clé alors que les géants des semi-conducteurs comme TSMC, Intel et Samsung s'efforcent de maintenir la loi de Moore (doubler le nombre de transistors sur une puce tous les deux ans environ). Offre de substrats en verre

Nvidia a présenté le Shield TV Pro en 2019, et il n'a pas encore vu de successeur. Il présente un matériel identique à celui de la Nintendo Switch, qui est également sur le marché depuis longtemps sans successeur. Maintenant, même si cet Android TV

Le PDG de Ripple, Brad Garlinghouse, a exprimé son optimisme quant à l'avenir des pièces stables au Japon, en particulier pour les pièces stables adossées au yen.

CachyOS, une distribution Linux conviviale et riche en fonctionnalités basée sur Arch Linux, a reçu une nouvelle mise à jour pour août, apportant un certain nombre d'optimisations et de nouvelles fonctionnalités. Plus particulièrement, la version portable de CachyOS est désormais officiellement prise en charge sur Internet.

L'introduction du jeton natif de Bitget Wallet, BWB, au cours du trimestre précédent a renforcé sa présence au Japon. L’initiative de largage de jetons BWB a contribué à cette croissance.