Maison web3.0 NVIDIA présente les microservices NIM pour l'IA générative au Japon et à Taiwan

NVIDIA présente les microservices NIM pour l'IA générative au Japon et à Taiwan

Aug 27, 2024 pm 03:47 PM
nvidia Japan Taiwan NIM Microservices Generative AI

Alvin Lang 27 août 2024 02:52 NVIDIA lance des microservices NIM pour prendre en charge l'IA générative au Japon et à Taiwan, en améliorant les modèles linguistiques régionaux et les applications d'IA locales.

NVIDIA présente les microservices NIM pour l'IA générative au Japon et à Taiwan

NVIDIA a introduit ses microservices NIM pour les applications d'IA générative au Japon et à Taiwan, dans le but de renforcer les modèles linguistiques régionaux et de soutenir le développement d'applications d'IA générative.

Annoncés samedi dans un article de blog NVIDIA, les nouveaux microservices sont conçus pour aider les développeurs à créer et à déployer des applications d'IA génératives sensibles aux langues locales et aux nuances culturelles. Les microservices prennent en charge des modèles communautaires populaires, améliorant les interactions des utilisateurs grâce à une meilleure compréhension et des réponses basées sur les langues régionales et le patrimoine culturel.

Selon ABI Research, les revenus des logiciels d'IA générative dans la région Asie-Pacifique devraient atteindre 48 milliards de dollars d'ici 2030, contre 5 milliards de dollars en 2024. Les nouveaux microservices de NVIDIA devraient jouer un rôle important dans cette croissance en fournissant des outils avancés pour Développement de l'IA.

Parmi les nouvelles offres figurent les modèles Llama-3-Swallow-70B et Llama-3-Taiwan-70B, formés respectivement sur les données japonaises et mandarines. Ces modèles sont conçus pour fournir une compréhension plus approfondie des lois, réglementations et coutumes locales.

La famille de modèles RakutenAI 7B, construite sur Mistral-7B, a été formée sur des ensembles de données anglais et japonais et est disponible sous forme de microservices NIM pour les fonctionnalités Chat et Instruct. Ces modèles ont obtenu les meilleurs scores moyens parmi les grands modèles de langage japonais ouverts dans le benchmark LM Evaluation Harness de janvier à mars 2024.

Plusieurs organisations au Japon et à Taiwan utilisent déjà les microservices NIM de NVIDIA pour développer et déployer des applications d'IA générative.

Par exemple, l'Institut de technologie de Tokyo a affiné le modèle Llama-3-Swallow 70B à l'aide de données en langue japonaise. Preferred Networks, une société japonaise d'IA, utilise ce modèle pour développer une IA spécifique aux soins de santé, formée sur des données médicales japonaises, obtenant les meilleurs scores à l'examen national japonais pour les médecins.

À Taïwan, l'hôpital Chang Gung Memorial construit un service d'inférence d'IA personnalisé pour héberger de manière centralisée les applications LLM au sein du système hospitalier, en utilisant le modèle Llama-3-Taiwan 70B pour améliorer la communication médicale. Pegatron, un fabricant d'électronique basé à Taiwan, adopte ce modèle pour les applications internes et externes, en l'intégrant à son système d'IA agentique PEGAAi pour améliorer l'efficacité de la fabrication et des opérations.

Les développeurs peuvent désormais déployer ces modèles d'IA souverains, conditionnés sous forme de microservices NIM, en production à grande échelle tout en améliorant les performances. Les microservices, disponibles avec NVIDIA AI Enterprise, sont optimisés pour l'inférence avec la bibliothèque open source NVIDIA TensorRT-LLM, offrant un débit jusqu'à 5 fois supérieur et réduisant le coût total d'exécution des modèles en production.

Les nouveaux microservices NIM sont disponibles aujourd'hui sous forme d'interfaces de programmation d'applications (API) hébergées.

Pour en savoir plus sur la façon dont NVIDIA NIM peut accélérer les résultats de l'IA générative, visitez la page produit ici.

Les modèles d'IA générative, tels que les LLM, ont gagné en popularité en raison de leur capacité à effectuer diverses tâches, notamment la génération de texte, de code, d'images et de vidéos. Cependant, le déploiement de ces modèles peut s'avérer difficile, en particulier pour les organisations qui exigent des résultats rapides et précis.

Pour répondre à ce besoin, NVIDIA propose une gamme de solutions, notamment la plate-forme logicielle NVIDIA AI Enterprise et NVIDIA AI Registry, qui assurent la sécurité, l'optimisation des performances et la gestion centralisée des modèles d'IA génératifs.

Grâce à ces solutions, les organisations peuvent déployer des modèles rapidement et efficacement, garantissant des performances et une fiabilité optimales pour leurs applications.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Stock Market GPT

Stock Market GPT

Recherche d'investissement basée sur l'IA pour des décisions plus intelligentes

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

L'AMD Radeon RX 7800M dans OneXGPU 2 surpasse le GPU pour ordinateur portable Nvidia RTX 4070 L'AMD Radeon RX 7800M dans OneXGPU 2 surpasse le GPU pour ordinateur portable Nvidia RTX 4070 Sep 09, 2024 am 06:35 AM

OneXGPU 2 est le premier eGPU à intégrer la Radeon RX 7800M, un GPU que même AMD n'a pas encore annoncé. Comme l'a révélé One-Netbook, le fabricant de la solution de carte graphique externe, le nouveau GPU AMD est basé sur l'architecture RDNA 3 et dispose du Navi

Cyberpunk 2077 voit ses performances augmenter jusqu'à 40 % grâce au nouveau mod de traçage de chemin optimisé Cyberpunk 2077 voit ses performances augmenter jusqu'à 40 % grâce au nouveau mod de traçage de chemin optimisé Aug 10, 2024 pm 09:45 PM

L’une des fonctionnalités les plus remarquables de Cyberpunk 2077 est le traçage de chemin, mais il peut nuire lourdement aux performances. Même les systèmes dotés de cartes graphiques raisonnablement performantes, tels que le RTX 4080 (Gigabyte AERO OC curr. 949,99 $ sur Amazon), ont du mal à offrir une interface stable.

Gamescom 2024 | Nvidia G-Sync est prêt à devenir moins cher et plus répandu grâce à la collaboration MediaTek Gamescom 2024 | Nvidia G-Sync est prêt à devenir moins cher et plus répandu grâce à la collaboration MediaTek Aug 21, 2024 am 06:46 AM

Nvidia a introduit pour la première fois la technologie de taux de rafraîchissement variable (VRR) G-Sync en 2013 pour éliminer les déchirures d'écran, les saccades et le décalage d'entrée dans les jeux. Cela fonctionnait essentiellement en synchronisant les images par seconde de sortie du GPU avec le taux de rafraîchissement du moniteur. Exigences b

TSMC annonce la relance de la R&D sur les substrats de verre, remettant en question l'avance d'Intel en matière de technologie d'emballage avancée TSMC annonce la relance de la R&D sur les substrats de verre, remettant en question l'avance d'Intel en matière de technologie d'emballage avancée Aug 30, 2024 pm 10:08 PM

Les substrats en verre sont reconnus comme une technologie clé alors que les géants des semi-conducteurs comme TSMC, Intel et Samsung s'efforcent de maintenir la loi de Moore (doubler le nombre de transistors sur une puce tous les deux ans environ). Offre de substrats en verre

Offre | Nvidia Shield TV Pro avec un matériel identique à celui de la Nintendo Switch tombe à un prix record Offre | Nvidia Shield TV Pro avec un matériel identique à celui de la Nintendo Switch tombe à un prix record Aug 11, 2024 am 06:43 AM

Nvidia a présenté le Shield TV Pro en 2019, et il n'a pas encore vu de successeur. Il présente un matériel identique à celui de la Nintendo Switch, qui est également sur le marché depuis longtemps sans successeur. Maintenant, même si cet Android TV

Brad Garlinghouse, PDG de Ripple, souligne l'environnement réglementaire favorable du Japon pour le développement de Stablecoin Brad Garlinghouse, PDG de Ripple, souligne l'environnement réglementaire favorable du Japon pour le développement de Stablecoin Sep 09, 2024 am 06:00 AM

Le PDG de Ripple, Brad Garlinghouse, a exprimé son optimisme quant à l'avenir des pièces stables au Japon, en particulier pour les pièces stables adossées au yen.

CachyOS bénéficie du support ROG Ally X et de l'environnement de bureau Cosmic CachyOS bénéficie du support ROG Ally X et de l'environnement de bureau Cosmic Aug 21, 2024 pm 09:51 PM

CachyOS, une distribution Linux conviviale et riche en fonctionnalités basée sur Arch Linux, a reçu une nouvelle mise à jour pour août, apportant un certain nombre d'optimisations et de nouvelles fonctionnalités. Plus particulièrement, la version portable de CachyOS est désormais officiellement prise en charge sur Internet.

Bitget Wallet connaît une augmentation significative de 34 % du nombre de nouveaux utilisateurs au Japon, renforçant ainsi sa position de deuxième plus grand portefeuille Web3 au monde, derrière MetaMask Bitget Wallet connaît une augmentation significative de 34 % du nombre de nouveaux utilisateurs au Japon, renforçant ainsi sa position de deuxième plus grand portefeuille Web3 au monde, derrière MetaMask Jul 30, 2024 am 12:54 AM

L'introduction du jeton natif de Bitget Wallet, BWB, au cours du trimestre précédent a renforcé sa présence au Japon. L’initiative de largage de jetons BWB a contribué à cette croissance.