La technologie Amazon Cloud utilise pleinement la technologie dIA générative pour améliorer encore la plateforme de cloud computing

L'intelligence artificielle générative est devenue un champ de bataille pour les fournisseurs de services cloud, et Amazon Cloud Services, leader sur le marché mondial du cloud computing, promeut également largement l'intelligence artificielle générative

Lors de la conférence mondiale re:Invent 2023, Amazon Cloud Technology a annoncé une série de nouveaux services et fonctionnalités, notamment le lancement de l'infrastructure sous-jacente, de l'intelligence artificielle générative (IA) et de la stratégie de données. Ces nouveaux services et fonctionnalités incluent Amazon Q, un nouvel assistant d'IA génératif conçu pour remodeler l'avenir du travail ; Amazon Bedrock, offrant plus de choix de modèles et de nouvelles fonctionnalités puissantes et Amazon SageMaker avec cinq nouvelles fonctionnalités, aidant au développement d'applications à grande échelle ; modèles. Le lancement de ces services et fonctions aide les entreprises à créer et à appliquer l'IA générative plus facilement et en toute sécurité

Chen Xiaojian, directeur général du département produits Amazon Cloud Technology pour la Grande Chine a déclaré : « Amazon Cloud Technology lance chaque année de nombreux nouveaux services, nouvelles fonctions et nouvelles applications lors de la conférence mondiale re:Invent, couvrant l'infrastructure, l'informatique, le stockage, les données. Nous continuons de remodeler le cloud computing dans d'autres domaines et lançons de nouveaux services et fonctions majeurs autour de la technologie la plus transformatrice d'aujourd'hui, l'IA générative. Nous espérons que grâce à ces innovations technologiques, nous pourrons aider davantage d'entreprises à accélérer l'innovation et à utiliser l'IA générative pour remodeler complètement l'avenir. .»

L'Amazon Cloud Technology 2023 re:Invent China City Tour commence officiellement aujourd'hui et se tiendra dans 10 villes, dont Pékin, Shanghai, Guangzhou, Shenzhen, Chengdu, Qingdao, Nanjing, Xi'an, Hangzhou et Changsha. Cette tournée vise à fournir aux constructeurs chinois une présentation complète des derniers services et technologies, des tendances de pointe et des meilleures pratiques lors de la conférence mondiale re:Invent 2023

1. Développer pleinement l'IA générative

Amazon Cloud Technology fournit une architecture à trois couches pour l'IA générative, comprenant des applications créées à l'aide de modèles de base, des outils créés à l'aide de modèles de base et une infrastructure pour la formation et l'inférence de modèles de base.

Au niveau inférieur, Amazon Cloud Technology fournit une infrastructure pour la formation de base des modèles et l'inférence via des puces auto-développées.

Le processeur Amazon Trainium2 est une puce dédiée à la formation en IA générative et en apprentissage automatique. Il est optimisé pour la formation de modèles de base avec des centaines de milliards, voire des milliards de paramètres. Par rapport à Amazon Trainium, il présente une amélioration des performances 4x et 65 exaflops à la demande. .Super performances informatiques ; le service Amazon SageMaker HyperPod peut accélérer la formation de base du modèle à grande échelle, peut réduire le temps de formation jusqu'à 40 % et garantir que le processus de formation dure des semaines ou des mois sans interruption.

Amazon Cloud Technology et NVIDIA ont annoncé conjointement plusieurs dernières coopérations, qui doivent être réécrites

Amazon Cloud Technology fournira le premier superordinateur d'IA cloud équipé de la super puce NVIDIA Grace Hopper et de la technologie Amazon Cloud Technology UltraClusters ; le premier cloud NVIDIA DGX utilisant la dernière puce GH200 NVL32 de NVIDIA sera bientôt lancé sur Amazon Cloud Technology ; Notre projet de coopération « Projet Ceiba » utilise le supercalculateur d'IA piloté par GPU le plus rapide au monde et le supercalculateur cloud NVIDIA DGX pour la formation, la recherche et le développement de NVIDIA en matière d'IA, ainsi que le développement de modèles personnalisés. Il disposera de 16 000 des dernières superpuces GH200 pour fournir une puissance de calcul étonnante. jusqu'à 65 ExaFLOPS.

Amazon Cloud Technology fournit des outils de niveau intermédiaire qui peuvent être créés à l'aide de modèles de base

Amazon Bedrock est le moyen le plus simple de créer et de faire évoluer des applications d'IA générative avec de grands modèles. Amazon Bedrock prend en charge Anthropic Claude 2.1 et Meta LLama 2 70B, ainsi que le modèle Amazon Titan exclusif à Amazon.

Contenu réécrit : la clé pour créer une réelle valeur à partir des applications d’intelligence artificielle générative est la capacité de les personnaliser en fonction des propres données de l’entreprise. Ce n’est que grâce à la personnalisation des données que l’avantage concurrentiel différencié d’une entreprise peut être établi. Amazon Cornerstone a trois fonctions principales : pré-formation continue, réglage fin et amélioration de la récupération de la base de connaissances, et fournit une fonction de prévisualisation

Avec des modèles et des capacités de personnalisation, il doit également être intégré aux applications pour servir l'entreprise. En tant que tel, Amazon Bedrock fournit des fonctionnalités d'agent qui permettent aux applications d'IA générative d'effectuer des tâches en plusieurs étapes sur les systèmes et les sources de données de l'entreprise.

Guardrails for Amazon Bedrock Preview, protégeant les applications d'IA générative avec des politiques d'IA responsables. Dans le même temps, Amazon Bedrock garantit la sécurité et la confidentialité des données : aucune donnée client ne sera utilisée pour entraîner le modèle sous-jacent ; toutes les données sont cryptées pendant la transmission et les données au repos utilisées pour les modèles personnalisés restent dans votre VPC ; comme RGPD et HIPAA.

Au niveau de la couche d'application supérieure, Amazon Cloud Technology fournit des applications créées à l'aide du modèle de base - la version préliminaire d'Amazon Q.

Amazon Q est un nouvel assistant génératif alimenté par l'IA qui peut être personnalisé en fonction de l'activité du client et spécialement conçu pour répondre aux besoins des scénarios de bureau. Les clients peuvent obtenir rapidement des réponses pertinentes à des questions complexes, générer du contenu et prendre des mesures, le tout sur la base des informations issues de leurs propres référentiels d'informations, de leur code et de leurs systèmes d'entreprise. De plus, le contenu des clients n’est jamais utilisé pour entraîner les modèles sous-jacents d’Amazon Q. Amazon Q peut être construit sur la technologie Amazon Cloud, ou il peut utiliser des données et des systèmes sur site, en utilisant les applications de la technologie Amazon Cloud pour la business intelligence (BI), le centre de contact et la gestion de la chaîne d'approvisionnement. Amazon Q est déjà disponible en avant-première pour les clients, Amazon Q dans Amazon Connect est officiellement disponible et Amazon Q dans Amazon Supply Chain sera bientôt disponible.

Le succès de l’IA générative est indissociable d’un solide support des données. Lors de la conférence mondiale re:Invent 2023, Amazon Cloud Technology a lancé un certain nombre de services et de fonctionnalités couvrant l'infrastructure, l'intégration et la gouvernance des données

Tout d'abord, pour enrichir davantage la sélection de bases de données vectorielles, Amazon Cloud Technology a lancé le moteur vectoriel Amazon OpenSearch Serverless, les nouvelles fonctions de recherche vectorielle d'Amazon DocumentDB et Amazon DynamoDB, ainsi que la version préliminaire d'Amazon Memory DB pour Redis. recherche de vecteurs pour améliorer la réactivité des applications d’IA générative et les performances de latence.

Lancement de quatre fonctionnalités d'intégration Zero-ETL pour rendre l'accès et l'analyse des données sur le stockage de données plus rapides et plus pratiques.

En termes de gouvernance des données, Amazon Cloud Technology a lancé une version préliminaire de la fonction de suggestion de description d'IA pour Amazon DataZone, qui peut générer automatiquement des descriptions commerciales plus compréhensibles pour les ensembles de données d'entreprise et fournir des suggestions d'utilisation pour les ensembles de données.

2. Remodeler le cloud computing - puces auto-développées, stockage, sans serveur

Amazon Cloud Technology a lancé les puces Amazon Graviton4 et Amazon Trainium2 auto-développées lors de la conférence mondiale 2023

Par rapport au processeur Graviton3 de génération actuelle, Graviton4 présente une amélioration des performances allant jusqu'à 30 %, plus de 50 % de cœurs indépendants en plus et une augmentation de plus de 75 % de la bande passante mémoire, offrant les meilleures performances pour les charges de travail exécutées sur Amazon Elastic Compute Cloud. (Amazon EC2) et l'efficacité énergétique ; les instances Amazon EC2 R8g basées sur Graviton4 sont actuellement disponibles en version préliminaire. Grâce à la coopération avec Sinnet et NWCD, les instances Amazon EC2 C7g, M7g et R7g basées sur les processeurs Graviton3 sont désormais officiellement disponibles dans la région Amazon Cloud Technology Chine (Pékin) et Chine (Ningxia).

La puce Trainium2 est spécialement conçue pour une formation haute performance, adaptée aux modèles de base et aux grands modèles de langage avec des milliards de paramètres ou de variables. Par rapport à la puce Trainium de première génération, les performances de Trainium2 ont été améliorées jusqu'à 4 fois, la mémoire a été améliorée de 3 fois et l'efficacité énergétique (performance par watt) a été améliorée de 2 fois. Les instances Amazon EC2 Trn2 utilisent les dernières puces Trainium2 et chaque instance individuelle contient 16 puces d'accélération Trainium. Les instances Trainium2 peuvent être étendues jusqu'à 100 000 puces d'accélération Trainium2, intégrées à l'interconnexion réseau de niveau PB d'Amazon Elastic Fabric Adapter (EFA), fournissant jusqu'à 65 exaflops de puissance de calcul. Les clients peuvent obtenir des performances de niveau supercalcul sur demande

Le deuxième nouveau produit lancé par Amazon Cloud Technology est le service de stockage

Amazon Simple Storage Service (Amazon S3) est devenu l'un des services de stockage cloud les plus populaires depuis son lancement il y a 17 ans, avec des millions de clients de tous horizons dans le monde. Lors de cette conférence, Amazon Cloud Technology a annoncé qu'Amazon S3 Express One Zone est officiellement disponible. Par rapport à Amazon S3 Standard, la vitesse d'accès aux données est multipliée par 10 et le coût de la demande de données est réduit de 50 %, offrant ainsi une formation en apprentissage automatique. , l'inférence et l'analyse interactive et les charges de travail gourmandes en requêtes telles que la création de contenu multimédia pour fournir le stockage le plus performant.

Le dernier nouveau produit est sans serveur Serverless.

Amazon Cloud Technology a été le pionnier de la technologie sans serveur il y a 17 ans, offrant aux clients une élasticité ultime et des capacités d'expansion automatique. Lors de la conférence mondiale re:Invent 2023, Amazon Cloud Technology a lancé trois innovations de services sans serveur pour aider les clients à analyser et gérer les données à n'importe quelle échelle et à simplifier considérablement les opérations. Les clients n'ont pas besoin de consacrer du temps et de l'énergie à configurer, gérer et étendre leur base de données. . facilité.

Le contenu réécrit est le suivant : parmi eux, Amazon Aurora Limitless peut automatiquement distribuer et interroger des données sur plusieurs instances sans serveur Amazon, et peut évoluer jusqu'à des millions d'écritures et de gestion au niveau des transactions par seconde. Amazon ElastiCache Serverless peut aider les clients à créer des caches hautement disponibles en une minute et à évoluer verticalement et horizontalement en temps réel pour prendre en charge les applications complexes des clients sans avoir besoin de gérer l'infrastructure. Amazon Redshift Serverless utilise l'intelligence artificielle (IA) pour prédire les charges de travail et faire évoluer et optimiser automatiquement les ressources afin d'aider les clients à atteindre des objectifs rentables

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!