Bhargs Srivathsan, partenaire de McKinsey & Company, a déclaré lors d'une récente conférence à Singapour que tant qu'elle est utilisée correctement, la technologie d'IA générative devrait réduire la charge de travail de migration vers le cloud de 30 à 50 %.
Srivathsan estime : « On ne peut dire que les progrès actuels ne font que franchir la première étape. À mesure que le modèle de langage étendu (LLM) mûrit, le calendrier de migration des charges de travail vers le cloud public continuera de se raccourcir, ainsi que l'efficacité du cloud public. Le processus de migration augmentera également et pourra être amélioré en conséquence. complété pour vérifier si la migration est effective.
De plus, vous pouvez également utiliser de grands modèles de langage pour effectuer des travaux plus connexes, tels que la rédaction de documents explicatifs tels que les lignes directrices du comité d'examen architectural.
Le partenaire a déclaré que même si de nombreuses entreprises commencent tout juste à envisager d'adopter la technologie de l'IA, 40 % des entreprises investies par McKinsey mettent déjà à jour leurs investissements informatiques.
Srivathsan estime que la relation entre l'IA générative et le cloud est « symbiotique ».
« Il faut admettre que sans la popularisation du cloud public, il serait impossible de véritablement donner vie à l'IA générative. En conséquence, l'IA générative peut également accélérer efficacement la migration vers le cloud public et aider les utilisateurs à migrer du cloud public d'origine vers débloquer le désengagement. .”
De l'avis de Srivathsan, les quatre principaux cas d'utilisation de l'IA générative sont la génération de contenu, l'engagement client, la création de données synthétiques et l'écriture de code. Bien entendu, écrire du code ici ne consiste pas à terminer le développement d’un logiciel à partir de zéro. La capacité de codage de l’IA générative se reflète principalement dans la reprise de codes existants que personne ne connaît après le départ des employés, ou dans la conversion des codes originaux dans de nouvelles formes linguistiques.
Elle a également souligné que la raison pour laquelle le cloud public est plus fiable que d'essayer de construire un modèle interne est que les utilisateurs d'entreprise ne disposent souvent pas de réserves GPU suffisantes. De plus, le coût des modèles commerciaux prêts à l'emploi sur le marché est également moins cher que celui de l'autoformation.
Srivathsan a souligné que des garde-fous correspondants peuvent également être mis en place pour les utilisateurs qui travaillent dans des secteurs réglementés, qui disposent d'une grande quantité de données exclusives ou qui s'inquiètent d'une violation de la propriété intellectuelle.
À son avis, les grands modèles de langage fonctionneront principalement dans des environnements d'infrastructure à très grande échelle au cours des cinq ou six prochaines années, jusqu'à ce que les modèles arrivent à maturité. Et contrairement à ce que beaucoup de gens imaginent, la mise en œuvre de l’IA générative ne nécessite pas nécessairement des réserves de puissance de calcul aussi exagérées. Après tout, il existe peu de cas d’utilisation qui imposent des exigences aussi strictes en matière de latence.
En d'autres termes, à moins qu'il ne s'agisse de la fonction de pilote automatique fonctionnant sur Tesla, ou du logiciel chargé de diriger le fonctionnement en temps réel de l'atelier de fabrication, il n'est vraiment pas nécessaire d'empiler trop de matériel.
De plus, dans la plupart des cas, il n'est pas nécessaire d'utiliser des modèles personnalisés ou à grande échelle.
Le partenaire de McKinsey a commenté : « De nombreuses entreprises pensent qu'elles doivent acheter une supercar pour livrer des pizzas. Bien sûr, ce n'est pas nécessaire. Les modèles qui répondent vraiment aux besoins sont souvent moins complexes et pas si grands. pas besoin d'utiliser un grand modèle avec 65 milliards de paramètres pour un script de support client. Mais elle a également conseillé que si les développeurs accèdent à des modèles ou à des données non propriétaires auxquels ils ne devraient pas avoir accès, ils doivent le faire à l'intérieur et à l'extérieur. l'organisation. Ajoutez une passerelle API entre eux pour établir un mécanisme « d'alerte en temps réel ».
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!