Lors d'un sommet de l'industrie, un scientifique académicien de l'Université Tsinghua a révélé que notre grand modèle d'IA est formé sur le cluster Wanka et qu'une erreur se produit toutes les trois heures. Même si cela semble un peu ridicule, cela a atteint le niveau avancé du monde
Les grands modèles d'IA populaires dans le monde entier sont sans aucun doute le sujet brûlant cette année, et leur nombre continue de croître, atteignant un niveau étonnant. Au milieu des « centaines de rivaux qui se disputent le pouvoir », tout le monde oublie souvent un problème clé : le torrent de données apporté par les grands modèles d’IA est plus turbulent qu’on ne l’imaginait.
« Une erreur se produit une fois toutes les trois heures », ce qui ressemble à un taux d'échec incroyable, est en fait la norme à laquelle sont confrontés les praticiens des grands modèles, même les « meilleurs étudiants ». La pratique courante actuelle dans l’industrie consiste à écrire des points de contrôle tolérants aux pannes. Puisqu'une erreur est signalée dans les trois heures, nous devons nous arrêter toutes les 2,5 heures, écrire des points de contrôle, sauvegarder les données, puis recommencer l'entraînement. Une fois qu'une panne se produit, vous pouvez récupérer à partir des points de contrôle écrits pour éviter de « repartir de zéro » et de tout faire en vain. Le point de contrôle doit stocker beaucoup de données et prendra beaucoup de temps. L'équipe d'académiciens a développé un grand modèle basé sur l'architecture Llama 2. Il faut dix heures pour stocker les données dans le matériel une fois. L'efficacité du stockage affecte directement la progression du développement.
Si les données hétérogènes à grande échelle sont un torrent qui déferle sans raison, le système de stockage est un fleuve transportant le flux de données. Sa largeur et sa solidité déterminent directement si les données seront bloquées ou même stagnantes, bloquant ainsi la bouée de sauvetage des grands modèles d'IA. On peut dire que la productivité et l'efficacité de l'ensemble de l'industrie du grand modèle sont « limitées » par le stockage.
C’est pourquoi le stockage, en tant qu’infrastructure de données IA, fait l’objet de plus en plus d’attention.
Le 29 novembre, le Sommet chinois sur les données et le stockage 2023 « Digital Innovation AI Future » s'est tenu à Pékin. Sugon Storage a publié une solution de stockage pour les grands modèles d'IA.
Profitez de cette opportunité pour découvrir les défis de charge apportés au stockage par la vague des grands modèles d'IA, et comment Sugon Storage ouvre la voie à l'industrie intelligente et stimule le succès des grands modèles d'IA.
Les grands modèles d'IA entrent dans le domaine des eaux profondes de l'industrie et les méthodes de stockage traditionnelles sont confrontées à des défis en matière de données
Je suis récemment allé au Yunnan et j'ai découvert que non seulement la construction de grands modèles bat son plein dans les centres scientifiques et technologiques comme Pékin, Shanghai et Guangzhou, mais aussi dans les villes de deuxième et troisième rang comme Kunming et Dali, et même dans Dans les zones frontalières, de grandes applications industrielles modèles sont activement explorées.
Alors que tous les horizons évoluent vers l’intelligence, presque tous ont suscité un intérêt brûlant pour les grands modèles. À cette époque, un problème clé est également apparu : la tendance à l’industrialisation des grands modèles d’IA nécessite une mise à niveau de l’infrastructure de stockage.
Chaque fois que les développeurs de modèles s'entraînent, les données posent divers défis au système de stockage :
2. Les contraintes de la congestion des données. Le prétraitement des données à très grande échelle est lent et prend du temps. La collecte, la classification, la relocalisation et d'autres processus prennent du temps et sont laborieux. Une fois que les performances de stockage ne peuvent pas suivre, le débit de fichiers volumineux est lent, plus de lecture et moins. l'écriture et l'attente au point de contrôle prennent beaucoup de temps, ce qui retardera la progression du développement et augmentera les coûts de développement.
3. Le courant sous-jacent des données complexes. De plus, les grands modèles d'IA utilisent une grande quantité de données hétérogènes, avec des formats de fichiers complexes, divers types d'ensembles de données et une augmentation du volume de données. Le stockage traditionnel est difficile à relever le défi de la complexité des données et est sujet à des problèmes d'indigestion. , ce qui entraîne une faible efficacité d'accès aux données. En conséquence, l'efficacité de fonctionnement du modèle diminue, la consommation de puissance de calcul de formation augmente et les ressources informatiques coûteuses du GPU ne peuvent pas être entièrement « compressées ». Par exemple, l'observatoire solaire local du Yunnan utilise un modèle informatique scientifique d'IA pour apprendre des images massives afin de présenter la véritable apparence du soleil, générant 2 To de données d'image chaque jour. L'efficacité actuelle du débit de stockage est faible, ce qui entraînera un chargement lent. d'ensembles de formation et de longs cycles de traitement des données. Ralentissent le processus de recherche.
4. Problèmes de sécurité des données. Actuellement, les grands modèles d'IA ont pénétré profondément dans diverses industries. Ils nécessitent une prise en charge massive des données pendant la formation, le développement et la mise en œuvre des applications, y compris des données contenant des informations sensibles de l'industrie ou des personnes. S'il n'y a pas de mécanisme raisonnable de désensibilisation et d'hébergement des données, cela peut causer. fuite de données et causer des pertes aux industries et aux particuliers. Dans le même temps, les risques de sécurité des modèles doivent également être pris au sérieux. Par exemple, des plug-ins peuvent être implantés avec du contenu préjudiciable et devenir un outil permettant aux criminels de commettre des fraudes et des « empoisonnements », mettant ainsi en danger la sécurité sociale et industrielle.
Les modèles d'IA à grande échelle se dirigent vers la zone des eaux profondes de l'industrie. Ce qui est gratifiant, c'est que cette innovation technologique est profondément intégrée dans tous les domaines de la vie pour répondre aux besoins de l'intelligence et est pleine de vitalité. Cependant, l'ingénierie des données joue également un rôle important dans l'ensemble du cycle de vie des grands modèles, notamment la collecte de données, le nettoyage, la formation, le déploiement d'inférences et le réglage des commentaires, qui nécessitent tous de grandes quantités de données. Cependant, le problème du stockage est devenu un goulot d'étranglement, ce qui signifie que les grands modèles d'IA peuvent être confrontés à une congestion des données, à des pannes et à une inefficacité à toutes les étapes, ce qui entraînera un cycle de développement très élevé et un coût global des grands modèles, au-delà des moyens abordables de l'industrie.
Afin d'éviter l'envasement des données et de soutenir et cultiver le développement industriel de modèles à grande échelle, il faut draguer la « rivière » du stockage. Sugon Storage a fourni une nouvelle solution, qui nous a trouvé des cas de référence précieux
"Canal" de données de haute qualité, Sugon Storage apporte une réponse à la grande industrie du modélisme
Après avoir communiqué avec les développeurs de grands modèles d'IA, je suis arrivé à une conclusion claire : la construction d'un nouveau système de stockage qui s'adapte aux grands modèles d'IA ne nécessite plus de discussion. La clé est de savoir qui peut terminer la mise à niveau de la solution en premier et fournir des solutions pratiques.
Comprenant les besoins de stockage de l'industrie, Sugon Storage a créé une solution de stockage grand modèle IA basée sur le stockage dédié grand modèle ParaStor et a rédigé sa propre réponse.
Le cluster de stockage grand modèle Sugon Storage AI possède trois capacités principales : la fusion hétérogène, les performances ultimes et la sécurité native.
Tout d'abord, nous pouvons fournir des centaines de milliards de services de stockage de fichiers, et son échelle d'expansion est presque illimitée. Nous avons également spécifiquement résolu le problème de la diversité des protocoles d'accès aux données et prenons en charge plusieurs protocoles de stockage tels que des fichiers et des objets pour éviter la copie de données entre différents systèmes de stockageDeuxièmement, en réponse à la forte demande d'efficacité du traitement des données dans le processus de développement de grands modèles d'IA, le cluster de stockage de grands modèles Sugon Storage AI peut fournir plusieurs capacités d'optimisation des performances d'E/S de données telles que l'accélération du cache à plusieurs niveaux, l'accélération des données XDS et l'intelligence artificielle. routage à grande vitesse.
Afin de garantir la sécurité des données tout au long du processus, les nœuds de stockage Sugon fournissent des capacités de sécurité au niveau de la puce et prennent en charge l'ensemble d'instructions secrètes nationales. Grâce à une fiabilité à plusieurs niveaux, il peut garantir que le cluster de stockage fonctionne de manière stable tout au long du cycle de formation et de développement, conformément aux politiques et aux futures tendances en matière de sécurité
Certaines personnes peuvent se demander, il existe de nombreuses solutions de stockage sur le marché, et certaines font également de la publicité pour fournir une assistance professionnelle au développement de modèles. Quelles sont les valeurs différenciées des solutions Sugon Storage ?
Si vous ne comprenez pas les termes techniques et les détails des produits de chaque entreprise, vous souhaiterez peut-être utiliser quelques mots pour vous rappeler la valeur différenciée du cluster de stockage grand modèle Sugon Storage AI :
1. Avancé. La fusion hétérogène, les performances ultimes et la sécurité native au niveau de la puce démontrent l'avancée technologique de Sugon Storage et résolvent également spécifiquement les problèmes de gros volume de données, de formes de données complexes et diverses, de faible efficacité de débit et de long temps de stockage et de calcul dans les grands développement de modèles. De vrais problèmes.
2. Fiable. L'infrastructure de données d'IA haute performance est basée sur l'innovation auto-développée par Sugon Storage, qui est plus fiable et plus sécurisée, conformément à la politique d'innovation de l'information et aux futures tendances en matière de sécurité. Elle peut aider les grands fournisseurs de services nationaux à éviter les risques liés à la chaîne d'approvisionnement à l'étranger. , de la sécurité de la chaîne d'approvisionnement, de la sécurité des données et de la sécurité des modèles, ainsi que d'autres aspects protègent le développement de la grande industrie du modèle.
3. Complet. Sugon Storage a créé une solution d'IA complète couvrant le réseau, l'informatique et la plate-forme, prenant en charge un fonctionnement stable tout au long du cycle de formation et de développement, ce qui peut réduire les coûts globaux et permettre aux grands développeurs de modèles et aux clients de l'industrie d'avancer sans soucis.
Pour résumer, sur le « canal » de haute qualité construit par Sugon Storage, les données à grande échelle peuvent être traitées efficacement et le développement de grands modèles d'IA peut être accéléré. Par conséquent, les industries et les entreprises peuvent prendre l'initiative d'intégrer en profondeur de grands modèles. avec des scénarios et des entreprises verticaux. Obtenez votre ticket pour l’ère intelligente.
Le nouveau point de départ du cinquième paradigme, observant la scène de nombreuses entreprises en compétition pour avancer et prospérer
Jim Gray, lauréat du prix Turing, a un jour proposé le quatrième paradigme, dont le cœur est basé sur les données. Avec « l'émergence de l'intelligence » dans les grands modèles de langage, le cinquième paradigme « axé sur l'intelligence » se concentre davantage sur la combinaison organique des données et de l'intelligence, devenant ainsi la nouvelle logique sous-jacente qui soutient la révolution scientifique et la révolution industrielle.
Tout dans le passé est un prologue. Cela est vrai pour l’intelligence artificielle, tout comme le stockage
Lors de cette conférence, Hui Runhai, président de Sugon Storage Company, a reçu le titre de « Pionnier du stockage » pour ses 20 années d'expérience dans l'industrie et ses pratiques de pointe en matière de percées technologiques de stockage par l'IA, de recherche et développement sur le stockage par refroidissement liquide et dans d'autres domaines. Sous sa direction, le stockage de fichiers distribué Sugon continue de dominer le marché depuis de nombreuses années, se classant parmi les premiers en termes de part de marché. Les solutions de stockage de données pour les grands modèles d'IA ont une fois de plus placé Sugon Storage à l'avant-garde du temps.
Le cluster de stockage de grands modèles d'IA de Sugon Storage pratique activement un changement de paradigme pour s'adapter au nouveau paradigme des données et promouvoir le développement vigoureux de l'industrialisation des grands modèles grâce à des percées dans l'infrastructure de données
Ensuite, dans le nouveau paradigme et le nouveau point de départ de l'industrie du stockage, sur la « rivière » de données de haute qualité de Sugon Storage, nous verrons des centaines d'entreprises rivaliser pour de grands modèles industriels, des milliers d'applications d'IA se précipiter et s'accélérer vers une Chine intelligente.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!