


La croissance imparable de l'IA générative (Perspectives de l'IA partie 1)
Divulgation: mon entreprise, Tirias Research, a consulté IBM, NVIDIA et d'autres sociétés mentionnées dans cet article.
Moteurs de croissance
L'élévation de l'adoption générative de l'IA était plus dramatique que même les projections les plus optimistes ne pouvaient prédire. Ensuite, un nouveau pic de demande est apparu en septembre 2024 avec le lancement de Chatgpt-O1, le premier modèle de "raisonnement" largement mis en œuvre. Contrairement aux versions précédentes, cela n'a pas simplement fourni des réponses; Cela a fonctionné par des questions, offrant des réponses plus prises en compte, logiques et nuancées. Ce type de raisonnement nécessitait beaucoup plus de "jetons de raisonnement" en coulisses, entraînant une forte augmentation de la génération de jetons. De plus, les niveaux d'engagement des utilisateurs ont grimpé en flèche. À la fin de 2024, le temps passé à générer du contenu en utilisant des modèles génératifs et de raisonnement d'IA avait augmenté de plus de 22 fois par rapport à l'année précédente.
L'innovation s'est également accélérée à un rythme sans précédent. De l'introduction de Transformers en 2017 à Chatgpt-1 en 2022 et des modèles de raisonnement en 2024, la chronologie des percées continue de rétrécir. Les architectures de modèle sophistiquées comme le mélange des experts (MOE) permettent un raisonnement plus efficace tout en gardant une utilisation active des paramètres. Des modèles open source tels que la série Llama de Meta défient les solutions propriétaires en offrant des alternatives plus légères et plus rapides qui peuvent fonctionner localement sur des ordinateurs portables et des smartphones. Pendant ce temps, des optimisations comme l'attention clairsemée et l'informatique conditionnelle produisent des modèles plus efficaces comme Deepseek R1 (lancé en 2025), qui n'utilisait à l'origine que 37 milliards de paramètres actifs par jeton, par rapport aux 405 milliards de llama ou plus de 1 milliard dans certains modèles fermés.
Demande de jeton par les chiffres
Tirias Research prévoit une croissance continue du nombre d'utilisateurs, de la fréquence de visite, du temps passé et du contenu généré par l'IA. De plus, les API agentiques étant disponibles en 2025, les agents de l'IA commenceront à lier de manière autonome les modèles d'IA ensemble, à former des pensées, à exécuter des tâches et à interagir avec d'autres services. L'incitation humaine ne sera plus le seul catalyseur de l'activité de l'IA une fois que les agents autonomes commencent à générer une utilisation indépendamment. Par conséquent, le taux annuel de génération de jetons devrait passer de 677 billions en 2024 à 2 092 billions d'ici la fin de 2025 et atteindre 77 000 billions (77 quadrillions) à la fin de 2030.
Simon Solotko, analyste principal chez Tirias Research, déclare: "L'écosystème de l'IA est soumis à une pression extraordinaire. Les capacités multimodales, la demande des utilisateurs et les flux de travail agentiques et multimédias progressent si rapidement que les améliorations du matériel et des logiciels de calcul ne suffiront pas à contrecarrer l'augmentation de la demande."
Un instantané prévu de 2028 montre que l'utilisation d'assistants et d'agents de l'IA sera probablement dominée par quelques fournisseurs. Du côté des infrastructures, cependant, les modèles d'IA accessibles à l'API devraient alimenter un large éventail d'applications commerciales et de consommation en intégrant les capacités d'IA dans les fournisseurs de services orientés clients.
L'industrie peut se déplacer vers un monopole naturel similaire à la domination de Google dans les recherches sur Internet. Avec son entrée précoce via Chatgpt et une forte reconnaissance de marque, Openai mène actuellement le marché dans les modèles d'IA et la génération de jetons. La question de savoir si Openai maintient son bord reste incertain.
Tendances futures
Les modèles plus grands continueront de augmenter en taille et en complexité, dépassant les progrès matériels. Les modèles les plus importants dépassent déjà la capacité de mémoire de tout accélérateur unique, nécessitant des clusters de GPU et des racks entiers pour traiter les charges de travail. Cependant, les progrès de la distillation et de l'efficacité aideront à évoluer vers des modèles plus petits et spécialisés. L'arrivée de Deepseek a marqué un saut majeur dans l'efficacité du modèle, redéfinissant des références de performance.
Les agents de l'IA deviendront généralisés. Les leaders de l'industrie, dont Jensen Huang de Nvidia et Arvind Krishna d'IBM, envisagent chaque employé travaillant aux côtés de plusieurs agents d'IA. Certains agents résideront dans des machines, d'autres dans des environnements virtuels et d'autres encore dans des robots physiques. Les agents de l'IA commenceront également à collaborer entre eux.
La concurrence dans l'IA s'intensifiera. À mesure que les modèles mûrissent, la différenciation n'est plus seulement la taille ou la vitesse - elle implique maintenant un ensemble plus large de facteurs. Les services incorporent des modèles d'IA dans les flux de travail, les API et les applications interactives, se dirigeant vers une automatisation complète des tâches et du divertissement. Dans le même temps, les contraintes de coûts poussent chaque joueur à adopter des méthodes de pointe pour une formation plus rapide, une meilleure inférence et une réduction des coûts de calcul. Cette compétition s'étend au-delà de l'entreprise - AI influence désormais la politique mondiale alors que la course aux nations à innover.
De plus, l'IA continuera d'évoluer. À la fin de la décennie, les images et la vidéo générées par l'AI peuvent dépasser le texte comme la forme principale du contenu généré par l'IA et le principal moteur des futurs besoins de calcul. Une partie importante de ce contenu pourrait être créée sur les appareils Edge. La génération de médias combinée avec des agents et des machines autonomes d'IA inaugurera la prochaine phase du développement de l'IA.
Réflexions finales
Contrairement aux cycles d'adoption de technologie précédents, l'IA générative ne montre aucun signe de ralentissement. Les progrès rapides des capacités et de l'efficacité alimentent une demande accrue. Alors que l'IA agentique s'étend au-delà de l'interaction humaine, le nombre «d'utilisateurs» de l'IA générative augmentera de façon exponentielle.
J'explorerai la demande croissante d'IA pour les images, les vidéos, les agents autonomes et les machines autonomes, ainsi que les exigences d'infrastructure mondiales et le coût total de fonctionnement (TCO) de l'IA génératrice dans les articles à venir.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le lancement par OpenAI d'un nouveau service de conseil en IA au prix de plus de 10 millions de dollars souligne une réalisation clé: en 2025, la valeur réelle de l'IA réside non seulement dans l'accès aux modèles, mais dans leur déplacement efficace. Cette approche reflète de près Palan

Dans mon entreprise, Jotform, nous avons plongé profondément dans le monde des chatbots propulsés par l'IA et découvert une variété de façons surprenantes de renforcer la façon dont nous interagissons avec les clients. Alors que nous pensions à l'origine que leur objectif principal serait de gérer la garde

Comprendre la puissance transformatrice des chiffres de l'après-agence en dit long: la recherche sur Grand View prédit que le marché mondial des agents d'IA passera de 5 milliards de dollars en 2024 à 50 milliards de dollars d'ici 2030, ce qui représente un taux de croissance annuel de 46%. Encore plus significatif

Ils établissent essentiellement des parallèles entre le paysage technologique actuel et les vagues passées d'innovation qui nous ont apporté Internet, les mégadonnées, le cloud computing et d'autres progrès.

Ce qui a fait ressortir l'acquisition, ce n'est pas simplement le chiffre financier, mais le parcours non conventionnel que l'entreprise a entrepris. La base44 n'a jamais poursuivi le capital-risque ni adhéré à la formule traditionnelle de la Silicon Valley. Au lieu de cela, cela a démontré que l'esprit

Parlons-en. Cette analyse des percées d'IA fait partie de ma couverture de colonne Forbes en cours sur les dernières personnes en IA, notamment en identifiant et en expliquant diverses complexités d'IA percutantes (voir le lien ici). IA et thérapie de santé mentale Comme un Q

L'année dernière, Boris Sofman a quitté Waymo, un ancien ingénieur vedette de Waymo et dédié à l'automatisation des camions. Il s'est associé aux anciens collègues de Waymo Ajay Gummalla et Kevin Peterson, ainsi qu'à l'ingénieur Tom Eliaz pour fonder le boucher de la robotique. Ils commencent par des excavateurs, qui sont largement utilisés dans les opérations d'excavation lourdes. La startup basée à San Francisco ne prévoit pas de concevoir sa propre gamme de machines de construction, mais prévoit d'ajouter des caméras, du lidar, des ordinateurs et des logiciels de l'IA à l'équipement existant pour lui permettre de travailler 24 heures sur 24, y compris les travailleurs humains en raison de températures élevées.

La montée en puissance de l'innovation de l'IA Companionsgrok marque un changement significatif dans la façon dont l'intelligence artificielle est utilisée pour répondre aux besoins émotionnels. Tandis que d'autres plates-formes telles que le personnage.ai et Microsoft continuent de raffiner leurs propres personnages virtuels
