Auteur|Yu Huiru Editeur|Liu Yu
L'abaissement des barrières techniques a donné naissance à un grand nombre de startups de peinture IA, ce qui signifie également une concurrence féroce. Unbounded AI, qui en fait partie, en a une expérience personnelle.
Actuellement, le nombre d'utilisateurs d'Unbounded AI est inférieur à 3 millions, ce qui est encore loin de l'objectif annuel de 10 millions. Chang Chai, le fondateur de Wujie AI, a déclaré sans détour que la croissance du nombre d'utilisateurs était entrée dans une période de hausse et qu'elle continuerait à travailler dur au cours du second semestre. La croissance lente de l’IA illimitée est un microcosme de l’industrie.
En tant que domaine émergent, l'industrie de la peinture IA évolue rapidement. Lors de la Conférence mondiale sur l'intelligence artificielle il y a une semaine, Alibaba Cloud a ajouté un nouveau membre à sa série de grands modèles Tongyi : Tongyi Wanxiang, qui se positionne comme un grand modèle pour la création de peintures IA. Outre Alibaba, les grands modèles lancés par Baidu, iFlytek, SenseTime et d'autres sociétés disposent tous de fonctions multimodales telles que les graphiques Vincent.
Cela signifie que l'infrastructure dans le domaine de la peinture IA devient de plus en plus populaire. En fait, après que le modèle Stable Diffusion soit devenu open source, le seuil d'accès au secteur de la peinture vincentienne a été considérablement abaissé et un grand nombre de startups de peinture IA sont nées en Chine. Unbounded AI est une startup qui a grandi dans cette vague. Elle est partie du modèle « communauté en tant que service » et a été optimisée de manière itérative étape par étape dans les opérations communautaires.
La concurrence devient de plus en plus féroce. Fin mars de cette année, Midjourney, l'entreprise de peinture IA la plus populaire du secteur, a publié la version V5, qui itère l'effet de génération d'images de style réaliste au « niveau photo ». La bataille pour la survie a commencé dans le domaine de la peinture IA.
La perspective de la peinture IA est extrêmement attractive. Selon le rapport de recherche de Guotai Junan, d'ici 2025, le taux de pénétration de la peinture par IA dans le domaine de la génération de contenu d'images atteindra 30 % et la taille du marché dépassera 200 milliards de yuans.
Les tentations et les défis vont de pair, seuls ceux qui ont les meilleurs sortiront vainqueurs. En tant qu'écrivain de science-fiction qui a remporté le « Galaxy Award » pour la science-fiction chinoise trois fois de suite, le vrai nom de Chang Chai est Liu Zhipeng. Comment mènera-t-il Unbounded AI à sortir du siège ? Sa réponse a été : « Dans le domaine de la génération d'IA, davantage d'opportunités pour les startups nationales apparaîtront dans la couche application. »
Voici le contenu de la conversation entre All Weather Technology et Changchai, compilé par All Weather Technology :
« Les applications de la peinture IA sont encore concentrées dans le domaine du marketing »
Technologie tous temps : combien d'utilisateurs avez-vous actuellement ?
Changchai :Notre base d'utilisateurs approche désormais les 3 millions. Nous ne créons pas de petits programmes, nous nous concentrons principalement sur les utilisateurs d'APP, complétés par les utilisateurs de sites Web. À l'origine, notre objectif cette année était d'atteindre 10 millions d'utilisateurs, mais ces derniers mois, nous sommes entrés dans une période de croissance. La croissance des données utilisateur n'est pas aussi rapide que lorsque l'AIGC est devenu populaire. Nous sommes encore loin de l'objectif. de 10 millions. Nous continuerons à travailler dur au cours du second semestre.
Technologie 24h/24 et 7j/7 : combien y a-t-il d'utilisateurs payants ?
Cheveux longs : La pointe C est de 20%. Nous avons chaque jour 15 quotas de dessin gratuits pour chaque utilisateur. De nombreux utilisateurs viennent pour le quota quotidien gratuit et nous les accueillons. Pour le côté C, nous espérons établir une influence illimitée sur l’industrie. Les revenus dépendent principalement de To B.
Technologie météo : au cours du premier semestre de cette année, de nombreux fabricants puissants se sont lancés dans le domaine de la génération d'IA. Quel genre de pression cela vous a-t-il apporté ?
Chang Chai :Nous ne considérons pas cela comme de la pression. Le style de jeu de chacun est différent et leur positionnement est également différent. Les outils de peinture IA des grands fabricants se positionnent généralement comme des systèmes autonomes et ne sont pas connectés à la communauté ouverte représentée par SD (Stable Diffusion). Les invites et les paramètres Mocong ne sont pas compatibles. des outils servent leurs propres produits bien connus. Par exemple, Meitu se concentre sur l’application de l’IA dans l’édition de photos. D’une manière générale, ils ont tendance à exercer une force dans une certaine direction.
Unbounded est basé sur la communauté et a des orientations diversifiées. Ses produits « coulent aussi librement que l'eau » et s'écoulent vers des domaines à potentiel commercial, tels que le design architectural, le design d'intérieur, le design de mode, la bande dessinée, les jeux et d'autres domaines. Dans chaque industrie verticale explosive, Wujie coopérera avec un ou deux principaux clients du côté B pour développer des modèles industriels. Les modèles industriels pourraient être un champ de bataille pour les stratèges de l'AIGC au cours du second semestre. Il est difficile de devenir un modèle général unique. une solution unifiée pour les industries verticales.
Technologie tous temps : vos clients B-end comprennent des sociétés immobilières, des groupes de tourisme culturel et des entreprises de biens de consommation, avec un large éventail d'industries. Quelle est la logique derrière la sélection de clients dans ces secteurs ? Juste gagner de l'argent ?
Chang Hao :Oui, il y a certaines activités. Elles visent simplement à collecter d'excellents travaux et n'impliquent pas de niveaux de produits spécifiques. Tant que les clients sont prêts à venir, nous les accueillons. . À en juger par le premier semestre, les besoins des clients de la plupart des secteurs se concentrent principalement sur les activités de marketing.
Cependant, au cours des deux derniers mois, il y a eu de plus en plus de coopération dans le domaine MaaS. Par exemple, dans le secteur de la décoration intérieure, nous avons une coopération en matière de formation modèle avec 3D Home et Oppein. Au cours du second semestre, Wujie lancera des modèles destinés à des secteurs tels que l'architecture, la décoration intérieure, l'habillement, les patrons, l'automobile et l'industrie.
Images de tâches générées par le modèle photo de personnage IA illimité
"La barrière d'une entreprise de peinture IA est la communauté + la puissance du produit"
Technologie tous temps : lorsqu'il s'agit de peindre par l'IA, la première réaction de chacun pourrait être Midjourney. Selon vous, quel est le fossé de Midjourney ?
长铗 : Les douves de Midjourney ont deux aspects : une immense communauté et une forte force de produit. Midjourney continue d'itérer avec l'aide de la communauté Discord. En tant que logiciel de chat vocal et textuel intégré adapté aux joueurs, les attributs sociaux de la plate-forme Discord permettent également à Midjourney de capter l'esprit d'un plus grand nombre d'utilisateurs. Ses produits ont une forte individualité et ont formé une école esthétique. En revanche, les applications de l'écosystème open source de Stable Diffuion sont difficiles à former leur propre personnalité dans les produits en raison de « laisser fleurir cent fleurs ».
Bien que Wujie soit basé sur l'écosystème SD, sa future équipe et la construction de ses produits deviendront de plus en plus orientées MJ. En termes de produits, au cours du second semestre de cette année, nous lancerons successivement des modèles industriels tels que le design d'intérieur et le design architectural, ainsi que des modèles de conception axés sur le style national, la mode nationale et les bandes dessinées nationales, afin que les produits soient plus conforme à l’esthétique des utilisateurs chinois. En termes d'incarnation de l'art chinois, je pense qu'Unbounded sera meilleur que Midjourney.
Technologie tous temps : après que des modèles tels que Disco diffusion et Stable diffusion soient devenus open source, de nombreuses startups de peinture IA ont vu le jour en Chine. Certaines personnes ont fait remarquer que leurs modèles et produits sont très homogènes. Qu'en penses-tu?
Chang 铗 : Ce problème existe à l'heure actuelle. La popularité de l'écologie SD il y a quelque temps était principalement due à la force motrice de la communauté bidimensionnelle pour produire de l'électricité par amour. Cependant, la plupart de ces modèles sont des modèles de fusion. et manquent d'originalité. Ils sont connus comme le creuset de toutes choses. Par conséquent, dans l'ensemble, l'homogénéité des produits est relativement sérieuse. Les thématiques du modèle communautaire sont relativement étroites, pour la plupart des thématiques courantes comme la beauté, l'animation, les illustrations, etc., qui sont encore très éloignées des besoins verticaux relativement professionnels. Les modèles de peinture tels que Stable Diffusion ne peuvent pas être directement commercialisés. Tout le monde utilise la technologie sous-jacente, et la compétitivité dépend toujours de l'innovation au niveau des applications verticales.
Technologie tous temps : quels devraient être les obstacles pour les entreprises de peinture IA ?
Chang Chai : En ce qui concerne Unbounded, il y a deux points : le premier est la communauté, et le second est la compétitivité des produits.
À l’instar des communautés ouvertes telles que la blockchain, l’AIGC est en fait une logique axée sur la communauté. Les utilisateurs de la communauté sont principalement divisés en deux catégories, l'une est l'entraîneur de modèles (communément appelé alchimiste) et l'autre est l'ingénieur d'invite (communément appelé magicien). Les utilisateurs ont une très grande autonomie et originalité. Si les paramètres du modèle qu'ils ont découverts ne peuvent pas être réutilisés sur d'autres plateformes, alors le coût de la migration sera inévitablement élevé. En plus du modèle de peinture, Wujie forme également son propre modèle de langage. Bien entendu, il s'agit d'un modèle de langage affiné pour les applications de peinture. Il aidera les utilisateurs à écrire des mots rapides, à étiqueter les images et à convertir le langage naturel en étiquettes. que le modèle de peinture SD peut comprendre. Nous le rendrons également open source pour que la communauté puisse l'utiliser gratuitement.
«La situation financière dans le domaine de la peinture IA s'améliorera au second semestre»
Technologie météorologique : le domaine de la peinture par l'IA est très populaire depuis le second semestre de l'année dernière, mais peu d'entreprises ont levé des fonds jusqu'à présent. Quelle en est la raison, selon vous ?
Chang Chai :J'ai personnellement l'impression qu'au premier semestre de cette année, l'attention des investisseurs s'est principalement portée sur les grands modèles linguistiques. Dans cette vague technologique, les investisseurs ont toujours tendance à investir dans des entreprises dont la logique sous-jacente est axée sur la technologie. Pour les projets axés sur la couche applicative, les investisseurs accordent davantage d'attention à des questions pragmatiques telles que « Qui sont vos gros clients ? Comment gagnez-vous de l'argent ? Comment sont les données financières ? Mais à ce stade, la plupart des sociétés de couche d'application AIGC sont encore en phase d'expansion et les données sur les revenus ne sont certainement pas si bonnes. D’ici le second semestre de cette année, la situation de chacun devrait s’améliorer, et la situation financière s’améliorera également.
Technologie All Weather : Comment évolue votre financement actuellement ?
Chang Chai :Nous sommes assez bouddhistes sur cette question. Je pense que le financement est une chose naturelle, nous n'avons donc pas cherché de capitaux partout et nous nous sommes concentrés principalement sur les produits et les opérations.
Technologie All Weather : À quel niveau pensez-vous que la force du produit Unbounded atteindra, ou quelle échelle d'utilisateurs atteindra-t-il, qu'il est temps de promouvoir le financement de manière proactive ?
Chang Chai :En termes de financement, nous n'avons en fait pas d'objectifs échelonnés. Si le capital vient à nous et veut investir en nous, nous l'accueillons à tout moment. Sinon, nous ne le forcerons pas. Mais nous avons des objectifs commerciaux et la pression est relativement forte. Cette année, nous voulons atteindre 100 millions de yuans de revenus et 10 millions d'utilisateurs.
Technologie tous temps : combien de revenus peut-elle générer maintenant ?
Chang Chai : Il existe encore un certain écart entre l'objectif et la pression au second semestre est encore relativement élevée, en fonction de la courbe de croissance, mais nous restons toujours optimistes quant à l'avenir.
Technologie tous temps : depuis le jour où la peinture AI est née, il y a eu des litiges en matière de droits d'auteur. Comment éviter ce problème ?
Changchai :Nous avons également étudié spécifiquement la question de l'identification du droit d'auteur. L'année dernière, tout le monde disait que l'IA était un monstre de couture, un monstre de découpe, un monstre de collage, un monstre de découpe de précision, etc. De tels problèmes existaient au début. Mais avec le développement de l'IA, sa créativité artistique est de plus en plus élevée. Il est désormais fondamentalement impossible pour une œuvre d'IA de ressembler au travail d'un certain artiste, car les modèles actuels sont tous des modèles de fusion, intégrant plusieurs écoles d'art et d'art. style, plutôt que d’apprendre un ou deux artistes.
De plus, lorsqu'il s'agit de peinture, ce qui compte, c'est l'originalité du contenu de l'image, pas les outils. Avec l'application de technologies telles que Controlnet, Segment Any et Dragan, les utilisateurs ont de plus en plus de contrôle sur les images générées par l'IA. Ils peuvent segmenter, faire glisser et déformer les images comme PS. Les informations saisies par l'utilisateur ne sont plus uniques. Les mots, ainsi que la correspondance minutieuse des paramètres du modèle et l'application d'informations externes telles que la profondeur, les postures d'action, les dessins au trait et les contours, signifient que les utilisateurs deviennent de plus en plus originaux. De plus, je crois personnellement qu'avec le développement de l'IA, les œuvres d'IA seront définitivement protégées par le droit d'auteur à l'avenir.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!