L'ordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif-IA-php.cn

Les 14 et 15 juin 2024, la 6e Conférence Zhiyuan de Pékin se tiendra dans une combinaison de hors ligne et en ligne. Le lieu hors ligne sera situé au centre de conférence de la zone nationale de démonstration d'innovation indépendante de Zhongguancun. La conférence Zhiyuan 2024 rassemble une fois de plus des chercheurs exceptionnels de l'année avec une perspective mondiale pour échanger de nouvelles idées, explorer de nouvelles idées et explorer de nouvelles frontières. Les canaux d'inscription sont désormais officiellement ouverts.

Compte à rebours de la Conférence Zhiyuan de Pékin : 11 jours

Generation Model Forum丨15 juin après-midi

Fonction de génération La modélisation est la base de l'intelligence artificielle L'un des Les paradigmes constituent une étape importante vers l’intelligence artificielle générale. Avec le développement rapide des méthodes de modélisation générative et la croissance rapide de l'échelle des modèles, l'intelligence artificielle générative (telle que les séries GPT, Sora, Stable Diffusion, etc.) représentée par des modèles autorégressifs et des modèles de probabilité de diffusion a été largement utilisée dans les textes, les images, vidéos, Une série d'avancées ont été réalisées dans des domaines importants tels que la cross-modalité. Ce forum se concentre sur le développement futur de la modélisation probabiliste générative. Quatre experts et chercheurs de première ligne en intelligence artificielle générative sont invités à partager les progrès de pointe de la modélisation générative et à discuter de la manière de construire une méthode de modélisation générative unifiée multimodale et d'autres futurs importants. problèmes.

Ordre du jour du Forum

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Président du Forum

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Li Chongxuan, chercheur principal à Professeur agrégé de l'Université Renmin de Chine, École d'intelligence artificielle

Li Chongxuan, Chine Professeur agrégé et directeur de doctorat à la Hillhouse School of Artificial Intelligence, Renmin University Il a obtenu sa licence et son doctorat à l'Université Tsinghua de 2010 à 2019. Recherchant principalement l'apprentissage automatique et les modèles génératifs profonds, des travaux représentatifs sont déployés sur le grand modèle texte-image DALL·E 2, Stable Diffusion et le grand modèle texte-vidéo ViDu. Il a remporté le prix du meilleur article de la conférence internationale ICLR, le prix de la jeunesse exceptionnelle Wu Wenjun, le premier prix de l'intelligence artificielle Wu Wenjun et la thèse de doctorat exceptionnelle de la China Computer Federation. Sélectionné dans le Plan Boxin et l'Étoile des sciences et technologies de Pékin, il a présidé et participé à de nombreux projets de la Fondation nationale des sciences naturelles et du ministère de la Science et de la Technologie. A été président de conférences internationales telles que ICLR et NeurIPS.

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Chen Jianfei, professeur agrégé à l'Université Tsinghua

Chen Jianfei a obtenu son baccalauréat et son doctorat en informatique de l'Université Tsinghua en 2014 et 9 respectivement, et a travaillé avec le groupe TSAIL a coopéré avec le professeur Zhu Jun. Ses intérêts de recherche incluent l'apprentissage automatique efficace, en particulier les réseaux neuronaux quantifiés, les algorithmes d'optimisation stochastique et les algorithmes d'inférence probabiliste. Dans le passé, il a également développé plusieurs systèmes de formation de modèles thématiques évolutifs. En 2019, Chen Jianfei a remporté le prix de thèse de doctorat exceptionnelle du CCF pour son travail exceptionnel. Il a également remporté la médaille d'or à l'Olympiade chinoise d'informatique en 2009. En 2018, Chen Jianfei a cofondé RealAI, une réalisation notable dans sa carrière.

Sujet du discours et introduction de l'invité (par ordre de parole)

1, avant la génération de la vidéoau fil de l'avancement

Introduction au rapport : Différent Quant à la génération d'images, la génération de vidéos est confrontée à d'énormes défis en termes de cohérence du contenu, de génération de vidéos longues et de consommation de ressources informatiques. Cependant, la génération vidéo a encore connu un développement rapide en 2023, avec l'émergence d'excellents modèles tels que Stable Video Diffusion, Runway Gen-2, Video Diffusion Transformer et Sora. Ce rapport présente d'abord les défis actuels rencontrés par la génération vidéo, puis présente en détail les derniers excellents modèles de génération vidéo et donne enfin une perspective sur le développement technologique de la génération vidéo.

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Lu Zhiwu, professeur de l'Université Renmin de Chine

Dr Lu Zhiwu, professeur et directeur de doctorat à la Hillhouse School of Artificial Intelligence, Renmin University of China. En 2005, il est diplômé du Département des sciences de l'information de l'École des sciences mathématiques de l'Université de Pékin, avec une maîtrise en sciences ; en 2011, il est diplômé du Département d'informatique de l'Université de la ville de Hong Kong, avec un doctorat. Ses axes de recherche sont l'apprentissage automatique et la vision par ordinateur. Concevoir le premier modèle chinois de pré-formation multimodal universel Wenlan BriVL. Publication du premier article de la sous-revue Nature dans le domaine de la multimodalité. Avant qu'OpenAI ait publié un VDT de base de génération vidéo de type Sora.

2, Modélisation visuelle autorégressive : génération d'images évolutives via une prédiction à l'échelle suivante

Introduction au rapport : L'orateur présentera le dernier cadre de génération visuelle de modélisation visuelle autorégressive, basé sur Visual tokenizer se combine avec Transformer pour implémenter Next Scale Prediction, qui permet pour la première fois une génération visuelle autorégressive de style GPT, surpassant Diffusion en termes d'effet, de vitesse et de capacités de mise à l'échelle, et ouvrant la voie à des lois de mise à l'échelle dans le domaine de la génération visuelle. le partage vous apportera Présentation du modèle de diffusion classique et des progrès de pointe du modèle Auto Régressif qui a récemment attiré l'attention de tous.

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif Jiang Yi, chercheur ByteDance GenAI

Jiang Yi, chercheur ByteDance GenAI, diplômé de l'Université du Zhejiang. Ses travaux représentatifs incluent Sparse R-CNN, ByteTrack, UNINEXT, etc. Ses intérêts de recherche actuels portent principalement sur la recherche et le développement de modèles de base de vision par ordinateur et de génération visuelle. Il a publié plus de 30 articles dans des conférences et des revues telles que CVPR, ICCV, NeurIPS, ICLR, ICML, ECCV, etc., dont beaucoup. qui ont été acceptés dans Oral, Spotlight, son travail est open source sur github et a accumulé 20 000 étoiles.

3 Préoccupation généralisée. Cependant, avec le développement de la technologie, les questions clés à résoudre dans ce domaine sont devenues de plus en plus importantes, obligeant les chercheurs à investir davantage d'énergie dans des discussions approfondies. Ce rapport vise à trier et résumer plusieurs problèmes importants auxquels ce domaine est confronté, et également à partager les réflexions et idées préliminaires de l'auteur sur les sujets suivants : 1. La poursuite ultime de l'exploration des modèles génératifs ; 2. Le problème de la division du signal visuel ; Le dilemme de Tokenizer ; 4. Le problème de conflit inhérent au modèle de diffusion ; 5. Si le modèle de diffusion est une estimation du maximum de vraisemblance. Le rapport espère que ces discussions attireront l'attention de la communauté universitaire et contribueront à promouvoir l'innovation et le développement continus dans ce domaine.

Gu Shuyan, chercheur au sein du Visual Computing Group de Microsoft Research Asia

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Gu Shuyan, a obtenu son baccalauréat en automatisation du département de l'Université des sciences et technologies de Chine en respectivement 2017 et 2022. Ph.D., actuellement chercheur au sein du Visual Computing Group de Microsoft Research Asia. Son principal domaine de recherche concerne les modèles génératifs en vision par ordinateur. Les intérêts de recherche comprennent principalement la théorie et l'application des réseaux adverses génératifs et des modèles de diffusion, l'exploration d'une nouvelle génération de modèles génératifs et l'évaluation de la qualité des modèles génératifs. Il a publié de nombreux articles lors de CVPR, ICCV, ECCV et d'autres conférences et a été réviseur pour de nombreuses conférences et revues.

Page d'accueil personnelle : https://cientgu.github.io/

Méthode d'inférence parallèle efficace pour les grands modèles

Introduction au rapport :

Le grand modèle AIGC a obtenu des résultats d'application généralisés. Cependant, son processus de raisonnement séquentiel inefficace conduit souvent à une mauvaise expérience utilisateur et à des coûts de déploiement élevés. Ce rapport présentera comment améliorer l'efficacité de l'inférence des grands modèles du point de vue des algorithmes d'inférence et explorera les méthodes d'accélération dans d'autres aspects tels que l'architecture du modèle, la compression de séquence et l'optimisation du cache.

Deng Zhijie,

Professeur adjoint à l'Institut de recherche Qingyuan, Université Jiao Tong de Shanghai Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif

Deng Zhijie, professeur adjoint et directeur de doctorat à l'Institut de recherche Qingyuan, École de génie électrique, Université Jiao Tong de Shanghai. Les principaux axes de recherche sont les modèles génératifs et l'apprentissage automatique. Il a publié plus de 20 articles en tant que premier auteur/auteur correspondant dans des conférences et des revues telles que ICML, NeurIPS, ICLR et CVPR. A remporté le NVIDIA Pioneer Research Award. Les travaux de recherche sont soutenus par la Fondation nationale des sciences naturelles de Chine, le Plan d'action pour l'innovation scientifique et technologique de Shanghai, le Fonds pour les grands modèles CCF-Baichuan-Inbo et d'autres projets.

5, Discussion en table ronde

Invité à la table ronde :

Chen Jianfei丨Professeur agrégé de l'Université Tsinghua (mod érateur)

Lu Zhi Wu丨Professeur de Renmin Université de Chine

Jiang Yi丨Responsable de ByteDance GenAI

Gu Shuhu丨Chercheur du Visual Computing Group de Microsoft Research Asia

Deng Zhijie丨Professeur adjoint à l'Institut de recherche Qingyuan de l'Université Jiao Tong de Shanghai

Li Chongxuan丨Professeur agrégé à l'Université Renmin de Chine

Scannez le code QR pour vous inscrire maintenant et participer à l'inscription à la conférence

Cette conférence adopte l'intégration des modes hors ligne et en ligne. Le canal d'inscription est ouvert. Bienvenue pour scanner le QR. code pour vous inscrire gratuitement. En raison du nombre limité de places hors ligne, veuillez terminer l'inscription le plus tôt possible. Le comité d'organisation examinera selon l'ordre d'inscription et enverra une notification du résultat de l'examen avant la réunion. La session publique sera diffusée en direct en ligne pour les utilisateurs enregistrés.

Lordre du jour de la Conférence sur les sources intelligentes 2024 dévoilé : modèle génératif