Maison Périphériques technologiques IA Plongeon profonde dans le flux de travail Llamaindex: Architecture LLM motivée par des événements

Plongeon profonde dans le flux de travail Llamaindex: Architecture LLM motivée par des événements

Feb 25, 2025 pm 05:49 PM

Llamaindex Workflow: une plongée profonde avec un projet pratique et une discussion sur les limitations

Llamaindex a récemment introduit une fonctionnalité de workflow, améliorant le développement d'applications LLM avec des capacités axées sur les événements et le découplage logique. Cet article explore le flux de travail à travers un mini-projet pratique, mettant en évidence ses forces et ses faiblesses.

Pourquoi des architectures motivées d'événements?

Les applications LLM modernes utilisent souvent des architectures d'agent intelligentes, impliquant de nombreux appels API et interactions itératives LLM. Cette complexité conduit à des goulots d'étranglement de performances et à un code complexe. Les architectures motivées d'événements offrent une solution en permettant une exécution simultanée des tâches liées aux E / S. Le flux de travail de Llamaindex tire parti de ce principe, abstraitz les complexités d'Asyncio tout en fournissant un mécanisme d'événements pour le découplage de la logique commerciale.

Premières impressions: un flux de travail simple

Un exemple de flux de travail de base démontre les concepts de base. Nous définissons les événements (par exemple, StartEvent, StopEvent, les événements personnalisés) et les étapes (méthodes décorées avec @step) qui traitent ces événements. La méthode Workflow.run() initie le processus, gérant le flux d'événements et la concurrence. Llamaindex fournit un outil de visualisation (draw_all_possible_flows) pour illustrer le chemin d'exécution du workflow. En interne, Workflow utilise un Context pour gérer la file d'attente d'événements et les étapes.

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Projet pratique: gestion des stocks de supermarchés

Un projet plus complexe simule un système de gestion des stocks de supermarchés basé sur les commentaires des clients. Cela met en valeur les événements de ramification, de boucle, de streaming de Workflow et d'exécution simultanée.

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Le FeedbackMonitorWorkflow surveille en permanence la rétroaction SKU, en utilisant la branche pour gérer les «bons» ou «mauvais» rétroactions et la boucle pour répéter le processus. La classe InventoryManager gère le placement des commandes et la compensation des stocks.

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Événements de streaming pour rétroaction en temps réel

L'amélioration de FeedbackMonitorWorkflowV2 démontre des événements de streaming. La méthode ctx.write_event_to_stream() envoie des mises à jour de progrès à un flux, permettant des commentaires en temps réel aux utilisateurs via handler.stream_events().

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Exécution simultanée: analyser les commentaires de plusieurs sources

Le ComplexFeedbackMonitor illustre une exécution simultanée. Il recueille des commentaires en ligne, hors ligne et un modèle de prédiction à l'aide de ctx.send_event() pour déclencher des processus parallèles. ctx.collect_events() attend tous les commentaires avant de prendre une décision.

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

lacunes et limitations

Malgré ses avantages, le flux de travail a des limites:

  • flux de travail imbriqués: Le mécanisme actuel des flux de travail imbriqués (en utilisant add_workflows et passant des flux de travail comme paramètres) introduit le couplage et restreint l'interaction entre les flux de travail imbriqués. Appeler directement les méthodes d'étape dans les flux de travail imbriqués à partir du flux de travail parent n'est pas pris en charge.
  • Communication inter-workflow: La communication efficace entre les workflows indépendants n'est pas entièrement abordée. Tente de partager un Context ou d'utiliser ctx.send_event entre les limitations de la rencontre de workflows.
  • Syntaxe non liée: Bien que la syntaxe non liée offre la modularité en découplant les étapes d'un flux de travail spécifique, il ne résout pas intrinsèquement la communication entre les débits.

Solution proposée: Architecture modulaire avec communication axée sur les événements

Une architecture suggérée utilise un flux de travail central Application qui orchestre la communication entre les modules indépendants (chacun potentiellement un flux de travail distinct). Ces modules communiquent via des événements, atteignant la modularité et le découplage.

Deep Dive into LlamaIndex Workflow: Event-Driven LLM Architecture

Conclusion

Llamaindex Workflow offre des améliorations significatives pour la construction d'applications LLM efficaces et évolutives. Bien que des limites existent dans la communication inter-workflow, l'architecture et les capacités d'exécution simultanées axées sur l'événement sont des actifs précieux. Le développement et la lutte contre les limitations identifiées solidifieront la position du flux de travail dans le paysage de développement des applications LLM.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Stock Market GPT

Stock Market GPT

Recherche d'investissement basée sur l'IA pour des décisions plus intelligentes

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Les universitaires simulent la réunion du comité de la Réserve fédérale avec les agents de l'IA Les universitaires simulent la réunion du comité de la Réserve fédérale avec les agents de l'IA Sep 16, 2025 pm 08:34 PM

Le projet, surnommé «FOMC in Silico», recrée numériquement une réunion du comité fédéral de marché ouvert - la branche décisionnelle de la Banque centrale américaine - en utilisant des agents de l'IA pour représenter les membres réels du conseil d'administration. L'équipe de recherche a nourri chaque agent de données sur INDI

Posses de stockage prédéfinies enlever l'entreprise AI à l'échelle des goulots d'étranglement Posses de stockage prédéfinies enlever l'entreprise AI à l'échelle des goulots d'étranglement Sep 16, 2025 pm 04:42 PM

Dans le même temps, les protocoles de stockage traditionnels sont remplacés par des technologies plus récentes qui répondent mieux aux besoins des charges de travail AI évolutives et hautes performances. Les solutions de stockage pour l'IA choisissent de plus en plus le stockage d'objets par rapport au stockage traditionnel en bloc et au stockage de fichiers. Ce changement est ironique car le stockage d'objets a été initialement développé en tant que plate-forme évolutive, durable et à faible coût, principalement pour les sauvegardes, les archives, le contenu des médias et les lacs de données à l'échelle du cloud. Cependant, contrairement aux systèmes traditionnels de stockage de fichiers et de blocs qui sont submergés par les demandes de traitement parallèle à grande échelle, le stockage d'objets fournit les capacités d'échelle et les performances requises par les applications d'IA. Fondée il y a plus de dix ans, Minio est un premier leader du marché du stockage d'objets. L'entreprise

Les prix Darwin pour l'IA célèbrent l'échec de l'intelligence artificielle épique Les prix Darwin pour l'IA célèbrent l'échec de l'intelligence artificielle épique Sep 16, 2025 pm 09:31 PM

Lit une introduction à la liste des nominés en constante expansion, avec des dépôts juridiques remplis de décisions en justice, des livres faux attribués à de vrais auteurs et un hôte Airbnb utilisant l'IA pour fabriquer des images suggérant un invité causé des dommages qu'ils

Waymo impliqué, apparemment pas en faute, en décès de moto Waymo impliqué, apparemment pas en faute, en décès de moto Sep 15, 2025 pm 07:51 PM

Un véhicule Waymo sans aucun passagers voyageait le long de Rural Road près de l'Arizona State University à Tempe lorsqu'il a commencé à ralentir pour se transformer à droite en parking - se préparant vivement à ramasser son prochain cavalier. Waymo confirme le signal de virage

AI et (DIS) Capacité: déverrouiller le potentiel humain avec la technologie AI et (DIS) Capacité: déverrouiller le potentiel humain avec la technologie Sep 15, 2025 pm 07:43 PM

L'impact psychologique de cette transformation est profond. Pendant des années, la technologie d'assistance a été lourde, stigmatisante et rigide - pour les utilisateurs dans un moule à une taille unique. Mais l'IA réécrit cette histoire, offrant des solutions personnalisées t

Les chatbots AI créent tranquillement un cauchemar de confidentialité Les chatbots AI créent tranquillement un cauchemar de confidentialité Sep 16, 2025 pm 05:57 PM

Fait intéressant, de nouvelles études révèlent que l'une des utilisations les plus courantes pour les chatbots d'IA aujourd'hui est un soutien émotionnel et en santé mentale. De nombreux utilisateurs trouvent plus facile de s'ouvrir sur des sujets profondément personnels qu'ils pourraient hésiter à discuter avec des amis, de la famille, O

Le logiciel de conduite entièrement auto de Tesla est un gâchis. Devrait-il être légal? Le logiciel de conduite entièrement auto de Tesla est un gâchis. Devrait-il être légal? Sep 24, 2025 pm 11:39 PM

Il reste à voir que cela soit réalisable, mais une évaluation de Forbes de la dernière version de FSD a révélé qu'elle reste sujette aux erreurs. Lors d'un essai routier de 90 minutes à Los Angeles, dans les quartiers résidentiels et les autoroutes, le modèle Y 2024 avec T

Larry Ellison est en tête de liste milliardaire dans l'IA Race: 8 Faits amusants Larry Ellison est en tête de liste milliardaire dans l'IA Race: 8 Faits amusants Sep 14, 2025 pm 07:18 PM

La société a annoncé une augmentation de 359% dans son arriéré de commande lors de l'appel de bénéfice du premier trimestre 2026, déclenchant une augmentation de 36% de sa valeur de l'action ce jour-là. Cette étape a propulsé Ellison - un propriétaire de plus de 40% des actions de la société - au sommet du Billiona de Forbes

See all articles