


Plongeon profonde dans le flux de travail Llamaindex: Architecture LLM motivée par des événements
Llamaindex Workflow: une plongée profonde avec un projet pratique et une discussion sur les limitations
Llamaindex a récemment introduit une fonctionnalité de workflow, améliorant le développement d'applications LLM avec des capacités axées sur les événements et le découplage logique. Cet article explore le flux de travail à travers un mini-projet pratique, mettant en évidence ses forces et ses faiblesses.
Pourquoi des architectures motivées d'événements?
Les applications LLM modernes utilisent souvent des architectures d'agent intelligentes, impliquant de nombreux appels API et interactions itératives LLM. Cette complexité conduit à des goulots d'étranglement de performances et à un code complexe. Les architectures motivées d'événements offrent une solution en permettant une exécution simultanée des tâches liées aux E / S. Le flux de travail de Llamaindex tire parti de ce principe, abstraitz les complexités d'Asyncio tout en fournissant un mécanisme d'événements pour le découplage de la logique commerciale.
Premières impressions: un flux de travail simple
Un exemple de flux de travail de base démontre les concepts de base. Nous définissons les événements (par exemple, StartEvent
, StopEvent
, les événements personnalisés) et les étapes (méthodes décorées avec @step
) qui traitent ces événements. La méthode Workflow.run()
initie le processus, gérant le flux d'événements et la concurrence. Llamaindex fournit un outil de visualisation (draw_all_possible_flows
) pour illustrer le chemin d'exécution du workflow. En interne, Workflow utilise un Context
pour gérer la file d'attente d'événements et les étapes.
Projet pratique: gestion des stocks de supermarchés
Un projet plus complexe simule un système de gestion des stocks de supermarchés basé sur les commentaires des clients. Cela met en valeur les événements de ramification, de boucle, de streaming de Workflow et d'exécution simultanée.
Le FeedbackMonitorWorkflow
surveille en permanence la rétroaction SKU, en utilisant la branche pour gérer les «bons» ou «mauvais» rétroactions et la boucle pour répéter le processus. La classe InventoryManager
gère le placement des commandes et la compensation des stocks.
Événements de streaming pour rétroaction en temps réel
L'amélioration de FeedbackMonitorWorkflowV2
démontre des événements de streaming. La méthode ctx.write_event_to_stream()
envoie des mises à jour de progrès à un flux, permettant des commentaires en temps réel aux utilisateurs via handler.stream_events()
.
Exécution simultanée: analyser les commentaires de plusieurs sources
Le ComplexFeedbackMonitor
illustre une exécution simultanée. Il recueille des commentaires en ligne, hors ligne et un modèle de prédiction à l'aide de ctx.send_event()
pour déclencher des processus parallèles. ctx.collect_events()
attend tous les commentaires avant de prendre une décision.
lacunes et limitations
Malgré ses avantages, le flux de travail a des limites:
- flux de travail imbriqués: Le mécanisme actuel des flux de travail imbriqués (en utilisant
add_workflows
et passant des flux de travail comme paramètres) introduit le couplage et restreint l'interaction entre les flux de travail imbriqués. Appeler directement les méthodes d'étape dans les flux de travail imbriqués à partir du flux de travail parent n'est pas pris en charge. - Communication inter-workflow: La communication efficace entre les workflows indépendants n'est pas entièrement abordée. Tente de partager un
Context
ou d'utiliserctx.send_event
entre les limitations de la rencontre de workflows. - Syntaxe non liée: Bien que la syntaxe non liée offre la modularité en découplant les étapes d'un flux de travail spécifique, il ne résout pas intrinsèquement la communication entre les débits.
Solution proposée: Architecture modulaire avec communication axée sur les événements
Une architecture suggérée utilise un flux de travail central Application
qui orchestre la communication entre les modules indépendants (chacun potentiellement un flux de travail distinct). Ces modules communiquent via des événements, atteignant la modularité et le découplage.
Conclusion
Llamaindex Workflow offre des améliorations significatives pour la construction d'applications LLM efficaces et évolutives. Bien que des limites existent dans la communication inter-workflow, l'architecture et les capacités d'exécution simultanées axées sur l'événement sont des actifs précieux. Le développement et la lutte contre les limitations identifiées solidifieront la position du flux de travail dans le paysage de développement des applications LLM.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Stock Market GPT
Recherche d'investissement basée sur l'IA pour des décisions plus intelligentes

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le projet, surnommé «FOMC in Silico», recrée numériquement une réunion du comité fédéral de marché ouvert - la branche décisionnelle de la Banque centrale américaine - en utilisant des agents de l'IA pour représenter les membres réels du conseil d'administration. L'équipe de recherche a nourri chaque agent de données sur INDI

Dans le même temps, les protocoles de stockage traditionnels sont remplacés par des technologies plus récentes qui répondent mieux aux besoins des charges de travail AI évolutives et hautes performances. Les solutions de stockage pour l'IA choisissent de plus en plus le stockage d'objets par rapport au stockage traditionnel en bloc et au stockage de fichiers. Ce changement est ironique car le stockage d'objets a été initialement développé en tant que plate-forme évolutive, durable et à faible coût, principalement pour les sauvegardes, les archives, le contenu des médias et les lacs de données à l'échelle du cloud. Cependant, contrairement aux systèmes traditionnels de stockage de fichiers et de blocs qui sont submergés par les demandes de traitement parallèle à grande échelle, le stockage d'objets fournit les capacités d'échelle et les performances requises par les applications d'IA. Fondée il y a plus de dix ans, Minio est un premier leader du marché du stockage d'objets. L'entreprise

Lit une introduction à la liste des nominés en constante expansion, avec des dépôts juridiques remplis de décisions en justice, des livres faux attribués à de vrais auteurs et un hôte Airbnb utilisant l'IA pour fabriquer des images suggérant un invité causé des dommages qu'ils

Un véhicule Waymo sans aucun passagers voyageait le long de Rural Road près de l'Arizona State University à Tempe lorsqu'il a commencé à ralentir pour se transformer à droite en parking - se préparant vivement à ramasser son prochain cavalier. Waymo confirme le signal de virage

L'impact psychologique de cette transformation est profond. Pendant des années, la technologie d'assistance a été lourde, stigmatisante et rigide - pour les utilisateurs dans un moule à une taille unique. Mais l'IA réécrit cette histoire, offrant des solutions personnalisées t

Fait intéressant, de nouvelles études révèlent que l'une des utilisations les plus courantes pour les chatbots d'IA aujourd'hui est un soutien émotionnel et en santé mentale. De nombreux utilisateurs trouvent plus facile de s'ouvrir sur des sujets profondément personnels qu'ils pourraient hésiter à discuter avec des amis, de la famille, O

Il reste à voir que cela soit réalisable, mais une évaluation de Forbes de la dernière version de FSD a révélé qu'elle reste sujette aux erreurs. Lors d'un essai routier de 90 minutes à Los Angeles, dans les quartiers résidentiels et les autoroutes, le modèle Y 2024 avec T

La société a annoncé une augmentation de 359% dans son arriéré de commande lors de l'appel de bénéfice du premier trimestre 2026, déclenchant une augmentation de 36% de sa valeur de l'action ce jour-là. Cette étape a propulsé Ellison - un propriétaire de plus de 40% des actions de la société - au sommet du Billiona de Forbes
