DSPy：语言模型编程的新方法-Python教程-PHP中文网

DSPy：语言模型编程的新方法

DDD

发布： 2024-11-30 18:33:11

原创

987 人浏览过

DSPy: A New Approach to Language Model Programming

挑战：超越传统提示

在使用语言模型 (LLM) 时，开发人员面临着一系列常见的挑战。我们花费了无数的时间来制作完美的提示，却发现当我们切换模型或输入略有变化时，我们精心设计的解决方案就会崩溃。传统的即时工程方法是手动的、耗时的，而且通常是不可预测的。

解决方案：斯坦福大学的 DSPy 框架

DSPy（声明式自我改进 Python）的出现是斯坦福 NLP 对这些挑战的回答。正如他们的网站 (dspy.ai) 所描述的，它是“用于编程（而不是提示）语言模型的开源框架”。它支持构建模块化 AI 系统的快速迭代，并提供用于优化提示和权重的算法，无论您是构建简单的分类器、复杂的 RAG 管道还是代理循环。

工作原理：核心组件

1. 入门

首先，安装框架：

pip install -U dspy

import dspy
lm = dspy.LM('openai/gpt-4-mini', api_key='YOUR_OPENAI_API_KEY')
dspy.configure(lm=lm)

登录后复制

2. 理解签名

签名是 DSPy 声明式方法的基础。他们以简单的格式定义输入和输出的语义角色：

# Simple question answering
"question -> answer"

# Retrieval-based QA
"context: list[str], question: str -> answer: str"

# Multiple-choice with reasoning
"question, choices: list[str] -> reasoning: str, selection: int"

登录后复制

3. 使用模块

DSPy 为不同的用例提供了几个关键模块：

预测：直接 LLM 回复
ChainOfThought：逐步推理
ProgramOfThought：基于代码的解决方案
ReAct：基于代理的交互
MultiChainComparison：比较多个推理路径

4. 实际应用

数学问题解决

math = dspy.ChainOfThought("question -> answer: float")
math(question="Two dice are tossed. What is the probability that the sum equals two?")

登录后复制

检索增强生成 (RAG)

def search_wikipedia(query: str) -> list[str]:
    results = dspy.ColBERTv2(url='http://20.102.90.50:2017/wiki17_abstracts')(query, k=3)
    return [x['text'] for x in results]

rag = dspy.ChainOfThought('context, question -> response')

登录后复制