如何向链的状态添加值

先决条件

本指南假定读者熟悉以下概念：

链式步骤中传递数据的另一种方式是，在保持链状态当前值不变的同时，为指定键分配一个新值。RunnablePassthrough.assign() 静态方法接收一个输入值，并将传递给 assign 函数的额外参数添加进去。

在常见的 LangChain 表达式语言模式中，这非常有用：通过累加方式创建一个字典，用作后续步骤的输入。

这里有一个示例：

%pip install --upgrade --quiet langchain langchain-openai

import os
from getpass import getpass

if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = getpass()

from langchain_core.runnables import RunnableParallel, RunnablePassthrough

runnable = RunnableParallel(
    extra=RunnablePassthrough.assign(mult=lambda x: x["num"] * 3),
    modified=lambda x: x["num"] + 1,
)

runnable.invoke({"num": 1})

API 参考：RunnableParallel | RunnablePassthrough

{'extra': {'num': 1, 'mult': 3}, 'modified': 2}

让我们来分析一下这里发生了什么。

链的输入是 {"num": 1}。该输入被传递给 RunnableParallel，后者会并行调用传入的可运行对象，并使用该输入。
键 extra 下的值被调用。RunnablePassthrough.assign() 保留输入字典中的原始键（{"num": 1}），并分配一个名为 mult 的新键。其值为 lambda x: x["num"] * 3)，即 3。因此，结果是 {"num": 1, "mult": 3}。
{"num": 1, "mult": 3} 返回给 RunnableParallel 调用，并设置为键 extra 的值。
与此同时，调用了 modified 键。结果是 2，因为该 lambda 从其输入中提取了一个名为 "num" 的键，并将其加一。

因此，结果是 {'extra': {'num': 1, 'mult': 3}, 'modified': 2}。

流式传输

此方法的一个便捷功能是，一旦值可用即可立即传递。为了展示这一点，我们将使用 RunnablePassthrough.assign() 立即在检索链中返回源文档：

from langchain_community.vectorstores import FAISS
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI, OpenAIEmbeddings

vectorstore = FAISS.from_texts(
    ["harrison worked at kensho"], embedding=OpenAIEmbeddings()
)
retriever = vectorstore.as_retriever()
template = """Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)
model = ChatOpenAI()

generation_chain = prompt | model | StrOutputParser()

retrieval_chain = {
    "context": retriever,
    "question": RunnablePassthrough(),
} | RunnablePassthrough.assign(output=generation_chain)

stream = retrieval_chain.stream("where did harrison work?")

for chunk in stream:
    print(chunk)

{'question': 'where did harrison work?'}
{'context': [Document(page_content='harrison worked at kensho')]}
{'output': ''}
{'output': 'H'}
{'output': 'arrison'}
{'output': ' worked'}
{'output': ' at'}
{'output': ' Kens'}
{'output': 'ho'}
{'output': '.'}
{'output': ''}

我们可以看到，第一个数据块包含原始的 "question"，因为它是立即可用的。第二个数据块包含 "context"，因为检索器在第二步完成。最后，generation_chain 的输出一旦可用就会以数据块的形式流式传输。

下一步

现在你已经学会了如何在链中传递数据，以帮助格式化链中流动的数据。

要了解更多信息，请参阅本节中关于可运行对象的其他操操作指南。

流式传输​

下一步​

流式传输

下一步