Databricks

Databricks Lakehouse Platform unifies data, analytics, and AI on one platform.

本笔记本为快速入门 Databricks LLM 模型提供了简要概述。有关所有功能和配置的详细文档，请参阅 API 参考。

概览

Databricks LLM 类封装了一个完成端点，该端点托管为以下两种端点类型之一：

Databricks 模型服务，推荐用于生产和开发，
集群驱动代理应用程序，推荐用于交互式开发。

此示例笔记本展示了如何包装您的 LLM 端点，并将其用作 LangChain 应用程序中的 LLM。

限制

Databricks LLM 类是遗留实现，并且在功能兼容性方面存在一些限制。

仅支持同步调用。不支持流式或异步 API。
batch API 不受支持。

要使用这些功能，请改用新的 ChatDatabricks 类。ChatDatabricks 支持 ChatModel 的所有 API，包括流式传输、异步、批量等。

设置

要访问 Databricks 模型，你需要创建一个 Databricks 账户、设置凭据（仅当你在 Databricks 工作区之外时），并安装所需的包。

凭据（仅当您在Databricks外部时需要）

如果在 Databricks 内运行 LangChain 应用程序，可以跳过此步骤。

否则，您需要手动将 Databricks 工作区主机名和个人访问令牌分别设置为环境变量 DATABRICKS_HOST 和 DATABRICKS_TOKEN。有关如何获取访问令牌，请参阅身份验证文档。

import getpass
import os

os.environ["DATABRICKS_HOST"] = "https://your-workspace.cloud.databricks.com"
if "DATABRICKS_TOKEN" not in os.environ:
    os.environ["DATABRICKS_TOKEN"] = getpass.getpass(
        "Enter your Databricks access token: "
    )

或者，您可以在初始化 Databricks 类时传递这些参数。

from langchain_community.llms import Databricks

databricks = Databricks(
    host="https://your-workspace.cloud.databricks.com",
    # We strongly recommend NOT to hardcode your access token in your code, instead use secret management tools
    # or environment variables to store your access token securely. The following example uses Databricks Secrets
    # to retrieve the access token that is available within the Databricks notebook.
    token=dbutils.secrets.get(scope="YOUR_SECRET_SCOPE", key="databricks-token"),  # noqa: F821
)

API 参考：Databricks

安装

LangChain Databricks 集成位于 langchain-community 包中。此外，运行此笔记本中的代码还需要 mlflow >= 2.9 。

%pip install -qU langchain-community mlflow>=2.9.0

封装模型服务端点

Prerequisites:

一个大型语言模型（LLM）已被注册并部署到Databricks服务端点。
您对端点拥有“可查询”权限。

预期的MLflow模型签名是：

输入：[{"name": "prompt", "type": "string"}, {"name": "stop", "type": "list[string]"}]
输出: [{"type": "string"}]

调用

from langchain_community.llms import Databricks

llm = Databricks(endpoint_name="YOUR_ENDPOINT_NAME")
llm.invoke("How are you?")

API 参考：Databricks

'I am happy to hear that you are in good health and as always, you are appreciated.'

llm.invoke("How are you?", stop=["."])

'Good'

转换输入和输出

有时您可能需要包装一个与不兼容的模型签名的服务端点，或者您希望插入额外的配置。您可以使用 transform_input_fn 和 transform_output_fn 参数来定义额外的预/后处理。

# Use `transform_input_fn` and `transform_output_fn` if the serving endpoint
# expects a different input schema and does not return a JSON string,
# respectively, or you want to apply a prompt template on top.


def transform_input(**request):
    full_prompt = f"""{request["prompt"]}
    Be Concise.
    """
    request["prompt"] = full_prompt
    return request


def transform_output(response):
    return response.upper()


llm = Databricks(
    endpoint_name="YOUR_ENDPOINT_NAME",
    transform_input_fn=transform_input,
    transform_output_fn=transform_output,
)

llm.invoke("How are you?")

'I AM DOING GREAT THANK YOU.'

大语言模型概念指南
大语言模型操操作指南

概览​

限制​

设置​

凭据（仅当您在Databricks外部时需要）​

安装​

封装模型服务端点​

Prerequisites:​

调用​

转换输入和输出​

相关​

概览

限制

设置

凭据（仅当您在Databricks外部时需要）

安装

封装模型服务端点

Prerequisites:

调用

转换输入和输出

相关