如何在数据集的拆分/过滤视图上进行评估

在数据集的筛选视图上进行评估

您可以使用 list_examples / listExamples 方法从数据集中提取部分样例进行评估。您可以参考上方指南，了解提取样例的各种方法。

一种常见工作流程是获取具有特定元数据键值对的示例。

Python
TypeScript

from langsmith import evaluate

results = evaluate(
    lambda inputs: label_text(inputs["text"]),
    data=client.list_examples(dataset_name=dataset_name, metadata={"desired_key": "desired_value"}),
    evaluators=[correct_label],
    experiment_prefix="Toxic Queries",
)

import { evaluate } from "langsmith/evaluation";

await evaluate((inputs) => labelText(inputs["input"]), {
  data: langsmith.listExamples({
    datasetName: datasetName,
    metadata: {"desired_key": "desired_value"},
  }),
  evaluators: [correctLabel],
  experimentPrefix: "Toxic Queries",
});

如需更高级的筛选功能，请参阅此操操作指南。

在数据集划分上进行评估

您可以使用 list_examples / listExamples 方法对数据集的一个或多个划分进行评估。splits 参数接受您希望评估的划分列表。

Python
TypeScript

from langsmith import evaluate

results = evaluate(
    lambda inputs: label_text(inputs["text"]),
    data=client.list_examples(dataset_name=dataset_name, splits=["test", "training"]),
    evaluators=[correct_label],
    experiment_prefix="Toxic Queries",
)

import { evaluate } from "langsmith/evaluation";

await evaluate((inputs) => labelText(inputs["input"]), {
  data: langsmith.listExamples({
    datasetName: datasetName,
    splits: ["test", "training"],
  }),
  evaluators: [correctLabel],
  experimentPrefix: "Toxic Queries",
});

进一步了解如何获取数据集的视图，请点击此处

如何在数据集的拆分/过滤视图上进行评估

在数据集的筛选视图上进行评估

在数据集划分上进行评估

这个页面对你有帮助吗？

您可以留下详细的反馈在 GitHub 上.

在数据集的筛选视图上进行评估​

在数据集划分上进行评估​

相关​

这个页面对你有帮助吗？

您可以留下详细的反馈 在 GitHub 上.

在数据集的筛选视图上进行评估

在数据集划分上进行评估

相关

您可以留下详细的反馈在 GitHub 上.