Skip to main content
Open In ColabOpen on GitHub

AWS S3 目录

Amazon Simple Storage Service (Amazon S3) is an object storage service

AWS S3 Directory

这涵盖了如何从 AWS S3 Directory 对象加载文档对象。

%pip install --upgrade --quiet  boto3
from langchain_community.document_loaders import S3DirectoryLoader
API 参考:S3DirectoryLoader
loader = S3DirectoryLoader("testing-hwc")
loader.load()

指定前缀

您还可以指定前缀,以更精细地控制要加载的文件。

loader = S3DirectoryLoader("testing-hwc", prefix="fake")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': 's3://testing-hwc/fake.docx'}, lookup_index=0)]

配置 AWS Boto3 客户端

您可以通过在创建 S3DirectoryLoader 时传递命名参数来配置 AWS Boto3 客户端。 例如,当无法将 AWS 凭证设置为环境变量时,这非常有用。 请参阅可配置的参数列表

loader = S3DirectoryLoader(
"testing-hwc", aws_access_key_id="xxxx", aws_secret_access_key="yyyy"
)
loader.load()