ReadTheDocs 文档
Read the Docs is an open-sourced free software documentation hosting platform. It generates documentation written with the
Sphinxdocumentation generator.
本笔记本介绍如何加载作为 Read-The-Docs 构建一部分生成的 HTML 内容。
有关此方面的实际示例,请参阅此处。
这假设 HTML 已经被抓取到一个文件夹中。这可以通过取消注释并运行以下命令来完成
%pip install --upgrade --quiet beautifulsoup4
#!wget -r -A.html -P rtdocs https://python.langchain.com/en/latest/
from langchain_community.document_loaders import ReadTheDocsLoader
API 参考:ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs")
docs = loader.load()