提供者更多HTML转文本On this pageHTML to text html2text is a Python package that converts a page of HTML into clean, easy-to-read plain ASCII text. ASCII 也恰好是一种有效的 Markdown(一种文本转HTML的格式)。 安装与设置 pip install html2text 文档转换器 查看一个 使用示例。 from langchain_community.document_loaders import Html2TextTransformer