Skip to main content
Open on GitHub

HTML to text

html2text is a Python package that converts a page of HTML into clean, easy-to-read plain ASCII text.

ASCII 也恰好是一种有效的 Markdown(一种文本转HTML的格式)。

安装与设置

pip install html2text

文档转换器

查看一个 使用示例

from langchain_community.document_loaders import Html2TextTransformer