Arxiv
arXiv is an open-access archive for 2 million scholarly articles in the fields of physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics.
安装与设置
首先,你需要安装 arxiv 个 Python 包。
pip install arxiv
其次,您需要安装 PyMuPDF Python 包,该包可将从 arxiv.org 网站下载的 PDF 文件转换为文本格式。
pip install pymupdf
文档加载器
查看一个 使用示例。
from langchain_community.document_loaders import ArxivLoader
API 参考:ArxivLoader
检索器
查看一个 使用示例。
from langchain_community.retrievers import ArxivRetriever
API 参考:ArxivRetriever