MyScale
本页面介绍如何在 LangChain 中使用 MyScale 向量数据库。 内容分为两部分:安装与设置,以及对特定 MyScale 封装器的引用。
使用 MyScale,您可以同时管理结构化和非结构化(向量化)数据,并通过 SQL 对这两种类型的数据执行联合查询和分析。此外,MyScale 基于 ClickHouse 构建的云原生 OLAP 架构,即使在处理海量数据集时也能实现闪电般的快速数据处理。
简介
您现在可以在我们的SaaS平台上注册并立即启动集群!
如果你也对我们如何将SQL和向量集成感兴趣,请参阅此文档以获取更多语法参考。
我们还在Huggingface上提供实时演示!请查看我们的Huggingface空间!它们可以在瞬间搜索数百万个向量!
安装与设置
- 使用
pip install clickhouse-connect安装 Python SDK
设置环境
有两种方法可以为 myscale 索引设置参数。
-
环境变量
在运行应用程序之前,请使用
export设置环境变量:export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...您可以轻松在我们的SaaS平台上找到您的账户、密码及其他信息。详情请参阅此文档。
MyScaleSettings下的所有属性都可以使用前缀MYSCALE_进行设置,并且不区分大小写。 -
使用参数创建
MyScaleSettings对象from langchain_community.vectorstores import MyScale, MyScaleSettings
config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
index = MyScale(embedding_function, config)
index.add_documents(...)
包装器
支持的功能:
add_textsadd_documentsfrom_textsfrom_documentssimilarity_searchasimilarity_searchsimilarity_search_by_vectorasimilarity_search_by_vectorsimilarity_search_with_relevance_scoresdelete
VectorStore
围绕 MyScale 数据库有一个封装器,允许你将其用作向量存储,无论是用于语义搜索还是类似示例的检索。
要导入此向量存储:
from langchain_community.vectorstores import MyScale
API 参考:MyScale
有关 MyScale 封装的更详细演练,请参阅 此笔记本