Skip to main content

Blaflow 中的向量存储组件

向量数据库存储向量数据,支持聊天机器人和检索增强生成(RAG)等 AI 工作负载。

向量数据库组件用于建立与现有向量数据库的连接,或创建内存向量存储,以存储和检索向量数据。

向量数据库组件与记忆组件不同,后者专门用于从外部数据库存储和检索聊天消息。

在流程中使用向量存储组件

本示例使用 Astra DB 向量存储 组件。您的向量存储组件的参数和身份验证可能不同,但文档摄取工作流是相同的。文档从本地机器加载并分块。Astra DB 向量存储使用连接的模型组件生成嵌入,并将其存储在连接的 Astra DB 数据库中。

这些向量数据随后可用于检索增强生成等工作负载。

用户的聊天输入被嵌入,并与文档摄取期间嵌入的向量进行相似性搜索比较。 结果从向量数据库组件输出为数据对象,并解析为文本。 此文本填充提示词组件中的 {context} 变量,从而指导 Open AI 模型 组件的响应。

或者,将向量数据库组件的 Retriever 端口连接到检索工具,然后连接到智能体组件。这使智能体能够将您的向量数据库作为工具使用,并根据可用数据做出决策。

Astra DB 向量存储

此组件使用 Astra DB 实现具有搜索功能的向量存储。

更多信息,请参阅 DataStax 文档

输入

名称显示名称信息
tokenAstra DB 应用令牌用于访问 Astra DB 的身份验证令牌。
environment环境Astra DB API 端点的环境。例如,devprod
database_name数据库Astra DB 实例的数据库名称。
api_endpointAstra DB API 端点Astra DB 实例的 API 端点。此选项会覆盖数据库选择。
collection_name集合Astra DB 中存储向量的集合名称。
keyspace键空间Astra DB 中用于集合的可选键空间。
embedding_choice嵌入模型或 Astra Vectorize选择嵌入模型或使用 Astra vectorize。
embedding_model嵌入模型指定嵌入模型。Astra vectorize 集合不需要。
number_of_results搜索结果数量返回的搜索结果数量(默认:4)。
search_type搜索类型使用的搜索类型。选项包括 SimilaritySimilarity with score thresholdMMR (Max Marginal Relevance)
search_score_threshold搜索分数阈值使用 Similarity with score threshold 选项时,搜索结果的最小相似度分数阈值。
advanced_search_filter搜索元数据过滤器应用于搜索查询的可选过滤器字典。
autodetect_collection自动检测集合确定是否自动检测集合的布尔标志。
content_field内容字段用作向量存储文本内容字段的字段。
deletion_field基于字段删除提供时,在加载新数据之前,将删除目标集合中元数据字段值与输入元数据字段值匹配的文档。
ignore_invalid_documents忽略无效文档确定是否在运行时忽略无效文档的布尔标志。
astradb_vectorstore_kwargsAstraDBVectorStore 参数AstraDBVectorStore 的附加参数的可选字典。

输出

名称显示名称信息
vector_store向量存储使用指定参数配置的 Astra DB 向量存储实例。
search_results搜索结果相似性搜索结果,作为数据对象列表。

生成嵌入

Astra DB 向量存储 组件提供两种生成嵌入的方法。

  1. 嵌入模型:通过连接 Blaflow 中的嵌入组件使用您自己的嵌入模型。

  2. Astra Vectorize:使用 Astra DB 的内置嵌入生成服务。创建新集合时,选择嵌入提供程序和模型,包括 Datastax 托管的 NVIDIA NV-Embed-QA 模型。

important

嵌入模型选择在创建新集合时进行,之后无法更改。

有关使用 Astra DB 向量存储 组件与嵌入模型的示例,请参阅向量存储 RAG 入门项目

更多信息,请参阅 Astra DB Serverless 文档

混合搜索

Astra DB 组件包含默认启用的混合搜索

与混合搜索相关的组件字段包括 Search QueryLexical TermsReranker

  • Search Query 通过向量相似性查找结果。
  • Lexical Terms 是逗号分隔的关键词字符串,如 features, data, attributes, characteristics
  • Reranker 是混合搜索中使用的重排序模型。 重排序模型为 nvidia/llama-3.2-nv.reranker

混合搜索执行向量相似性搜索和词汇搜索,比较两种搜索结果,然后返回整体最相关的结果。

要在 Astra DB 组件中使用混合搜索,请按以下步骤操作:

  1. 点击 New Flow > RAG > Hybrid Search RAG
  2. OpenAI 模型组件中,添加您的 OpenAI API 密钥
  3. Astra DB 向量存储组件中,添加您的 Astra DB 应用令牌
  4. Database 字段中,选择您的数据库。
  5. Collection 字段中,选择要搜索的集合。 创建集合时必须启用混合搜索支持。
  6. 试运行中,输入关于数据的问题,例如 What are the features of my data? 您的查询将发送到两个组件:OpenAI 模型组件和 Astra DB 向量数据库组件。 OpenAI 组件包含一个提示,用于从您的输入创建词汇查询:

_10
You are a database query planner that takes a user's requests, and then converts to a search against the subject matter in question.
_10
You should convert the query into:
_10
1. A list of keywords to use against a Lucene text analyzer index, no more than 4. Strictly unigrams.
_10
2. A question to use as the basis for a QA embedding engine.
_10
Avoid common keywords associated with the user's subject matter.

  1. 要查看 OpenAI 组件从您的集合生成的关键词和问题,请在 OpenAI 组件中点击

_10
1. Keywords: features, data, attributes, characteristics
_10
2. Question: What characteristics can be identified in my data?

  1. 要查看从 OpenAI 组件响应生成的DataFrame,请在结构化输出组件中点击 。 DataFrame 传递给解析器组件,该组件将 Keywords 列的内容解析为字符串。

    此逗号分隔的单词字符串传递给 Astra DB 组件的 Lexical Terms 端口。 注意,Astra DB 端口的 Search Query 端口连接到步骤 6 中的 聊天输入 组件。 此 Search Query 被向量化,Search QueryLexical Terms 内容都发送到 find_and_rerank 端点的重排序器。

    重排序器将向量搜索结果与词汇搜索的术语字符串进行比较。 混合搜索的最高排名结果将返回给 试运行

更多信息,请参阅 DataStax 文档

AstraDB 图向量存储

此组件使用 AstraDB 实现具有图功能的向量存储。 更多信息,请参阅 Astra DB Serverless 文档

输入

名称显示名称信息
collection_name集合名称AstraDB 中存储向量的集合名称(必需)
tokenAstra DB 应用令牌用于访问 AstraDB 的身份验证令牌(必需)
api_endpointAPI 端点AstraDB 服务的 API 端点 URL(必需)
search_input搜索输入相似性搜索的查询字符串
ingest_data摄取数据要摄取到向量存储的数据
namespace命名空间AstraDB 中用于集合的可选命名空间
embedding嵌入模型使用的嵌入模型
metric度量向量比较的距离度量(选项:"cosine"、"euclidean"、"dot_product")
setup_mode设置模式向量存储的配置模式(选项:"Sync"、"Async"、"Off")
pre_delete_collection预删除集合确定是否在创建新集合前删除集合的布尔标志
number_of_results结果数量相似性搜索返回的结果数量(默认:4)
search_type搜索类型使用的搜索类型(选项:"Similarity"、"Graph Traversal"、"Hybrid")
traversal_depth遍历深度图遍历搜索的最大深度(默认:1)
search_score_threshold搜索分数阈值搜索结果的最小相似度分数阈值
search_filter搜索元数据过滤器应用于搜索查询的可选过滤器字典

输出

名称显示名称信息
vector_store向量存储使用指定参数配置的 Astra DB 图向量存储实例。
search_results搜索结果相似性搜索结果,作为 数据 对象列表。

Cassandra

此组件创建具有搜索功能的 Cassandra 向量存储。 更多信息,请参阅 Cassandra 文档

输入

名称类型描述
database_ref字符串数据库的联系点或 AstraDB 数据库 ID
username字符串数据库的用户名(AstraDB 留空)
tokenSecretString数据库的用户密码或 AstraDB 令牌
keyspace字符串表键空间或 AstraDB 命名空间
table_name字符串表或 AstraDB 集合的名称
ttl_seconds整数添加文本的生存时间
batch_size整数单批处理的数据数量
setup_mode字符串Cassandra 表的配置模式
cluster_kwargs字典Cassandra 集群的附加关键字参数
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量
search_type字符串执行的搜索类型
search_score_threshold浮点数搜索结果的最小相似度分数
search_filter字典搜索查询的元数据过滤器
body_search字符串文档文本搜索词
enable_body_search布尔值启用正文搜索的标志

输出

名称类型描述
vector_storeCassandra使用指定参数配置的 Cassandra 向量存储实例。
search_resultsList[数据]相似性搜索结果,作为 数据 对象列表。

Cassandra 图向量存储

此组件实现具有搜索功能的 Cassandra 图向量存储。

输入

名称显示名称信息
database_ref联系点 / Astra 数据库 ID数据库的联系点或 AstraDB 数据库 ID(必需)
username用户名数据库的用户名(AstraDB 留空)
token密码 / AstraDB 令牌数据库的用户密码或 AstraDB 令牌(必需)
keyspace键空间表键空间或 AstraDB 命名空间(必需)
table_name表名存储向量的表或 AstraDB 集合的名称(必需)
setup_mode设置模式Cassandra 表的配置模式(选项:"Sync"、"Off",默认:"Sync")
cluster_kwargs集群参数Cassandra 集群的附加关键字参数的可选字典
search_query搜索查询相似性搜索的查询字符串
ingest_data摄取数据要摄取到向量存储的数据(数据 对象列表)
embedding嵌入使用的嵌入模型
number_of_results结果数量相似性搜索返回的结果数量(默认:4)
search_type搜索类型使用的搜索类型(选项:"Traversal"、"MMR traversal"、"Similarity"、"Similarity with score threshold"、"MMR (Max Marginal Relevance)",默认:"Traversal")
depth遍历深度要遍历的边的最大深度(用于 "Traversal" 或 "MMR traversal" 搜索类型,默认:1)
search_score_threshold搜索分数阈值搜索结果的最小相似度分数阈值(用于 "Similarity with score threshold" 搜索类型)
search_filter搜索元数据过滤器应用于搜索查询的可选过滤器字典

输出

名称显示名称信息
vector_store向量存储使用指定参数配置的 Cassandra 图向量存储实例。
search_results搜索结果相似性搜索结果,作为 数据 对象列表。

Chroma DB

此组件创建具有搜索功能的 Chroma 向量存储。 更多信息,请参阅 Chroma 文档

输入

名称类型描述
collection_name字符串Chroma 集合的名称。默认:"blaflow"。
persist_directory字符串持久化 Chroma 数据库的目录。
search_query字符串在向量存储中搜索的查询。
ingest_data数据要摄取到向量存储的数据(数据 对象列表)。
embedding嵌入用于向量存储的嵌入函数。
chroma_server_cors_allow_origins字符串Chroma 服务器的 CORS 允许源。
chroma_server_host字符串Chroma 服务器的主机。
chroma_server_http_port整数Chroma 服务器的 HTTP 端口。
chroma_server_grpc_port整数Chroma 服务器的 gRPC 端口。
chroma_server_ssl_enabled布尔值启用 Chroma 服务器的 SSL。
allow_duplicates布尔值允许向量存储中的重复文档。
search_type字符串执行的搜索类型:"Similarity" 或 "MMR"。
number_of_results整数搜索返回的结果数量。默认:10。
limit整数当"允许重复"为 False 时,限制比较的记录数量。

输出

名称类型描述
vector_storeChromaChroma 向量存储实例
search_results数据列表相似性搜索结果

Clickhouse

该组件实现具有搜索功能的 Clickhouse 向量存储。 更多信息,请参阅 Clickhouse 文档

输入

名称显示名称信息
host主机名Clickhouse 服务器主机名(必需,默认:"localhost")
port端口Clickhouse 服务器端口(必需,默认:8123)
database数据库Clickhouse 数据库名称(必需)
table表名Clickhouse 表名(必需)
usernameClickHouse 用户名用于身份验证的用户名(必需)
password用户密码用于身份验证的密码(必需)
index_type索引类型索引类型(选项:"annoy"、"vector_similarity",默认:"annoy")
metric距离度量计算距离的度量(选项:"angular"、"euclidean"、"manhattan"、"hamming"、"dot",默认:"angular")
secure使用 https/TLS覆盖从接口或端口参数推断的值(默认:false)
index_param索引参数索引参数(默认:"'L2Distance',100")
index_query_params索引查询参数额外的索引查询参数
search_query搜索查询相似性搜索的查询字符串
ingest_data摄取数据要摄取到向量存储的数据
embedding嵌入要使用的嵌入模型
number_of_results结果数量相似性搜索返回的结果数量(默认:4)
score_threshold分数阈值相似性分数的阈值

输出

名称显示名称信息
vector_store向量存储构建的 Clickhouse 向量存储
search_results搜索结果相似性搜索结果,作为 数据 对象列表

Couchbase

该组件创建具有搜索功能的 Couchbase 向量存储。 更多信息,请参阅 Couchbase 文档

输入

名称类型描述
couchbase_connection_stringSecretStringCouchbase 集群连接字符串(必需)。
couchbase_username字符串Couchbase 用户名(必需)。
couchbase_passwordSecretStringCouchbase 密码(必需)。
bucket_name字符串Couchbase 存储桶名称(必需)。
scope_name字符串Couchbase 作用域名称(必需)。
collection_name字符串Couchbase 集合名称(必需)。
index_name字符串Couchbase 索引名称(必需)。
search_query字符串在向量存储中搜索的查询。
ingest_data数据要摄取到向量存储的数据(数据 对象列表)。
embedding嵌入用于向量存储的嵌入函数。
number_of_results整数搜索返回的结果数量。默认:4(高级)。

输出

名称类型描述
vector_storeCouchbaseVectorStore使用指定参数配置的 Couchbase 向量存储实例。

Elasticsearch

该组件创建具有搜索功能的 Elasticsearch 向量存储。 更多信息,请参阅 Elasticsearch 文档

输入

名称类型描述
es_url字符串Elasticsearch 服务器 URL
es_user字符串Elasticsearch 身份验证用户名
es_passwordSecretStringElasticsearch 身份验证密码
index_name字符串Elasticsearch 索引名称
strategy字符串向量搜索策略("approximate_k_nearest_neighbors" 或 "script_scoring")
distance_strategy字符串距离计算策略("COSINE"、"EUCLIDEAN_DISTANCE"、"DOT_PRODUCT")
search_query字符串相似性搜索查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入要使用的嵌入函数
number_of_results整数搜索返回的结果数量(默认:4)

输出

名称类型描述
vector_storeElasticsearchStoreElasticsearch 向量存储实例
search_results数据列表相似性搜索结果

FAISS

该组件创建具有搜索功能的 FAISS 向量存储。 更多信息,请参阅 FAISS 文档

输入

名称类型描述
index_name字符串FAISS 索引的名称。默认:"blaflow_index"。
persist_directory字符串保存 FAISS 索引的路径。相对于 Blaflow 运行位置。
search_query字符串在向量存储中搜索的查询。
ingest_data数据要摄取到向量存储的数据(数据 对象或文档列表)。
allow_dangerous_deserialization布尔值设置为 True 以允许从不受信任的来源加载 pickle 文件。默认:True(高级)。
embedding嵌入用于向量存储的嵌入函数。
number_of_results整数搜索返回的结果数量。默认:4(高级)。

输出

名称类型描述
vector_storeFAISS使用指定参数配置的 FAISS 向量存储实例。

Graph RAG

该组件在向量存储中执行 Graph RAG(检索增强生成)遍历,实现基于图的文档检索。 更多信息,请参阅 Graph RAG 文档

示例流程请参考 Graph RAG 模板。

输入

名称显示名称信息
embedding_model嵌入模型指定嵌入模型。对于使用 Astra vectorize 嵌入的集合,此参数不是必需的。
vector_store向量存储连接向量存储的连接。
edge_definition边定义图遍历的边定义。更多信息请参阅 GraphRAG 文档
strategy遍历策略用于图遍历的策略。策略选项从可用策略中动态加载。
search_query搜索查询在向量存储中搜索的查询。
graphrag_strategy_kwargs策略参数检索策略的额外参数字典(可选)。更多信息请参阅策略文档

输出

名称类型描述
search_results数据列表基于图的文档检索结果,作为数据 对象列表。

超融合数据库

此组件使用 HCD 实现向量存储。

要使用 HCD 向量存储,请添加您的部署的集合名称、用户名、密码和 HCD 数据 API 端点。 端点必须格式化为 http[s]://**DOMAIN_NAME** 或 **IP_ADDRESS**[:port],例如,http://192.0.2.250:8181

DOMAIN_NAMEIP_ADDRESS 替换为您的 HCD 数据 API 连接的域名或 IP 地址。

要将 HCD 向量存储用于嵌入摄取,请将其连接到嵌入模型和文件加载器:

HCD 向量存储嵌入摄取

输入

名称显示名称信息
collection_name集合名称HCD 中存储向量的集合名称(必需)
usernameHCD 用户名用于访问 HCD 的身份验证用户名(默认:"hcd-superuser",必需)
passwordHCD 密码用于访问 HCD 的身份验证密码(必需)
api_endpointHCD API 端点HCD 服务的 API 端点 URL(必需)
search_input搜索输入相似性搜索的查询字符串
ingest_data摄取数据要摄取到向量存储的数据
namespace命名空间HCD 中用于集合的可选命名空间(默认:"default_namespace")
ca_certificateCA 证书用于 HCD TLS 连接的可选 CA 证书
metric距离度量向量比较的可选距离度量(选项:"cosine"、"dot_product"、"euclidean")
batch_size批处理大小单批处理数据的可选数量
bulk_insert_batch_concurrency批量插入并发数批量插入操作的可选并发级别
bulk_insert_overwrite_concurrency批量覆盖插入并发数覆盖现有数据的批量插入操作的可选并发级别
bulk_delete_concurrency批量删除并发数批量删除操作的可选并发级别
setup_mode设置模式向量存储的配置模式(选项:"Sync"、"Async"、"Off",默认:"Sync")
pre_delete_collection预删除集合确定是否在创建新集合前删除集合的布尔标志
metadata_indexing_include元数据索引包含要包含在索引中的元数据字段的可选列表
embedding嵌入向量或 Astra Vectorize允许嵌入模型或 Astra Vectorize 配置
metadata_indexing_exclude元数据索引排除要从索引中排除的元数据字段的可选列表
collection_indexing_policy集合索引策略定义集合索引策略的可选字典
number_of_results结果数量相似性搜索返回的结果数量(默认:4)
search_type搜索类型使用的搜索类型(选项:"Similarity"、"Similarity with score threshold"、"MMR (Max Marginal Relevance)",默认:"Similarity")
search_score_threshold搜索分数阈值搜索结果的最小相似度分数阈值(默认:0)
search_filter搜索元数据过滤器应用于搜索查询的可选过滤器字典

输出

名称显示名称信息
vector_store向量存储配置了指定参数的 HCD 向量存储实例。相似性搜索结果作为 数据 对象列表。
search_results搜索结果相似性搜索结果作为 数据 对象列表。

Milvus

此组件创建具有搜索功能的 Milvus 向量存储。 更多信息,请参阅 Milvus 文档

输入

名称类型描述
collection_name字符串Milvus 集合的名称
collection_description字符串Milvus 集合的描述
uri字符串Milvus 的连接 URI
passwordSecretStringMilvus 的密码
usernameSecretStringMilvus 的用户名
batch_size整数单批处理的数据数量
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量
search_type字符串执行的搜索类型
search_score_threshold浮点数搜索结果的最小相似度分数
search_filter字典搜索查询的元数据过滤器
setup_mode字符串向量存储的配置模式
vector_dimensions整数向量的维度数量
pre_delete_collection布尔值是否在创建新集合前删除集合

输出

名称类型描述
vector_storeMilvus使用指定参数配置的 Milvus 向量存储实例。

MongoDB Atlas

此组件创建具有搜索功能的 MongoDB Atlas 向量存储。 更多信息,请参阅 MongoDB Atlas 文档

输入

名称类型描述
mongodb_atlas_cluster_uriSecretStringMongoDB Atlas 集群的连接 URI(必需)
enable_mtls布尔值启用相互 TLS 身份验证(默认:false)
mongodb_atlas_client_certSecretString用于 mTLS 身份验证的客户端证书和私钥组合(如果启用 mTLS 则必需)
db_name字符串要使用的数据库名称(必需)
collection_name字符串要使用的集合名称(必需)
index_name字符串Atlas Search 索引的名称,应该是向量搜索(必需)
insert_mode字符串如何将新文档插入集合(选项:"append"、"overwrite",默认:"append")
embedding嵌入要使用的嵌入模型
number_of_results整数相似性搜索返回的结果数量(默认:4)
index_field字符串要索引的字段(默认:"embedding")
filter_field字符串用于过滤索引的字段
number_dimensions整数嵌入上下文长度(默认:1536)
similarity字符串用于测量向量之间相似性的方法(选项:"cosine"、"euclidean"、"dotProduct",默认:"cosine")
quantization字符串量化通过将 32 位浮点数转换为较小的数据类型来减少内存成本(选项:"scalar"、"binary")

输出

名称类型描述
vector_storeMongoDBAtlasVectorSearchMongoDB Atlas 向量存储实例
search_resultsList[数据]相似性搜索结果

Opensearch

此组件创建具有搜索功能的 Opensearch 向量存储 更多信息,请参阅 Opensearch 文档

输入

名称类型描述
opensearch_url字符串OpenSearch 集群的 URL(例如 https://192.168.1.1:9200)
index_name字符串向量将存储在 OpenSearch 集群中的索引名称
search_input字符串输入搜索查询。留空以检索所有文档或如果使用混合搜索
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
search_type字符串有效值为 "similarity"、"similarity_score_threshold"、"mmr"
number_of_results整数搜索返回的结果数量
search_score_threshold浮点数搜索结果的最小相似度分数阈值
username字符串OpenSearch 集群的用户名
passwordSecretStringOpenSearch 集群的密码
use_ssl布尔值使用 SSL
verify_certs布尔值验证证书
hybrid_search_query字符串以 JSON 格式提供自定义混合搜索查询。这允许您结合向量相似性和关键词匹配

输出

名称类型描述
vector_storeOpenSearchVectorSearchOpenSearch 向量存储实例
search_resultsList[数据]相似性搜索结果

PGVector

此组件创建具有搜索功能的 PGVector 向量存储。 更多信息,请参阅 PGVector 文档

输入

名称类型描述
pg_server_urlSecretStringPostgreSQL 服务器连接字符串
collection_name字符串向量存储的表名
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storePGVectorPGVector 向量存储实例
search_resultsList[数据]相似性搜索结果

Pinecone

此组件创建具有搜索功能的 Pinecone 向量存储。 更多信息,请参阅 Pinecone 文档

输入

名称类型描述
index_name字符串Pinecone 索引的名称
namespace字符串索引的命名空间
distance_strategy字符串计算向量之间距离的策略
pinecone_api_keySecretStringPinecone 的 API 密钥
text_key字符串记录中用作文本的键
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storePineconePinecone 向量存储实例
search_resultsList[数据]相似性搜索结果

Qdrant

此组件创建具有搜索功能的 Qdrant 向量存储。 更多信息,请参阅 Qdrant 文档

输入

名称类型描述
collection_name字符串Qdrant 集合的名称
host字符串Qdrant 服务器主机
port整数Qdrant 服务器端口
grpc_port整数Qdrant gRPC 端口
api_keySecretStringQdrant 的 API 密钥
prefix字符串Qdrant 的前缀
timeout整数Qdrant 操作的超时时间
path字符串Qdrant 的路径
url字符串Qdrant 的 URL
distance_func字符串向量相似性的距离函数
content_payload_key字符串内容载荷的键
metadata_payload_key字符串元数据载荷的键
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storeQdrantQdrant 向量存储实例
search_resultsList[数据]相似性搜索结果

Redis

此组件创建具有搜索功能的 Redis 向量存储。 更多信息,请参阅 Redis 文档

输入

名称类型描述
redis_server_urlSecretStringRedis 服务器连接字符串
redis_index_name字符串Redis 索引的名称
code字符串Redis 的自定义代码(高级)
schema字符串Redis 索引的模式
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
number_of_results整数搜索返回的结果数量
embedding嵌入使用的嵌入函数

输出

名称类型描述
vector_storeRedisRedis 向量存储实例
search_resultsList[数据]相似性搜索结果

Supabase

此组件创建与具有搜索功能的 Supabase 向量存储的连接。 更多信息,请参阅 Supabase 文档

输入

名称类型描述
supabase_url字符串Supabase 实例的 URL
supabase_service_keySecretStringSupabase 身份验证的服务密钥
table_name字符串Supabase 中表的名称
query_name字符串要使用的查询名称
search_query字符串相似性搜索的查询
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storeSupabaseVectorStoreSupabase 向量存储实例
search_resultsList[数据]相似性搜索结果

Upstash

此组件创建具有搜索功能的 Upstash 向量存储。 更多信息,请参阅 Upstash 文档

输入

名称类型描述
index_url字符串Upstash 索引的 URL
index_tokenSecretStringUpstash 索引的令牌
text_key字符串记录中用作文本的键
namespace字符串索引的命名空间
search_query字符串相似性搜索的查询
metadata_filter字符串按元数据过滤文档
ingest_data数据要摄取到向量存储的数据
embedding嵌入使用的嵌入函数(可选)
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storeUpstashVectorStoreUpstash 向量存储实例
search_resultsList[数据]相似性搜索结果

Vectara

此组件创建具有搜索功能的 Vectara 向量存储。 更多信息,请参阅 Vectara 文档

输入

名称类型描述
vectara_customer_id字符串Vectara 客户 ID
vectara_corpus_id字符串Vectara 语料库 ID
vectara_api_keySecretStringVectara API 密钥
embedding嵌入使用的嵌入函数(可选)
ingest_dataList[数据/数据]要摄取到向量存储的数据
search_query字符串相似性搜索的查询
number_of_results整数搜索返回的结果数量

输出

名称类型描述
vector_storeVectaraVectorStoreVectara 向量存储实例
search_resultsList[数据]相似性搜索结果

此组件基于提供的输入在 Vectara 向量存储中搜索文档。 更多信息,请参阅 Vectara 文档

输入

名称类型描述
search_typeString搜索类型,如 "Similarity" 或 "MMR"
input_valueString搜索查询
vectara_customer_idStringVectara 客户 ID
vectara_corpus_idStringVectara 语料库 ID
vectara_api_keySecretStringVectara API 密钥
files_urlList[String]文件初始化的可选 URL 列表

输出

名称类型描述
search_resultsList[数据]相似性搜索结果

Weaviate

此组件促进 Weaviate 向量存储设置,优化文本和文档索引和检索。 更多信息,请参阅 Weaviate 文档

输入

名称类型描述
weaviate_urlString默认实例 URL
search_by_textBoolean指示是否按文本搜索
api_keySecretString身份验证的可选 API 密钥
index_nameString可选索引名称
text_keyString默认文本提取键
input数据文档或记录
embedding嵌入使用的嵌入函数
attributesList[String]可选附加属性

输出

名称类型描述
vector_storeWeaviateVectorStoreWeaviate 向量存储实例

此组件在 Weaviate 向量存储中搜索与输入相似的文档。 更多信息,请参阅 Weaviate 文档

输入

名称类型描述
search_typeString搜索类型,如 "Similarity" 或 "MMR"
input_valueString搜索查询
weaviate_urlString默认实例 URL
search_by_textBoolean指示是否按文本搜索
api_keySecretString身份验证的可选 API 密钥
index_nameString可选索引名称
text_keyString默认文本提取键
embedding嵌入使用的嵌入函数
attributesList[String]可选附加属性

输出

名称类型描述
search_resultsList[数据]相似性搜索结果