Blaflow 中的嵌入模型
嵌入模型将文本转换为数值向量。这些嵌入捕捉输入文本的语义含义,使 LLM 能够理解上下文。
有关参数的更多信息,请参阅特定组件的文档。
在流程中使用嵌入模型组件
在这个文档摄取管道的示例中,OpenAI嵌入模型连接到向量数据库。该组件将文本块转换为向量并存储在向量数据库中。向量化数据可用于通知 AI 工作负载,如聊天机器人、相似性搜索和智能体。
此嵌入组件使用 OpenAI API 密钥进行身份验证。有关身份验证的更多信息,请参阅特定嵌入组件的文档。

AI/ML
此组件使用AI/ML API生成嵌入。
输入
| 名称 | 类型 | 描述 |
|---|---|---|
| model_name | 字符串 | 要使用的 AI/ML 嵌入模型名称 |
| aiml_api_key | 秘密字符串 | 用于与 AI/ML 服务进行身份验证的 API 密钥 |
输出
| 名称 | 类型 | 描述 |
|---|---|---|
| embeddings | 嵌入 | 用于生成嵌入的 AIML 嵌入 Impl 实例 |
Amazon Bedrock 嵌入
此组件用于从Amazon Bedrock加载嵌入模型。
输入
| 名称 | 类型 | 描述 |
|---|---|---|
| credentials_profile_name | 字符串 | |
| model_id | 字符串 | 要调用的模型 ID,例如amazon.titan-embed-text-v1。这等同于list-foundation-models API 中的modelId属性 |
| endpoint_url | 字符串 | 设置特定服务端点的 URL,而非默认的 AWS 端点 |
| region_name | 字符串 | 要使用的 AWS 区域,例如us-west-2。如果未提供,则回退到AWS_DEFAULT_REGION环境变量或~/.aws/config 中指定的区域 |
输出
| 名称 | 类型 | 描述 |
|---|---|---|
| embeddings | 嵌入 | 使用 Amazon Bedrock 生成嵌入的实例 |
Astra DB 向量化
important
自 Blaflow 1.1.2 版本起,此组件已弃用。 请改用Astra DB 向量存储组件
将此组件连接到Astra DB 向量存储组件的嵌入端口以生成嵌入。
此组件要求您的 Astra DB 数据库具有使用向量化嵌入提供程序集成的集合。 有关更多信息和说明,请参阅嵌入生成。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| provider | 嵌入提供程序 | 要使用的嵌入提供程序 |
| model_name | 模型名称 | 要使用的嵌入模型 |
| authentication | 身份验证 | Astra 中存储向量化嵌入提供程序凭据的 API 密钥名称。(如果使用Astra 托管的嵌入提供程序,则不需要。) |
| provider_api_key | 提供程序 API 密钥 | 作为authentication的替代方案,直接提供您的嵌入提供程序凭据。 |
| model_parameters | 模型参数 | 额外的模型参数 |
输出
| 名称 | 类型 | 描述 | | ---------- | ---- | ------------------------------- | --- | --- | | embeddings | 嵌入 | 使用 Astra 向量化生成嵌入的实例 | | |
Azure OpenAI 嵌入
此组件使用 Azure OpenAI 模型生成嵌入。
输入
| 名称 | 类型 | 描述 |
|---|---|---|
| 模式 l | 字符串 | 要使用的模型名称(默认:text-embedding-3-small) |
| Azure Endpoint | 字符串 | 您的 Azure 端点,包括资源。示例:https://example-resource.azure.openai.com/ |
| Deployment Name | 字符串 | 部署名称 |
| API Version | 字符串 | 要使用的 API 版本,选项包括各种日期 |
| API Key | 字符串 | 访问 Azure OpenAI 服务的 API 密钥 |
输出
| 名称 | 类型 | 描述 |
|---|---|---|
| embeddings | 嵌入 | 使用 Azure OpenAI 生成嵌入的实例 |
Cloudflare Workers AI 嵌入
此组件使用Cloudflare Workers AI 模型生成嵌入。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| account_id | Cloudflare 账户 ID | 查找您的 Cloudflare 账户 ID |
| api_token | Cloudflare API 令牌 | 创建 API 令牌 |
| model_name | 模型名称 | 支持的模型列表 |
| strip_new_lines | 去除换行符 | 是否从输入文本中去除换行符 |
| batch_size | 批量大小 | 每批中要嵌入的文本数量 |
| api_base_url | Cloudflare API 基础 URL | Cloudflare API 的基础 URL |
| headers | 请求头 | 额外的请求头 |
输出
| 名称 | 显示名称 | 信息 |
|---|---|---|
| embeddings | 嵌入 | 使用 Cloudflare Workers 生成嵌入的实例 |
Cohere 嵌入
此组件用于从Cohere加载嵌入模型。
输入
| 名称 | 类型 | 描述 |
|---|---|---|
| cohere_api_key | 字符串 | 与 Cohere 服务进行身份验证所需的 API 密钥 |
| model | 字符串 | 用于嵌入文本文档和执行查询的语言模型(默认:embed-english-v2.0) |
| truncate | 布尔值 | 是否截断输入文本以适应模型的约束(默认:False) |
输出
| 名称 | 类型 | 描述 |
|---|---|---|
| embeddings | 嵌入 | 使用 Cohere 生成嵌入的实例 |
嵌入相似度
此组件计算两个嵌入向量之间选定形式的相似度。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| embedding_vectors | 嵌入向量 | 包含要比较的两个嵌入向量的数据对象的列表。 |
| similarity_metric | 相似度度量 | 选择要使用的相似度度量。选项:"余弦相似度"、"欧几里得距离"、"曼哈顿距离"。 |