Blaflow 中的加载器组件
info
从 Blaflow 1.1 版本开始,加载器组件现在可以在 Components 菜单的 Bundles 下找到。
加载器从各种来源(如数据库、网站和本地文件)获取数据到 Blaflow 中。
在流程中使用加载器组件
这个流程为加载到流程中的文档创建一个问答聊天机器人。 Unstructured.io 加载器组件从您的本地机器加载文件,然后将它们解析为结构化数据对象的列表。 这些加载的数据用于指导 Open AI 组件对您问题的回答。

Confluence
Confluence 组件与 Confluence wiki 协作平台集成,用于加载和处理文档。它使用 LangChain 的 ConfluenceLoader 从指定的 Confluence 空间获取内容。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| url | 站点 URL | Confluence 空间的基础 URL(例如,https://company.atlassian.net/wiki) |
| username | 用户名 | Atlassian 用户电子邮件(例如,email@example.com) |
| api_key | API 密钥 | Atlassian API 密钥(在 Atlassian 创建 API 密钥) |
| space_key | 空间密钥 | 要访问的 Confluence 空间的密钥 |
| cloud | 使用云? | 是否使用 Confluence Cloud(默认:true) |
| content_format | 内容格式 | 指定内容格式(默认:STORAGE) |
| max_pages | 最大页数 | 要检索的最大页数(默认:1000) |
输出
| 名称 | 显示名称 | 信息 |
|---|---|---|
| data | 数据 | 包含加载的 Confluence 文档的 Data 对象列表 |
GitLoader
GitLoader 组件使用 LangChain 的 GitLoader 从指定的 Git 仓库获取和加载文档。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| repo_path | 仓库路径 | Git 仓库的本地路径 |
| clone_url | 克隆 URL | 克隆 Git 仓库的 URL(可选) |
| branch | 分支 | 要加载文件的分支(默认:'main') |
| file_filter | 文件过滤器 | 过滤文件的模式(例如,'.py' 仅包含 .py 文件,'!.py' 排除 .py 文件) |
| content_filter | 内容过滤器 | 基于文件内容过滤文件的正则表达式模式 |
输出
| 名称 | 显示名称 | 信息 |
|---|---|---|
| data | 数据 | 包含加载的 Git 仓库文档的 Data 对象列表 |
Unstructured
此组件使用 Unstructured.io Serverless API 加载文件并将其解析为结构化数据对象的列表。
输入
| 名称 | 显示名称 | 信息 |
|---|---|---|
| file | 文件 | 要解析的文件路径(支持的类型列在这里) |
| api_key | API 密钥 | Unstructured.io Serverless API 密钥 |
| api_url | Unstructured.io API URL | Unstructured API 的可选 URL |
| chunking_strategy | 分块策略 | 文档分块策略(选项:""、"basic"、"by_title"、"by_page"、"by_similarity") |
| unstructured_args | 附加参数 | Unstructured.io API 的附加参数的可选字典 |
输出
| 名称 | 显示名称 | 信息 |
|---|---|---|
| data | 数据 | 包含从输入文件解析的内容的 Data 对象列表 |