在工作流中使用 SoMark 文档解析工具
激活 SoMark 文档解析工具
点击去激活,填写密钥配置:
- Base URL:使用 SoMark API 时填写
https://somark.ai/api/v1; 私有化部署时填写本地部署的 Base URL。 - API Key:使用 SoMark API 时填写;私有化部署无需填写。
还没有 API Key?前往 SoMark API 工作台获取 API Key。免费额度无需领取,会自动发放到账户(每日 500 页、每月 2000 页)。

插件参数与输出
输入参数
| 参数 | 类型 | 必填 | 默认值 | 说明 |
|---|---|---|---|---|
| 文件 | 文件选择 | ✅ | 无 | 待解析文件。一次可选择多个文件,支持 PDF、图片、Word、PPT 和 Excel 文件。 |
| 输出格式 | 多选 | - | JSON, Markdown | 选择返回 JSON、Markdown,或同时返回两种格式。 |
| 图片格式 | 单选 | - | URL | 图片元素返回格式,支持 URL、Base64、None。 |
| 公式格式 | 单选 | - | LaTeX | 公式元素返回格式,支持 LaTeX、MathML、ASCII。 |
| 表格格式 | 单选 | - | HTML | 表格元素返回格式,支持 HTML、Markdown、Image。 |
| 化学结构式格式 | 单选 | - | Image | 化学结构式元素返回格式,当前仅支持 Image。 |
| 文字跨页拼接 | 开关 | - | 关闭 | 将跨页文字段合并为连续段落。 |
| 表格跨页拼接 | 开关 | - | 关闭 | 将跨页表格合并为完整表格。 |
| 标题层级识别 | 开关 | - | 关闭 | 识别 H1、H2、H3 等标题层级。 |
| 文中图 | 开关 | - | 关闭 | 返回文字段落中的图片。 |
| 表格图 | 开关 | - | 开启 | 返回表格单元格内的图片。 |
| 图片理解 | 开关 | - | 开启 | 对文档内图片进行语义理解和结构化描述。 |
| 保留页眉页脚 | 开关 | - | 关闭 | 开启后保留页眉页脚内容。 |
输出变量
| 变量 | 类型 | 说明 |
|---|---|---|
| 解析结果 | array | 每个输入文件对应一个结果,按输入顺序返回。每项包含 markdown、json 和 error 字段。 |
结果字段
| 字段 | 类型 | 说明 |
|---|---|---|
markdown | string | Markdown 格式全文。未选择 Markdown 输出或解析失败时为空字符串。 |
json | object | JSON 格式解析结果。未选择 JSON 输出或解析失败时为空对象。 |
error | string | 当前文件的错误信息。解析成功时为空字符串。 |
注意事项
- FastGPT 文件选择器传入的是文件下载 URL,工具会先下载文件,再发送到 SoMark 解析服务。
- 如果文件 URL 带有
filename查询参数,工具会优先使用该文件名,避免临时下载地址丢失.pdf、.docx等后缀导致文件类型误判。




