跳转到主要内容

在工作流中使用 SoMark 文档解析工具

1

添加 SoMark 文档解析节点

在 FastGPT 应用编排中添加 SoMark 文档解析 节点。fastgpt-添加插件
2

激活 SoMark 文档解析工具

点击去激活,填写密钥配置:
  • Base URL:使用 SoMark API 时填写 https://somark.ai/api/v1; 私有化部署时填写本地部署的 Base URL。
  • API Key:使用 SoMark API 时填写;私有化部署无需填写。
还没有 API Key?前往 SoMark API 工作台获取 API Key。免费额度无需领取,会自动发放到账户(每日 500 页、每月 2000 页)。
使用 SoMark Self-host 时,插件会在 Base URL 后自动拼接对应接口路径。请填写能命中自建服务 API 前缀的位置,不要追加具体接口路径。
fastgpt-激活插件
3

搭建最小演示

用一个文件输入节点连接 SoMark 文档解析文件 参数,再把解析结果输出传给下游节点。该插件一次可解析多个文件,适合接收用户上传的 PDF、图片、Word、PPT 或 Excel 文件。fastgpt-构建工作流在调试或预览中上传文件并运行工作流。节点会按输入顺序为每个文件返回一项结果,每项包含 markdownjsonerror 字段,你可以在下游节点按需引用。fastgpt-运行预览

插件参数与输出

输入参数

参数类型必填默认值说明
文件文件选择待解析文件。一次可选择多个文件,支持 PDF、图片、Word、PPT 和 Excel 文件。
输出格式多选-JSON, Markdown选择返回 JSONMarkdown,或同时返回两种格式。
图片格式单选-URL图片元素返回格式,支持 URLBase64None
公式格式单选-LaTeX公式元素返回格式,支持 LaTeXMathMLASCII
表格格式单选-HTML表格元素返回格式,支持 HTMLMarkdownImage
化学结构式格式单选-Image化学结构式元素返回格式,当前仅支持 Image
文字跨页拼接开关-关闭将跨页文字段合并为连续段落。
表格跨页拼接开关-关闭将跨页表格合并为完整表格。
标题层级识别开关-关闭识别 H1、H2、H3 等标题层级。
文中图开关-关闭返回文字段落中的图片。
表格图开关-开启返回表格单元格内的图片。
图片理解开关-开启对文档内图片进行语义理解和结构化描述。
保留页眉页脚开关-关闭开启后保留页眉页脚内容。

输出变量

变量类型说明
解析结果array每个输入文件对应一个结果,按输入顺序返回。每项包含 markdownjsonerror 字段。

结果字段

字段类型说明
markdownstringMarkdown 格式全文。未选择 Markdown 输出或解析失败时为空字符串。
jsonobjectJSON 格式解析结果。未选择 JSON 输出或解析失败时为空对象。
errorstring当前文件的错误信息。解析成功时为空字符串。

注意事项

  • FastGPT 文件选择器传入的是文件下载 URL,工具会先下载文件,再发送到 SoMark 解析服务。
  • 如果文件 URL 带有 filename 查询参数,工具会优先使用该文件名,避免临时下载地址丢失 .pdf.docx 等后缀导致文件类型误判。