将非结构化或半结构化数据转换为干净的结构化格式。扫描发票、图片表格、文字密集的 PDF、CSV 导出、JSON 数据——Transformer 读取后输出 JSON、Markdown 表格或格式化的 Excel 文件。 ## 擅长做什么 - **Vision LLM OCR** — 从扫描图片和图片型 PDF 中提取文字,包括表格、发票和表单 - **PDF 文字提取** — 使用 Poppler 从文字型 PDF 中提取结构化文本,比 Vision OCR 更快更准 - **CSV → JSON** — 将扁平 CSV 导出转换为结构化 JSON 数组 - **JSON → Markdown 表格** — 将 JSON 数据格式化为可读的 Markdown 表格 - **JSON → Excel** — 将结构化数据导出为带自动格式化的 Excel 文件(列宽、表头、对齐) - **自定义脚本** — 针对复杂或非标准格式编写并运行定制转换流水线 - **批量处理** — 一次运行处理多个文件 ## 工作原理 Transformer 使用注入了 Vision LLM 凭据的 desktop-lite 沙箱处理 OCR 任务。图片输入调用 Vision 模型提取文字,数字型 PDF 直接使用 Poppler,格式转换则在容器内编写并运行 Python 脚本。 输出文件保存到 Workspace。生命周期为 `oneshot`——每次对话使用全新容器——但所有输出文件跨会话持久保存在 Workspace 中。 ## 怎么写好 Prompt **上传文件并说明输出格式。** "将这张扫描发票提取为 JSON"或"将这个 CSV 转换为格式化的 Excel 文件"就够了。 **描述你想要的结构。** JSON 输出时,如果有 schema,说明字段名称。Excel 时,如果需要特定列顺序或格式,提前说明。 **批量处理时明确说明。** "处理这三个文件并合并为一个 JSON 数组"比让它自己猜是否批量处理更清晰。 **示例:** > 从这三张扫描发票中提取所有明细项目,输出为 JSON 数组,字段:date、vendor、item、quantity、unit_price、total。 > 将这个 CSV 导出转换为格式化的 Excel 电子表格,自动调整列宽并冻结标题行。 > OCR 这张图片并将表格输出为 Markdown 表格。 > 这个 PDF 是文字型的——提取所有财务数据并格式化为 JSON。 > 将这个杂乱的 JSON 转换为可以粘贴进报告的干净 Markdown 表格。 ## 能力速览 | 能力 | 说明 | |------|------| | OCR | 图片和扫描 PDF 使用 Vision LLM | | PDF 文字提取 | 数字型(非扫描)PDF 使用 Poppler | | 格式转换 | CSV → JSON,JSON → Markdown,JSON → Excel | | 自定义流水线 | 针对复杂或非标准格式的 Python 脚本 | | 批量处理 | 一次运行处理多个文件 | | 沙箱 | `claude-desktop-lite` 镜像,4 GB 内存,`oneshot` 生命周期 | | Workspace | 永久存储——输出文件无限期保留 | ## 下一步 - [Insights](/docs/zh-cn/built-in-agents/insights) — 先用 Transformer 清洗数据,再在 Insights 中分析 - [Report Writer](/docs/zh-cn/built-in-agents/report-writer) — 先用 Transformer 整理原始资料,再撰写报告 - [AI 专家:找到合适的那个](/docs/zh-cn/getting-started/ai-experts-intro) — 查看所有内置专家