高效办公工具
Contract-to-Database AI Agent
#AI自动化工作流#非结构化数据治理#智能辅助决策
1. 项目背景与摘要
基于多模态大模型与飞书多维表格构建的无代码自动化工作流,支持长篇扫描版合同直传,将机械的数据录入时间缩短 70%,并实现客户评级的自动业务决策。
2. 项目详情
1. 情境与任务
业务现状:团队需高频处理纸质/扫描版商业合同,核对散落在十几页长文档中的折扣表与白名单,并手动录入台账。
核心痛点:
A. 纯手工录入耗时且易出错,业务人员被繁琐的搬砖工作淹没。
B. 传统 OCR 技术无法理解复杂的合并单元格、跨页信息以及扫描件的排版噪音。
C. 缺乏自动化的处理机制:同一份合同存在多种产品的不同折扣,极难快速计算出该客户的综合业务等级。
2. 行动与架构
采用 Vibe Coding(自然语言编程)理念,直接使用 Coze 平台搭建低代码智能体。
输入层:顺应用户自然习惯,支持完整扫描版 PDF 直传。不强制要求用户手动拆页,降低使用门槛。
处理层:
视觉解析:挂载旗舰级多模态大模型,在十几页充满法律冗余条款的长文档中,精准定位并「看懂」包含核心折扣和白名单的复杂表格。
规则引擎:将模糊的业务评级标准转化为严密的数学逻辑,植入 Prompt 中。
校验层:拒绝高风险的盲目全自动。设计 Markdown 结构化表格作为中间态交互,用户只需敲击「写入」指令即可放行数据。
输出层:结构化数据通过 API 插件精准映射,自动追加至飞书多维表格。
3. 结果与迭代历程
V1.0 MVP(跑通闭环,重塑数据结构):
目标:验证 Vision LLM 读取复杂表格并在长文档中抗干扰的可行性。
关键产品决策:放弃「合并单元格」的视觉排版执念,确立「关系型数据库」的底层数据架构(一行即一份合同),确保了未来数据的可检索性与范式纯洁性。
V2.0 进阶(引入业务规则,走向智能辅助):
目标:从「数据提取搬运工」升级为「业务决策大脑」。
关键逻辑攻坚:面对一份合同中存在多种折扣的业务冲突,设计并实现了「产品A > 产品B > 产品C」的瀑布流条件分支,并制定了严格互斥的 A/B/C 级数学区间界限(如:< 4折 赋 A 级),消除了大模型计算时的逻辑幻觉。
4. 踩坑与产品复盘
用户体验 vs 技术边界的权衡:早期曾试图引入「物理截断 PDF」的标准操作规范(SOP)来降低 AI 幻觉率,但意识到这增加了用户的交互摩擦。最终选择优化系统底层 Prompt,让 AI 学会在长文档的噪音中主动过滤废话、精准寻表,将复杂性留在系统内部,把简单留给用户。
Vibe Coding 的本质洞察:自然语言虽然取代了代码,但产品经理对「业务规则」的定义必须达到甚至超越代码级的严谨程度,否则大模型一定会将人类的模糊性放大为系统 Bug。
3. 项目展示

