Case · 脱敏案例样板

从知识库治理到 受控执行
一个专业服务团队的 4 周节奏。

下面两个样板来自问达科技与某专业服务团队(财税与咨询交叉业务)的合作脱敏复盘: 先用 4 周把 L0–L3 AI 原生工作中台跑通,再用智能伙伴把"知识"变成日程、任务、看板与提醒(并按行业增选审批 / 文档 / Base / IM 卡片), 最终在严格的受控执行边界内,让 Agent 能动手做申报、提醒与浏览器接管。

话题:AI 原生工作中台 4 周节奏 · 智能伙伴 9 个 Demo 浓缩样板 · 受控执行 6 条边界 · 衡量指标

4 周节奏:从评测命中率到可签字的业务动作

我们坚持"先做评测、再做产品",4 周内交付一个可被验收的 AI 原生工作中台:不是 Git 仓库,也不是文档堆,而是飞书侧可演示、可点回知识源文档、可签字验收的动作产出。本案最终验收覆盖核心四类(日程 / 任务 / 数据看板 / 提醒)+ 扩展三类(文档产出 / 多维表格写入 / IM 卡片交互)。

Week 01

诊断

梳理高频问答、痛点流程、现有制度文档质量,圈定 L0 必须收口的 10–20 个口径。

Week 02

L0 + L1 落地

建立可搜索的事实库与 FAQ,飞书侧第一批可演示成果:口径检索 + 制度问答。

Week 03

L2 评审闭环

引入评审→发布闭环,Eval 命中率作为发布门禁,把"知识"变成有 owner 的资产。

Week 04

L3 验收

交付核心 4 类 + 扩展 3 类动作产出,现场 Demo + 1 周试点后由业务侧逐条勾选验收。

评测命中率(辅助)
≥ 85%
问答是入口,不单独作为验收门槛
飞书侧可演示
第 2 周末
必须有真实可点击成果,而不是 PPT 截图
真实可用产出
每类 ≥ N 条
7 类动作,业务责任人确认归属与字段
人工兜底工时
下降 40%+
相对项目启动前同口径工时基线

从知识消费 → 申报准备 → 受控执行,9 个 Demo 浓缩成 3 个阶段

智能伙伴在财税场景的演示按"由轻到重"安排:先证明它能消费知识、再证明能准备申报、 最后才在受控边界内动手做事。每个 Demo 都带可演示产出,绝不停留在"它能聊"。

Stage 01

知识消费 · 把制度变成可执行答案

飞书侧问答与表格,人随时可复核
DEMO 01
报销口径整改

员工提报销时,Agent 直接给出"差旅 / 招待 / 通讯"最新口径与凭证要求, 指出超标项并附制度原文链接。

→ 产出:任务(差额补凭证)
DEMO 02
制度调档查询

"今年招待费新口径与去年差异?"自然语言提问得到版本对比表, 附调档时间、责任人与适用区间。

→ 产出:看板(口径版本)
DEMO 03
Bitable 治理

Agent 巡检多维表格的字段命名、口径与责任人,周期性产出"待治理清单", 把"沉睡表"重新拉回评审。

→ 产出:任务(字段整改)
Stage 02

申报准备 · 把节奏与差异写进日程看板

输出全部经过人复核,默认不动手
DEMO 04
月结日程编排

按主体 / 期间自动生成月结关键节点:对账、计提、结账、申报、披露, 逐项写入责任人日历并标注硬截止。

→ 产出:日程 + 提醒
DEMO 05
经营看板拉通

按 BU / 项目 / 客户维度拉通收入、毛利、应收账龄, 支持"为什么"下钻到原始凭证与异动责任人。

→ 产出:数据看板
DEMO 06
税务提醒与口径变更

监听政策更新,识别影响范围(税种 / 主体 / 业务), 把"谁要改什么"推送到具体责任人,而不是群里广播。

→ 产出:提醒 + 任务
DEMO 07
汇报材料起草

月度 / 季度经营汇报的初稿由 Agent 起草,基于看板数据与异动归因, 人专注于判断结论与下一步行动。

→ 产出:任务(初稿评审)
Stage 03

受控执行 · 浏览器接管 VAT 等关键动作

六条边界全部满足,任一条失守即退回草稿模式
DEMO 08
浏览器接管 VAT 申报

在本人浏览器登录税局后,Agent 接管表单填写; 金额、期间、抬头由人勾选确认,提交前二次签名。

→ 产出:任务(可回放) + 留痕
DEMO 09
异常拦截与回滚

填报中发现差额或字段冲突,Agent 主动暂停并把上下文截图、 日志、责任人推送给主管,等待人决策再继续或回滚。

→ 产出:提醒 + 审计日志
DEMO 10
双轨提交切换

同一动作支持"Agent 草稿 + 人工提交"与"Agent 受控提交"两种模式, 客户可一键切换,任何越权尝试都被记录与告警。

→ 产出:看板(动作合规率)

Agent 能动手,但只在 6 条边界之内

浏览器接管 VAT 这类动作能上线的前提,是 6 条边界全部满足。 任意一条失守,系统会自动退回"Agent 草稿 + 人工提交"。

1 · 人触发 动作必须由本人在飞书 / 工单 / 看板点击发起,Agent 不主动出手。
2 · 人登录 外部系统始终用本人浏览器会话与凭据,不离开本机。
3 · 人复核 金额 / 期间 / 抬头 / 收款方等关键字段在提交前必须勾选。
4 · 二次确认 付款 / 申报 / 撤销 等不可逆动作,需要二次签名或独立设备。
5 · 留痕 每一步截图与关键值写入审计日志,可被审计员逐步回放。
6 · 凭据隔离 Agent 不持久化账号密码,Token 短时、最小权限、按动作发放。

交付价值靠这 4 条量化门槛 + 3 种验收形式

脱敏样板里我们与客户在 SOW 写明的是这 4 条量化门槛,加上"现场 Demo + 试点周 + 运营移交"三种验收形式——问答命中率仅作辅助指标。

真实可用产出
每类 ≥ N 条
非桩数据,业务责任人确认归属与字段
知识引用可追溯率
≥ X%
每条产出可点回知识空间源文档
人工复核通过率
≥ Y%
首轮生成不需重写即可发布的比例
边界合规
100%
关键动作走人触发 + 二次确认,可审计

你的团队也想跑一遍这套 4 周节奏?

我们提供一次免费的场景诊断:挑出最适合你团队跑通的"L0 + L1 + 一类动作产出", 按周给出可演示的成果与评测指标。

预约场景诊断