Case · 脱敏案例样板

从知识库治理到受控执行：
一个专业服务团队的 4 周节奏。

下面两个样板来自问达科技与某专业服务团队(财税与咨询交叉业务)的合作脱敏复盘：先用 4 周把 L0–L3 AI 原生工作中台跑通，再用智能伙伴把"知识"变成日程、任务、看板与提醒(并按行业增选审批 / 文档 / Base / IM 卡片), 最终在严格的受控执行边界内，让 Agent 能动手做申报、提醒与浏览器接管。

话题：AI 原生工作中台 4 周节奏 · 智能伙伴 9 个 Demo 浓缩样板 · 受控执行 6 条边界 · 衡量指标

样板一 · AI 原生工作中台

4 周节奏：从评测命中率到可签字的业务动作

我们坚持"先做评测、再做产品",4 周内交付一个可被验收的 AI 原生工作中台：不是 Git 仓库，也不是文档堆，而是飞书侧可演示、可点回知识源文档、可签字验收的动作产出。本案最终验收覆盖核心四类(日程 / 任务 / 数据看板 / 提醒)+ 扩展三类(文档产出 / 多维表格写入 / IM 卡片交互)。

Week 01

诊断

梳理高频问答、痛点流程、现有制度文档质量，圈定 L0 必须收口的 10–20 个口径。

Week 02

L0 + L1 落地

建立可搜索的事实库与 FAQ，飞书侧第一批可演示成果：口径检索 + 制度问答。

Week 03

L2 评审闭环

引入评审→发布闭环，Eval 命中率作为发布门禁，把"知识"变成有 owner 的资产。

Week 04

L3 验收

交付核心 4 类 + 扩展 3 类动作产出，现场 Demo + 1 周试点后由业务侧逐条勾选验收。

评测命中率(辅助)

≥ 85%

问答是入口，不单独作为验收门槛

飞书侧可演示

第 2 周末

必须有真实可点击成果，而不是 PPT 截图

真实可用产出

每类 ≥ N 条

7 类动作，业务责任人确认归属与字段

人工兜底工时

下降 40%+

相对项目启动前同口径工时基线

样板二 · 财税智能伙伴

从知识消费 → 申报准备 → 受控执行，9 个 Demo 浓缩成 3 个阶段

智能伙伴在财税场景的演示按"由轻到重"安排：先证明它能消费知识、再证明能准备申报、最后才在受控边界内动手做事。每个 Demo 都带可演示产出，绝不停留在"它能聊"。

Stage 01

知识消费 · 把制度变成可执行答案

飞书侧问答与表格，人随时可复核

DEMO 01

报销口径整改

员工提报销时，Agent 直接给出"差旅 / 招待 / 通讯"最新口径与凭证要求，指出超标项并附制度原文链接。

→ 产出：任务(差额补凭证)

DEMO 02

制度调档查询

"今年招待费新口径与去年差异？"自然语言提问得到版本对比表，附调档时间、责任人与适用区间。

→ 产出：看板(口径版本)

DEMO 03

Bitable 治理

Agent 巡检多维表格的字段命名、口径与责任人，周期性产出"待治理清单", 把"沉睡表"重新拉回评审。

→ 产出：任务(字段整改)

Stage 02

申报准备 · 把节奏与差异写进日程看板

输出全部经过人复核，默认不动手

DEMO 04

月结日程编排

按主体 / 期间自动生成月结关键节点：对账、计提、结账、申报、披露，逐项写入责任人日历并标注硬截止。

→ 产出：日程 + 提醒

DEMO 05

经营看板拉通

按 BU / 项目 / 客户维度拉通收入、毛利、应收账龄，支持"为什么"下钻到原始凭证与异动责任人。

→ 产出：数据看板

DEMO 06

税务提醒与口径变更

监听政策更新，识别影响范围(税种 / 主体 / 业务), 把"谁要改什么"推送到具体责任人，而不是群里广播。

→ 产出：提醒 + 任务

DEMO 07

汇报材料起草

月度 / 季度经营汇报的初稿由 Agent 起草，基于看板数据与异动归因，人专注于判断结论与下一步行动。

→ 产出：任务(初稿评审)

Stage 03

受控执行 · 浏览器接管 VAT 等关键动作

六条边界全部满足，任一条失守即退回草稿模式

DEMO 08

浏览器接管 VAT 申报

在本人浏览器登录税局后，Agent 接管表单填写；金额、期间、抬头由人勾选确认，提交前二次签名。

→ 产出：任务(可回放) + 留痕

DEMO 09

异常拦截与回滚

填报中发现差额或字段冲突，Agent 主动暂停并把上下文截图、日志、责任人推送给主管，等待人决策再继续或回滚。

→ 产出：提醒 + 审计日志

DEMO 10

双轨提交切换

同一动作支持"Agent 草稿 + 人工提交"与"Agent 受控提交"两种模式，客户可一键切换，任何越权尝试都被记录与告警。

→ 产出：看板(动作合规率)

受控执行边界

Agent 能动手，但只在 6 条边界之内

浏览器接管 VAT 这类动作能上线的前提，是 6 条边界全部满足。任意一条失守，系统会自动退回"Agent 草稿 + 人工提交"。

1 · 人触发 动作必须由本人在飞书 / 工单 / 看板点击发起，Agent 不主动出手。

2 · 人登录 外部系统始终用本人浏览器会话与凭据，不离开本机。

3 · 人复核 金额 / 期间 / 抬头 / 收款方等关键字段在提交前必须勾选。

4 · 二次确认 付款 / 申报 / 撤销等不可逆动作，需要二次签名或独立设备。

5 · 留痕 每一步截图与关键值写入审计日志，可被审计员逐步回放。

6 · 凭据隔离 Agent 不持久化账号密码，Token 短时、最小权限、按动作发放。

衡量指标

交付价值靠这 4 条量化门槛 + 3 种验收形式

脱敏样板里我们与客户在 SOW 写明的是这 4 条量化门槛，加上"现场 Demo + 试点周 + 运营移交"三种验收形式——问答命中率仅作辅助指标。

真实可用产出

每类 ≥ N 条

非桩数据，业务责任人确认归属与字段

知识引用可追溯率

≥ X%

每条产出可点回知识空间源文档

人工复核通过率

≥ Y%

首轮生成不需重写即可发布的比例

边界合规

100%

关键动作走人触发 + 二次确认，可审计

你的团队也想跑一遍这套 4 周节奏？

我们提供一次免费的场景诊断：挑出最适合你团队跑通的"L0 + L1 + 一类动作产出", 按周给出可演示的成果与评测指标。

预约场景诊断

从知识库治理到 受控执行： 一个专业服务团队的 4 周节奏。