从知识库治理到 受控执行:
一个专业服务团队的 4 周节奏。
下面两个样板来自问达科技与某专业服务团队(财税与咨询交叉业务)的合作脱敏复盘: 先用 4 周把 L0–L3 AI 原生工作中台跑通,再用智能伙伴把"知识"变成日程、任务、看板与提醒(并按行业增选审批 / 文档 / Base / IM 卡片), 最终在严格的受控执行边界内,让 Agent 能动手做申报、提醒与浏览器接管。
4 周节奏:从评测命中率到可签字的业务动作
我们坚持"先做评测、再做产品",4 周内交付一个可被验收的 AI 原生工作中台:不是 Git 仓库,也不是文档堆,而是飞书侧可演示、可点回知识源文档、可签字验收的动作产出。本案最终验收覆盖核心四类(日程 / 任务 / 数据看板 / 提醒)+ 扩展三类(文档产出 / 多维表格写入 / IM 卡片交互)。
诊断
梳理高频问答、痛点流程、现有制度文档质量,圈定 L0 必须收口的 10–20 个口径。
L0 + L1 落地
建立可搜索的事实库与 FAQ,飞书侧第一批可演示成果:口径检索 + 制度问答。
L2 评审闭环
引入评审→发布闭环,Eval 命中率作为发布门禁,把"知识"变成有 owner 的资产。
L3 验收
交付核心 4 类 + 扩展 3 类动作产出,现场 Demo + 1 周试点后由业务侧逐条勾选验收。
从知识消费 → 申报准备 → 受控执行,9 个 Demo 浓缩成 3 个阶段
智能伙伴在财税场景的演示按"由轻到重"安排:先证明它能消费知识、再证明能准备申报、 最后才在受控边界内动手做事。每个 Demo 都带可演示产出,绝不停留在"它能聊"。
知识消费 · 把制度变成可执行答案
飞书侧问答与表格,人随时可复核报销口径整改
员工提报销时,Agent 直接给出"差旅 / 招待 / 通讯"最新口径与凭证要求, 指出超标项并附制度原文链接。
制度调档查询
"今年招待费新口径与去年差异?"自然语言提问得到版本对比表, 附调档时间、责任人与适用区间。
Bitable 治理
Agent 巡检多维表格的字段命名、口径与责任人,周期性产出"待治理清单", 把"沉睡表"重新拉回评审。
申报准备 · 把节奏与差异写进日程看板
输出全部经过人复核,默认不动手月结日程编排
按主体 / 期间自动生成月结关键节点:对账、计提、结账、申报、披露, 逐项写入责任人日历并标注硬截止。
经营看板拉通
按 BU / 项目 / 客户维度拉通收入、毛利、应收账龄, 支持"为什么"下钻到原始凭证与异动责任人。
税务提醒与口径变更
监听政策更新,识别影响范围(税种 / 主体 / 业务), 把"谁要改什么"推送到具体责任人,而不是群里广播。
汇报材料起草
月度 / 季度经营汇报的初稿由 Agent 起草,基于看板数据与异动归因, 人专注于判断结论与下一步行动。
受控执行 · 浏览器接管 VAT 等关键动作
六条边界全部满足,任一条失守即退回草稿模式浏览器接管 VAT 申报
在本人浏览器登录税局后,Agent 接管表单填写; 金额、期间、抬头由人勾选确认,提交前二次签名。
异常拦截与回滚
填报中发现差额或字段冲突,Agent 主动暂停并把上下文截图、 日志、责任人推送给主管,等待人决策再继续或回滚。
双轨提交切换
同一动作支持"Agent 草稿 + 人工提交"与"Agent 受控提交"两种模式, 客户可一键切换,任何越权尝试都被记录与告警。
Agent 能动手,但只在 6 条边界之内
浏览器接管 VAT 这类动作能上线的前提,是 6 条边界全部满足。 任意一条失守,系统会自动退回"Agent 草稿 + 人工提交"。
交付价值靠这 4 条量化门槛 + 3 种验收形式
脱敏样板里我们与客户在 SOW 写明的是这 4 条量化门槛,加上"现场 Demo + 试点周 + 运营移交"三种验收形式——问答命中率仅作辅助指标。
你的团队也想跑一遍这套 4 周节奏?
我们提供一次免费的场景诊断:挑出最适合你团队跑通的"L0 + L1 + 一类动作产出", 按周给出可演示的成果与评测指标。
预约场景诊断