把知识,变成可签字的
业务动作
不是给既有业务追加 AI 功能,而是从五个层面重新设计业务。
我们把 AI 原生公司拆解为五个可识别的特征——产品、工程、组织、数据、成本与定价。 它既是我们做事的准绳,也是判断一家公司是否真正"AI 原生"的检查清单。
意图优先的生成式产品
UI 由意图生成,而非预置表单堆砌;流式可中断、人在回路、信任与纠偏内建。
Agent + Eval 的研发栈
模型 / Agent / 数据 / 评测 / 协作 / 基础设施六层并行,评测先于上线。
知识与反馈持续回流
交互、纠偏、评测数据沉淀回知识库与微调集,让系统随业务运转持续变好。
单位经济 = 第一性约束
per-seat / usage / outcome / hybrid 四种定价范式按场景搭配;方案选型即对齐单任务推理成本、一次通过率、缓存命中率与目标毛利 55%–75%。
从知识到动作 · AI 原生工作中台
一条主线方案,按客户进入门槛分四层 SKU。L0–L2
是知识资产化基座,让知识喂得动;L3
是动作产出上层,让智能伙伴把知识变成日程 / 任务 / 看板 /
提醒等可签字业务动作。客户从最小可验证的 L0
起步,逐层推进到员工日常可用的智能伙伴。
4 周交付节奏:第 1 周诊断 → 第 2 周落地 L0+L1 → 第 3 周接 L2(评审→发布闭环) → 第 4 周接 L3 并验收。 关键里程碑——第 2 周末必须有可演示的飞书侧成果,避免客户感到"只是建了个 Git 仓库"。
L3 验收只看一件事:智能伙伴把知识空间转成了几项可签字的业务动作。
如果客户只得到一个整理得更好的知识空间,项目就只完成了一半。SOW 的验收条款由动作类别 + 量化门槛 + 验收形式 三段组成;售前 Demo 与第 4 周交付都以下列产出逐条勾选。
日程
从项目节奏、会议机制、里程碑文档生成例行会、评审会、复盘会。
任务
从 SOP、项目计划、组织分工拆解责任人、截止时间、依赖关系。
数据看板
从指标定义、周报模板、案例索引生成经营或项目跟踪视图。
提醒
从制度、流程、节点要求生成催办、到期提醒、例行巡检提醒。
审批
报销 / 请假 / 采购 / 合同 / 用印的发起或预填,走飞书审批 OpenAPI,正式提交保持人触发。
文档产出
会议纪要、周 / 月报、申报材料草稿、方案首版自动生成到飞书 docx,带知识引用脚注。
多维表格写入
CRM 线索、案例索引、Agent 注册表、风险登记的新增 / 更新,遵循 AGENTS.md 回写纪律。
IM 卡片交互
把"提醒"升级为"提醒 + 一键动作":确认 / 转派 / 关闭 / 改期,通知与下一步合并到一次触达。
量化门槛 · 数字由业务方按客户体量在 SOW 里落
- 真实可用产出每类动作至少 N 条非桩数据,业务负责人确认归属正确、字段完整。
- 知识引用可追溯率≥ X%:每条产出可点回知识空间源文档(`lark_wiki_url` 命中)。
- 人工复核通过率≥ Y%:首轮生成不需手动重写即可发布的比例。
- 边界合规关键动作 100% 走人触发 + 二次确认,留痕可审计。
验收形式
- 现场 Demo客户真实租户、真实知识空间跑通,不用脱敏沙箱。
- 试点周(1–2 周)指定 1 个业务团队连续使用,产出量与复核通过率达标后签字。
- 运营移交交付《智能伙伴动作运营 SOP》并完成 1 次故障回滚演练(误发提醒 / 错派任务的撤回路径)。
问答命中率只作为辅助指标,不单独作为验收门槛——问答是入口,真实业务动作才是客户持续付费的原因。
从场景诊断
到持续优化
每个项目都经历相同的工程纪律——让结果可预期、可度量、可复制。
场景诊断
识别真实业务问题,明确 AI 介入边界与 ROI 假设。
原型设计
快速验证产品形态,建立评测基准与人机交互路径。
工程交付
Agent 工作流落地,可观测、可审阅、接入真实数据。
评测上线
量化基线,灰度发布,收集真实反馈与错误样本。
持续优化
数据回流驱动迭代,成本优化,能力持续扩展。
从定价范式到单位经济,与客户站在同一张表。
AI 原生公司的健康毛利区间是 55%–75%。在方案选型阶段,我们就和客户一起把成本与价值曲线对齐—— 避免上线后才发现"调用一次就亏一次"。
Per-seat 订阅
按席位收费,适合写作 / 研发 / 客服等高频日常工作流。
Usage 计量
按调用量 / Token 收费,适合 API、自动化批处理类场景。
Outcome 结果计费
按工单解决数、转化数等业务结果收费,与客户 ROI 直接挂钩。
Hybrid 组合
底座席位 + 增量用量 / 结果,大多数 ToB 场景的现实选择。
目标毛利:55% – 75%。CAC 回收期、NRR、人工兜底成本同时纳入诊断模型。
六条护城河 · AI 原生公司的复利来源
六个需警惕的反模式
- 全量调用最贵模型:不做路由与缓存,毛利纯被推理费吞掉。
- per-seat 不区分 AI 用量:重度用户赔钉 + 轻量用户付费不合理。
- Outcome 计费无归因协议:价值归因无法仔细拆到 Agent。
- 用低价换用量不控成本:上量反而越使用越亏。
- 只看 CAC 不看 NRR:AI 原生生意的复利在留存与增购。
- 演示重于评测:看起来漂亮但上线后一次通过率崩盘。
AI 原生不是给老业务加一个聊天框,而是重新设计业务本身。
来自我们对 AI 原生公司的长期观察: 产品形态、工程体系、组织结构、数据回流、成本与定价——五个层面同时重塑。
意图驱动,而非功能堆砌
从用户真实意图出发设计产品形态,而不是把所有功能都接上大模型。
评测先行,结果可度量
每一个 Agent 工作流都需要评测基准,可量化才能持续优化。
人在回路,关键动作可审阅
重要业务动作必须有人工审阅节点,可回滚、可追踪、可纠偏。
数据回流,系统持续变好
沉淀交互、反馈与评测数据,让系统随业务运转而不断进化。
成本与定价同盘考量
方案选型阶段就把单位经济算清,目标毛利 55%–75%,避免上线即亏损。
从你的场景开始,
而不是从 Demo 开始。
告诉我们你面临的具体问题,我们提供一次免费的场景诊断,产出可落地的 L0–L1 行动清单。