OXYZ资本的判断框架:只看“可验证证据”的早期投资方法

一、为什么“概念/叙事”在早期最容易误导

早期项目最危险的,不是没有叙事,而是叙事太顺——顺到让团队自己都信了。

你会看到很多“看起来合理”的表达:

  • “我们在做 AIGC + 社交的新范式”

  • “年轻人需要新的情绪价值入口”

  • “这是下一个十年的超级渠道变化”

  • “我们对标某某,未来空间巨大”

这些话不一定是错的,但问题是:它们几乎无法验证。而早期的资源(时间/钱/注意力)是有限的,一旦被叙事带偏,最贵的损失是——你会在错误方向上持续加杠杆

早期叙事容易误导,通常来自四种“结构性幻觉”:

1)把“听起来像需求”当成“真实需求”

真实需求不是“有人说需要”,而是“有人愿意为此付出代价”。代价可以是钱、时间、迁移成本、公开背书、持续使用、引荐他人……
只要没有代价,就只是好感。

2)把“宏观趋势”当成“你的机会”

趋势是真的,但趋势不会自动把机会分配给你。
早期应该先证明:你抓住了一个可落地的细分用户、一个高频场景、一个明确任务(Job),并且能比替代方案更好。

3)把“短期增长”当成“长期留存”

投放带来的增长、平台流量红利带来的爆发、一次活动带来的冲高——都可能存在。
但 PMF 关心的是:你能否持续把新用户变成老用户,并在老用户中自然扩散。

4)把“漂亮材料”当成“清晰口径”

PPT 越漂亮,越容易掩盖口径不清:
DAU 到底指什么?有效用户怎么定义?留存的分母是谁?渠道归因口径是否一致?
没有口径就没有证据。

结论:叙事可以让人愿意听你讲,但只有证据能让人愿意把资源交给你。

 

二、我们只看三类证据:需求存在 / PMF 速度 / 产品力

这三类证据不是“并列打分项”,而是一条链:
需求存在 → 产品能满足 → 增长能复现(PMF 速度)
缺一不可。

 

A. 需求存在:你到底解决了谁的什么问题?

定义(严格版):在一个可识别的用户群体里,存在一个高频/高损失/高紧迫的任务或痛点,用户愿意用可衡量的代价来交换你的解决方案。

我们看什么:

  1. 人群是否清晰:是谁?他们现在用什么替代方案?

  2. 任务是否具体:不是“想社交”,而是“在某场景下要完成某任务”。

  3. 强度是否足够:痛点强度=发生频率 × 影响损失 × 紧迫程度。

  4. 代价是否真实:愿意付费、愿意持续用、愿意迁移、愿意引荐。

最低过线证据(建议):

  • 至少 20–30 份高质量用户访谈(含原始记录/摘录/编码结论)

  • 至少 5–10 个“强需求用户”出现可重复信号:

    • 主动追问上线时间/价格

    • 愿意参与共创/拉同事/拉朋友

    • 愿意提供数据/接口/流程配合(B2B)

  • 明确替代方案与“为什么现在就要换”。

优秀线证据:

  • 已形成“需求句式”:

    • “当我在【场景】要【完成任务】时,我最怕【损失/风险】,所以我现在用【替代方案】但它在【关键环节】做不到。”

  • 需求强度在小样本里高度一致(不是各说各话)。

  • 已出现“愿意付出代价”的行为:付费/持续使用/推荐/迁移。

 

B. PMF 速度:不是“你有没有 PMF”,而是“你离 PMF 的速度”

早期判断最重要的不是一句“我们已经 PMF”,而是:

你验证假设、迭代产品、复现增长的速度有多快?

PMF 速度本质是一个团队的“学习曲线斜率”。我们通常用三类信号来判断:

  1. 留存是否在变稳:曲线能否逐步变平(或关键 cohort 明显改善)

  2. 自然增长是否增强:推荐/复购/自传播是否提升

  3. 实验是否可复现:增长不是一次运气,而是可重复的机制

最低过线证据(建议):

  • 有可追溯的 cohort 留存(按注册周/渠道/人群切分)

  • 有连续 4–8 周的 实验日志:假设→动作→结果→复盘→下一步

  • 指标口径稳定,不随汇报对象变化而变化

优秀线证据:

  • 能清楚说出:

    • 当前北极星指标是什么

    • 影响它的 2–3 个关键杠杆是什么

    • 最近 8 周哪个杠杆被验证有效、哪个被证伪

  • 能拿出 2–3 个“可复现增长动作”,并解释其机制(不是渠道名)

PMF 速度快的团队,常见特征是:他们不怕数据难看,怕的是数据不清。

 

C. 产品力:你是否构建了一个“能自我循环的系统”?

早期产品力不是“功能多”,而是三件事:

  1. 价值到达(Time-to-Value)够短:用户多快能感到“值”

  2. 核心闭环够顺:触发 → 使用 → 获得价值 → 再触发

  3. 优势够硬:为什么你比替代方案更好?更快/更省/更准/更爽/更便宜/更可信

最低过线证据(建议):

  • 明确 “Aha moment” 是什么,以及如何让更多用户到达它

  • 漏斗清晰:从进入到完成关键动作,中间掉在哪一步,为什么

  • 有“产品改动 → 指标变化”的因果线索(哪怕是小样本)

优秀线证据:

  • 产品团队能讲清楚“核心机制”而不是“功能列表”

  • 体验优势可被第三方复测(同一任务,效率/成功率显著更高)

  • 已出现轻量“护城河信号”:数据积累、网络效应、内容供给、工作流嵌入、成本优势等

 

三、证据怎么采集:访谈 / 行为数据 / 增长实验 / 可复现口径

这里给一套能直接用的实操方法。

 

1)用户访谈:别做“聊天”,要做“证据采样”

访谈的目标不是让用户夸你,而是验证三件事:

  • 痛点是否真实且高强度

  • 替代方案是什么,为什么不满意

  • 你的方案是否让他愿意付出代价

建议的访谈结构(40分钟):

  1. 过去 7 天发生过几次这个问题?(频率)

  2. 最糟糕的一次是什么?损失是什么?(强度)

  3. 你现在怎么解决?成本是什么?(替代方案)

  4. 你尝试过哪些工具/方法?为什么放弃?(对比)

  5. 如果我们能做到 X,你愿意付出什么代价?(代价)

  6. 谁会反对你使用/购买?谁是决策人?(真实购买链路)

常见坑:

  • 诱导性提问:“你是不是也觉得很痛?”

  • 只问“想不想要”,不问“愿意付出什么代价”

  • 只记结论,不留原始记录(无法复核)

 

2)行为数据:先统一口径,再讨论结论

数据采集最致命的问题是:大家用同一个词,但指的不是同一件事。

建议你们至少统一以下 10 个口径:

  • 注册用户定义(含重复/作弊/设备口径)

  • 激活定义(完成哪些关键动作算激活)

  • 有效用户定义(DAU/WAU 的事件条件)

  • 留存口径(D1/D7/D30 的分母、跨端规则)

  • 渠道归因规则(自然/投放/内容/合作怎么分)

  • 关键漏斗事件(事件名、触发条件、去重规则)

  • 付费/转化口径(订单/支付/退款)

  • 推荐口径(分享/邀请/被邀请激活)

  • 核心任务成功率(成功的定义)

  • 反作弊规则(异常行为剔除)

早期数据不需要很大,但一定要“能复算”。

 

3)增长实验:用“实验卡”替代“拍脑袋”

最小可用实验卡(复制即可用):

  • 假设:我们相信【动作】会提升【指标】,因为【机制】

  • 人群:新用户/回流/某渠道/某城市

  • 方案:具体改什么(页面/流程/激励/内容/话术)

  • 指标:主指标 1 个 + 护栏指标 1–2 个

  • 周期:最短观察周期(通常 7–14 天)

  • 判定:提升 ≥ X% 视为有效;< X% 视为无效

  • 复盘:结果→原因→下一步

常见错误:

  • 一次改太多,无法归因

  • 没有护栏指标(提升了转化却伤了留存)

  • 只看均值不看 cohort(投放把用户质量拉低了你看不到)

 

四、最常见的 6 种“伪证据”(以及你该怎么反问)

下面这 6 个,几乎每个早期项目都会踩。你可以直接拿去当“反脆弱清单”。

伪证据 1:截图口径(“你看我们 DAU 很高”)

**反问:**DAU 的事件定义是什么?去重规则是什么?时间范围?能否导出原始明细或后台报表?
**识别点:**只有截图,没有口径;换个时间段/换个定义数就变了。

伪证据 2:单点爆发(“我们某天冲到榜单前十”)

**反问:**这批用户的 D7/D30 留存如何?后续 cohort 是否复现?增长来自哪里?
**识别点:**爆发不是问题,问题是爆发后留存坍塌。

伪证据 3:投放堆量(“我们拉新成本很低”)

**反问:**你做过对照组吗?增量是多少?停投后自然留存还在吗?回本周期?
**识别点:**低 CAC 可能只是平台红利或短期套利。

伪证据 4:强背书/大奖(“我们得了某某奖/某某大佬转发”)

**反问:**背书之后,激活/留存/复购具体提升了多少?提升持续了多久?
**识别点:**背书只能带来注意力,不能替代产品闭环。

伪证据 5:大客户意向/LOI(“我们有很多意向单”)

**反问:**意向单是否包含预算/采购流程/决策人签字/试点成功标准?下一步时间表?
**识别点:**没有“下一步的可执行动作”,意向只是礼貌。

伪证据 6:团队自我感动(“用户都说很好用”)

**反问:**用户说“好”的具体语境是什么?他为此付出了什么代价?是否持续使用?
识别点:“好评”不是证据,“持续行为”才是证据。

 

五、一张“证据清单”模板(可复制)

你可以把下面当作对外材料包的核心页,也可以当内部周会模板。

《早期项目证据清单(V1)》

A. 需求存在

  • 目标人群(画像 + 场景):

  • 关键任务(Job to be done):

  • 替代方案(现在怎么做):

  • 痛点强度(频率×损失×紧迫):

  • 代价证据(付费/迁移/引荐/持续使用):

  • 访谈证据(数量/样本构成/原始摘录链接):

B. PMF 速度

  • 北极星指标(定义):

  • 关键杠杆(2–3 个):

  • 留存数据(cohort + 口径):

  • 近 8 周实验日志(链接/表格):

  • 可复现动作(Top 3):

C. 产品力

  • Aha moment(是什么 + 到达率):

  • 核心漏斗(每步转化 + 最大掉点):

  • 核心闭环(触发→价值→再触发):

  • 相对替代方案的硬优势(可复测):

D. 分发与商业化(早期即可很轻)

  • 当前主要渠道:

  • 渠道贡献拆分(口径一致):

  • 单位经济雏形(哪怕粗略):

E. 风险与反证

  • 最大不确定性(Top 3):

  • 已被证伪的假设(我们学到了什么):

  • 最担心的伪增长来源(如何排除):

 

六、对接 OXYZ:你给我什么材料最省双方时间

如果你希望和 OXYZ 高效对接,我们最希望看到的不是“更完整的故事”,而是更可核实的证据包。建议你发这三样(越克制越好):

1)一页纸(必选)

  • 用户任务 → 解决方案 → 关键进展 → 下一步要验证的问题

  • 不要铺宏大叙事,只写可核实事实

2)四张图(强烈建议)

  • cohort 留存趋势(按周/按渠道)

  • 关键漏斗(注册→激活→关键行为→复访/付费)

  • 渠道拆分(自然/投放/内容/合作,口径一致)

  • 实验复盘表(8周以内最好)

3)三个原始附件(加分项)

  • 访谈摘录(可脱敏)

  • 指标口径说明(事件定义表)

  • 实验卡(假设-动作-结果)

我们会用同一套标准看:需求是否真实、学习是否快、产品是否硬。
如果证据链足够清晰,沟通会非常快;如果证据链不足,我们也会直接告诉你“该补哪些证据最划算”。