【AI风向】50%代码已是AI生成、客户投诉没涨：这家10万用户SaaS公司做对了什么

自2025年8月起，Ashby超过一半的生产代码由AI生成——但客户问题数量保持稳定。这不是玩具项目，而是一家拥有10万+周活用户的企业级SaaS。他们公开了完整的方法论。

事件回顾

6月2日，Ashby公司EMEA工程负责人Colin Howe发布了一篇深度博文：《AI, Ashby Engineering, and the Future》，迅速登上Hacker News热榜（206分），引发工程师社区激烈讨论。

Ashby是一家人才招聘SaaS公司，产品功能涵盖相当于Calendly和Looker体量的独立产品线，每周处理数百万份候选人申请。就是这样一个严肃的企业级产品，从2025年8月开始，超过50%的新增代码由AI生成。他们使用的工具包括Cursor、Claude Max、Codex以及多种Agent框架，工程师拥有无限制的token预算。

但最让人意外的是数据：代码量暴增，客户问题没涨。Colin在文章中直接附上了图表——更多的客户、更多的AI生成代码，但客户支持工单数量保持平稳。唯一的波动是每年3-4月的季节性周期，与AI无关。

Ashby没有强制要求使用AI，也不追踪token使用量。他们的逻辑很直接：「强制使用AI会鼓励滥竽充数（slop）。」

为什么重要

这篇文章之所以引爆HN，是因为它回答了一个整个行业都在焦虑的问题：AI写代码到底靠不靠谱？

过去一年，我们看到了大量的AI编程工具涌现——Cursor、Claude Code、GitHub Copilot、Codex——但绝大多数讨论停留在个人开发者的体验层面。一个人用AI写了个Side Project觉得爽，不代表企业级产品能扛住。

Ashby提供了稀缺的企业级生产数据：

10万+周活用户
数百万候选人申请/周
超过50%生产代码由AI生成
客户问题未增加
工程师入职上手速度未下降
代码质量未退化

这是一组反直觉的数据。按照很多人的担忧，AI写代码应该导致质量下降、Bug增多、新人看不懂代码。Ashby的经验证明：问题不在AI，而在你怎么用。

Colin在文章中提出了一个核心命题：「代码的生产成本正在趋近于零。AI不是来抢我们工作的，它来抢的是工作中那些机械的部分——语法、胶水代码、重复敲击键盘。」真正值钱的永远是工程师的判断力、品味、对客户的理解。

两个核心原则

Ashby的方法论建立在两个不可动摇的基石之上：

1. 同理心不能被AI替代

AI没有品味。它不理解客户。它无法感受使用糟糕产品的挫败感，也无法体会使用优秀产品的愉悦感。在一个「做出能用的产品」变得极其便宜的时代，「做出好产品」的能力更加稀缺。

Colin举了一个非常具体的例子：AI写的PR描述往往是30行充满废话的清单——「新增.github/workflows文件」「触发条件为pull_request」——这些信息看PR本身就能知道，完全不尊重同事的时间。而真正有用的信息——「为什么不做全量测试」——AI反而遗漏了。

2. 你对你发布的代码负责

AI可以非常自信地犯错。最大的风险不是AI错了，而是AI听起来特别对。Colin分享了Claude Code的一次实际操作：它在编辑backend/package.json时「不小心」删除了tar-stream包。不是有意的，但确实发生了。

Ashby的原则是：无论代码是手写的还是AI生成的，你必须理解它在做什么、为什么这样做、出问题了会怎样。

两种协作模式：Sidekick vs Delegate

Ashby将人与AI的协作分为两种模式，这是全文最实用的框架：

Sidekick模式（副驾驶）：你做大多数决策，AI辅助。适用于高风险场景——数据库迁移、候选人数据处理、安全敏感代码、架构决策。这些地方「看起来对」远远不够。

Delegate模式（委托）：你审核输出（有时甚至不审核）。适用于低风险场景——原型开发、本地工具、运维工具。失败成本低，可以快速行动。

Colin观察到一个普遍的规律：大多数工程师一开始会过度委托（什么都让AI做），然后矫枉过正（什么都不让AI碰）。关键问题不是「该不该用AI」，而是「这里我该信任AI多少？」

最简单的心智模型：问自己如果代码错了会怎样？尴尬？昂贵？还是生死攸关？

AI时代的工程安全：瑞士奶酪模型

当代码生产成本趋近于零，安全就不再是个人纪律问题，而是基础设施问题。Ashby采用经典的「瑞士奶酪模型」：每一层都有漏洞，但漏洞在不同位置。

测试：捕获代码审查遗漏的边界情况
代码审查：捕获测试无法覆盖的逻辑错误
功能开关（Feature Flags）：捕获测试和审查都漏掉的线上问题
可观测性（Observability）：兜底捕获一切

Ashby还自研了内部代码审查工具，专门寻找生产环境中难以处理的边界Bug。Colin认为自研工具在这一点上优于第三方工具，因为他们可以使用更多token并严格控制上下文。

此外，他们还使用AI辅助客户问题分类，Claude Code自动审查新Bug并生成报告——在某些案例中，这让支持团队在10分钟内修复了原本需要数小时的问题。

一个被忽视的隐忧：AI偏好「造新」而非「复用」

全文最有洞察力的一段话可能是这个：

「LLM偏向于生成新代码而非复用已有代码。如果不加约束，它会给你一个能跑、但没人能读懂的代码库。AI不关心它生成的代码是否复杂。推动简洁性现在是审查者能做的最有价值的事情之一。」

Colin在Side Project中亲身踩过这个坑：一个双模式界面，AI为每个模式单独复制了一份完整的组件代码。他直到修复同一个Bug两次才发现。

这意味着AI时代对代码审查的要求不降反升。但审查的重点必须转移——不再纠结于某人是否用对了useMemo，而是聚焦于：这个改动合理吗？高风险区域在哪？抽象合理吗？性能特征如何？

代码质量从未如此重要——而且会自我强化

Ashby提出了一个让所有工程师脊背发凉的观点：

「我们的代码库有了一个新读者。每个模式、每个命名、每个模块边界现在同时被人类和AI阅读——而AI会照单全收。一个混乱的代码库不仅拖慢你的同事，它还会降低每一个接触它的AI生成代码的质量。代码质量一直很重要。现在它会自我放大。」

这句话的潜台词是：如果你的代码库很乱，AI会学着乱写；如果你的代码库很干净，AI会学着干净。技术债务的利息在AI时代按复利计算。

对AI创业者的启示

Ashby的经验对AI创业圈有三层启示：

第一层：AI编程工具已进入生产就绪阶段。 当一家10万用户的企业级SaaS敢让AI生成超过一半的生产代码，且客户问题不增加时，这意味着「AI编码」已跨过从玩具到工具的鸿沟。对于一人公司和AI创业者来说，这是降维打击——你的竞争对手可能已经用AI把开发速度提到了你无法企及的水平。

第二层：工程文化的升级比工具更重要。 Ashby的成功不在于用了Cursor还是Claude Code，而在于他们建立了清晰的使用原则、安全模型和审查机制。工具是表，方法论是本。

第三层：产品判断力成为终极护城河。 Colin反复强调他们招聘的不是「技术能力强」的工程师，而是「产品意识强、善于沟通、有判断力」的工程师。理由很简单：当AI可以搞定代码实现之后，知道该做什么比知道怎么做稀缺一万倍。工程师不再是写代码的人，而是理解客户、定义问题、做出决策的人。

Ashby正在招聘欧洲和美洲的远程工程师。他们的要求清单暗示了AI时代的工程师画像：产品思维 > 编码速度，判断力 > 技术栈广度，沟通能力 > 刷题能力。

这场变革的速度比大多数人预想的更快。2025年8月开始，2026年6月已经超过50%。这个曲线还在上升。当你还在犹豫要不要让AI写代码时，你的竞争对手可能已经让AI写了半年的生产代码——而且客户没觉得有什么问题。

问题从来不是AI能不能写代码。问题是：你准备好当一个「做决策的人」了吗？

#AI创业 #AI编程 #Cursor #一人公司 #工程文化

本文由AI辅助创作，经人工审核编辑发布