近3000组匿名对比中,法学院教授们自己打分认为AI的答案更好。这不止关乎法律行业,而是所有"知识权威型"职业的共同未来。
事件回顾
斯坦福法学院本周发布了一项震动法律界的研究:在一项覆盖近3000组匿名对比的盲测中,法学教授们为AI撰写的法律分析打出了显著高于同行教授的评价——AI在正面交锋中赢了75%。
研究由斯坦福法学院教授Julian Nyarko主导。他同时担任斯坦福法学院AI倡议联合主席、斯坦福人类中心AI研究所(HAI)高级研究员。研究团队使用Google Gemini回答法学院入门课程级别的考试题目,然后将AI答案与教授们撰写的答案匿名混合,交由其他法学教授盲评。
结果是惊人的:教授们不仅没有识破AI,反而系统性地认为AI的答案更全面、更清晰、更有说服力。
这不是AI第一次在专业考试中战胜人类——GPT-4在2023年就通过了律师资格考试。但这次的盲测设计有本质不同:评审者本身是领域内最顶尖的专家,他们不是被要求「判断哪个是AI」,而是被要求「判断哪个答案更好」。他们选了AI。
为什么这个研究比「AI通过XX考试」重要得多
过去三年,我们看过太多「AI通过医师资格考试」「AI通过CPA考试」的新闻。但那些测试有一个共同盲点:它们衡量的是AI能否达到最低执业门槛,而非AI能否超越专家。
斯坦福这次研究的设计直击要害:
- 评审者是教授,不是学生:打分的人自己就是答题者群体的一员。这不是什么外部评审机构,而是同行评议——教授给教授打分。
- 样本量够大:近3000组对比,不是几十道题的玩具实验。这个量级意味着统计显著性毋庸置疑。
- 赢了75%,不是勉强及格:如果AI只是"差不多",可能50%出头。75%的胜率意味着AI在多数情况下给出了明显更好的答案。
Marc Andreessen在HN评论区引用这个研究时提出了一个激进论断:顶级AI模型给出的答案已经优于他所能接触到的99%的人——而他的社交圈几乎囊括了各领域最顶尖的人才。
HN社区炸开了锅:89分81评论背后的三派立场
这项研究在Hacker News上迅速获得89个赞和81条评论,讨论异常激烈。评论区大致分为三派:
乐观派:法律普惠的时代到了
"普通人终于能从臃肿的法律阶层手中夺回法治权利了。"——一位用户写道,"司法可及性的缺失是社会不平等的巨大推手。任何能弥合这一鸿沟的工具,都将帮助建立一个更公正的社会。"
这一派的核心论点:法律服务的昂贵和不可及,本质上是信息不对称造成的。律师们用拉丁文、判例引用和复杂的程序制造了一个普通人无法穿透的专业壁垒。AI恰好打破了这个壁垒——它不是替代律师,而是让每个人都能"带着AI律师"走进法庭。
审慎派:25%的失败率在法庭上等于灾难
"问题不在于AI赢了75%——而在于你不知道剩下25%什么时候会炸。"——一位用户以自身经历做了类比:他曾让Gemini帮助修复GRUB引导问题,结果AI给出的命令差点清空了他的硬盘。只有当明确告知系统使用BTRFS文件系统后,回答才变得合理。
在法律场景中,这种"25%概率给出灾难性建议"是致命的。一份有瑕疵的合同可能毁掉一家公司,一个错误的法律意见可能导致牢狱之灾。审慎派的观点是:在"知道AI什么时候靠得住"这个问题被解决之前,AI只能作为律师的辅助工具,不能替代。
质疑派:这不过是开卷考试
"图书馆比学生表现好……晚间新闻。"——有用户尖锐地指出,AI的核心能力是信息检索和重组,而法学入门课程的考试本质上是对已有知识的复述和应用。AI被训练过相关教材,在这个任务上表现好并不令人意外。
更犀利的批评来自对研究者背景的审视:Julian Nyarko本人就是"AI+法律"交叉领域的推动者,他的研究天然带有"AI赋能法律"的预设。另一位用户挖出了Nyarko的个人网站,调侃道:"他自己基本上就是个AI法学教授,这个研究不过是确认了他的存在。"

▲ AI在法律盲测中以75%胜率超越法学教授,斯坦福法学院2026
对AI创业者的三个信号
抛开学术辩论,这项研究的产业信号非常明确:
1. 垂直领域的AI知识产品窗口期正在关闭
法律服务AI化不是新赛道——DoNotPay、Harvey AI、Casetext等公司已经耕耘多年。但斯坦福这个研究释放的信号是:连教授都认不出AI写的法律分析了,普通客户更不可能。
这意味着什么?意味着"AI律师咨询"类产品从技术可行变成了市场就绪。窗口期已经从5年压缩到12-18个月。还在犹豫要不要做垂直法律AI产品的团队,现在是最后的上车时间。
2. "人类专家溢价"正在系统性瓦解
法律是最难被AI化的职业之一,因为它的核心是判断力和语境理解。如果法律都能被攻破,那么管理咨询、财务分析、市场研究这些更多依赖于信息处理的行业,被AI超越只会更快。
对AI创业者的启示:不要再问"AI能不能做X",而要问"当AI能做X之后,人类的独特价值在哪里"。这个问题的答案才是商业模式的核心。
3. 信任机制成为新的护城河
75%的胜率同时意味着25%的失败率。这创造了一个全新的需求:AI输出的验证和背书。
未来最值钱的不是"AI法律咨询",而是"经过人类律师审核的AI法律咨询"——把AI的效率优势和人类的专业判断结合起来。这个模式适用于所有专业服务领域:AI写分析报告+人类专家审核签字=新的行业标准。

▲ AI正在重塑法律服务的天平
我们能学到什么
- 不要低估AI在专业领域的进展速度。一年前还有大量法律从业者认为AI永远无法替代律师的核心工作,现在斯坦福的教授们用自己的打分证明了相反的事实。
- 专业壁垒的本质是信息不对称。当AI消解了信息不对称,律师、医生、顾问等职业的商业模式必须重构——从"卖信息"转向"卖判断",从"卖知识"转向"卖责任"。
- 先发优势窗口极短。当一项能力被学术研究正式验证后,商业化的竞争会以月为单位加速。斯坦福这个研究就是发令枪。
行动建议
对于AI创业者:
- 如果你在做垂直领域的AI知识产品,立即加大投入。窗口期比你想象的短得多。
- 如果你的产品形态是纯AI输出,考虑加入人类验证层。这不是倒退,而是建立信任壁垒。
- 关注"AI+专业服务"领域的监管动向。斯坦福这个研究必然会引起律师协会和司法部门的反应,这可能是机会也可能是风险。
对于个人从业者:
- 法律、会计、咨询等领域的从业者,现在开始学习如何与AI协作。不是你被AI替代,而是会用AI的同行替代不用AI的你。
- 专业判断力和客户关系管理是无法被AI化的核心能力,有意识地往这两个方向深化。
来源:斯坦福法学院新闻发布(2026年6月);Hacker News讨论(89 points, 81 comments);Julian Nyarko个人学术主页。
本文由AI辅助创作,经人工审核编辑发布
