AI风向

【AI风向】日本AI黑马Sakana成立"递归自我改进"实验室:让AI自己写代码迭代自己

当Anthropic高喊"AI自我改进太危险,快按下暂停键"时,这家日本公司已经默默做了两年——发表Nature论文、在编程竞赛中击败804名人类选手。现在,他们把这件事单独拉出来,成立了全球第一个RSI实验室。

事件回顾

2026年6月5日,东京——Sakana AI(サカナAI)正式宣布成立递归自我改进实验室(Recursive Self-Improvement Lab,简称RSI Lab)。这是全球第一个专门研究"让AI系统自主改进自身底层架构"的独立研究部门。

Sakana AI是谁?它是由前Google AI研究员Llion Jones(Transformer论文作者之一)和David Ha联合创立的日本AI公司,名字"Sakana"在日语里是"鱼"的意思——取"像鱼群一样集体涌现智慧"之意。成立不到两年,他们已经用一套完全不同于硅谷巨头"暴力堆算力"的打法,在全球AI竞赛中杀出了一条血路。

这次成立的RSI Lab并非从零开始,而是基于过去两年的六项里程碑研究成果:

技术路线图:两年六步,从LLM²到Nature论文

① LLM²(2024年):与牛津、剑桥合作,让大语言模型自动发明训练大语言模型的更好方法。该项目产出了DiscoPOP——一个完全由AI自主发现并编写代码的偏好优化算法。这是"AI²范式转变"的起点:AI模型已经强大到可以自己做研究来改进自己。

② Darwin Gödel Machine(2025年):与UBC合作,构建了一个能自主改写自身代码库的Agent进化谱系。在SWE-bench编程基准上,系统自动将基线性能提升了一倍多,实现了30个百分点的绝对提升

③ ShinkaEvolve(2025年):开源框架,展示了前所未有的"样本效率"。仅用150个样本就解决了传统暴力搜索难以攻克的优化问题,还成功生成了一种能提升MoE(混合专家)模型性能的新型负载均衡损失函数。

④ ALE-Agent(2025年):在AtCoder启发式竞赛058中,从804名人类选手中脱颖而出夺得第一名。它的核心能力不是烧更多算力,而是从自己的试错失败中提取结构化经验教训——一种自我学习机制。

⑤ Digital Red Queen(2026年):与MIT合作,在Core War沙盒中建立了开放式的对抗协同进化系统。LLM编写相互竞争的代码,触发了一场算法军备竞赛,自主涌现出了复杂的软件策略和收敛进化现象。这项工作为RSI在网络安全领域的应用奠定基础——让自主Agent在动态的算法对抗中持续发现、利用和修补漏洞。

⑥ AI Scientist(2024-2026年):这是Sakana的旗舰系统,也是它们登上《Nature》杂志(2026年3月26日)的研究成果。AI Scientist能全自动完成科学发现的完整闭环:从提出研究想法、执行实验、撰写完整论文到执行同行评审。

递归自我改进技术栈演进

▲ Sakana AI RSI Lab 技术路线图:从LLM²到Nature论文

核心哲学:不是"谁算力强",而是"谁更聪明"

这一系列成果背后是一条贯穿始终的方法论:效率优先,而非算力优先

Sakana AI在公告中直接把矛头对准了当前AI军备竞赛的核心逻辑:

"人类认知不是在无限资源中涌现的,它是在严格约束下通过开放的、不断复合的进化过程锻造而成的。在日本构建AI提供了终极设计约束——与其依赖暴力扩展,我们被迫追求优雅、适应性和自主性。"

他们把日本的"制造劣势"(计算资源不如硅谷巨头)翻转成了方法论优势:ShinkaEvolve用150个样本解决问题;ALE-Agent不靠更多推理时间而是从失败中学习;整个RSI的追求是样本效率最高的自我改进引擎,而非算力最密集的。

公告中明确写道:"它的进步应该建立在国家级别而非超大规模的计算预算上实现复合增长。"

效率优先vs算力优先

▲ ALE-Agent:击败804名人类选手,用150个样本解决暴力搜索难题

为什么重要

1. 与Anthropic形成鲜明对话

就在Sakana宣布RSI Lab的不到24小时前,Anthropic刚刚发表公开声明,呼吁全球暂停前沿AI研发,核心理由正是"递归自我改进"可能让AI失控。Sakana的公告像是在隔空回话:"我们已经做了两年了,而且我们可以做得更安全、更高效、更开放。"

HN上有评论者质疑Sakana是"hypebeast"(追逐炒作),但不可否认的是,当Anthropic在"喊停",而Sakana在"展示成果"时,后者在工程师群体中的可信度反而更高。

2. 重构全球AI竞争格局

Sakana的路线图最激进的部分是"民主化AI"的愿景:他们认为递归自我改进可以在适度的、样本高效的计算资源上实现,从而改变前沿AI的地缘分布。

公告写道:"那些永远无法在原始集群规模上竞争的国家、机构和领域,可以开始构建解决自身问题所需的AI系统。"

这意味着:RSI不是"赢家通吃"的资产,而是公共品

3. AI Agent从业者的终极工具箱

对于AI创业者来说,Sakana的六项技术不是学术论文里的抽象概念,而是一套逐渐成型的Agent自我改进工具链

  • LLM² → 用Agent自动发现更好的Agent训练方法
  • Darwin Gödel Machine → Agent自动改写自身代码,性能翻倍
  • ALE-Agent → Agent在竞赛环境中自我进化,超越人类专家
  • Digital Red Queen → Agent在对抗中持续进化(安全领域的核武器级应用)

我们能学到什么

1. "效率"是AI创业者的不对称优势

Sakana的核心竞争力不是"比Google更能烧钱",而是"用150个样本做到别人15000个样本的事"。对于一人公司和小型创业团队来说,这比任何一条融资新闻都重要——它证明:方法的优雅性可以战胜资源的暴力性。

具体启示:在构建AI Agent工作流时,重点关注"每单位token/每单位API调用"的产出效率,而非无限堆叠推理步骤。就像ShinkaEvolve用"自适应采样+新颖性过滤"取代"暴力搜索",你也可以用"精准prompt engineering+智能路由"取代"无限重试"。

2. 把"约束"变成"方法"

Sakana把日本的算力劣势变成了效率优势。对于AI创业者来说,"没钱"、"没人"、"没数据"同样可以成为独特的方法论来源——当你被迫在有限资源下做决策时,你做出的选择往往比资源充沛时的选择更聪明。

3. 关注"自我改进"Agent的实际落地

ShinkaEvolve是一个开源框架(Sakana在GitHub上开源了代码)。这意味着你现在就可以:

  • 用它来优化你自己的Agent系统的超参数
  • 用它来自动发现更好的prompt模板
  • 用它来进化出更高效的Agent工作流

潜在风险

HN上的理性声音也值得注意:"数据加工不等式"(DPI)理论指出,除非有无穷的真实数据,否则模型自我改进会导致"模型坍塌"——类似于近亲繁殖的退化效应。Sakana自身的样本效率哲学("少即是多")恰恰是应对这一风险的策略:每个训练循环使用的新鲜数据质量远比数量重要。

另外,Sakana强调RSI是"开源"和"民主化"的,但最终它的商业化路径是否真的能避开"先开源后封闭"的套路,仍然有待观察。


*参考来源:Sakana AI官方博客(sakana.ai/rsi-lab)、Hacker News讨论(26 points/22 comments)、ArXiv论文*
#AI创业 #AI Agent #递归自我改进 #SakanaAI #一人公司

本文由AI辅助创作,经人工审核编辑发布