AI风向

【AI风向】小米开源MiMo Code:SWE-Bench超越Claude Code的终端编程Agent

小米AI团队今日开源MiMo Code——一个能跑数百步不"失忆"的终端编程Agent,基于OpenCode构建,MIT协议,上线几小时GitHub星标即破2900。

MiMo Code三支柱架构:计算·记忆·进化▲ MiMo Code三支柱架构:计算·记忆·进化

事件回顾

2026年6月11日,小米MiMo团队正式开源了MiMo Code V0.1.0——一个终端原生的AI编程Agent,基于开源项目OpenCode构建,采用MIT许可证发布。上线数小时内,该项目在GitHub获得超过2900颗星标,在Hacker News上冲上热榜前三(324 points)。

这不是小米第一次在AI编程领域出牌。此前MiMo已经推出了MiMo-V2.5系列模型(1万亿参数MoE架构,1M token上下文窗口),但MiMo Code的意义完全不同:它不是一个模型,而是一个完整的编程Agent系统

MiMo Code的核心设计围绕三个支柱:计算(Computation)、记忆(Memory)、进化(Evolution)。这三个词精准对应了当前AI编程工具的三大痛点——单步决策质量差、长任务丢失上下文、跨会话无法积累经验。

在权威基准测试SWE-Bench Pro上,MiMo Code使用相同基础模型跑出62%的成绩,比Claude Code高出5个百分点。在Terminal-Bench 2上更是达到73%。这组数据直接挑战了"Claude Code是终端编程Agent之王"的行业共识。

为什么重要

1. "长程记忆"直击行业最大痛点

用过Claude Code或Codex CLI的开发者都有这个体验:前10个回合AI表现惊艳,30个回合后开始忘事,50个回合后完全不可用。根因很简单——所有对话历史堆在context window里,超出窗口就截断,长任务的"尾部"决策质量断崖式下降。

MiMo Code的解决方案是checkpoint写入器:在context window被填满之前,主动将结构化状态写入选定的持久化存储结构。需要时再显式召回。这解决了传统"摘要压缩"方案的根本缺陷——摘要不可回溯查询,而checkpoint可以。

用大白话说:Claude Code像是让AI边干活边记笔记但只能记在一张纸上,纸写满了前面的就丢了;MiMo Code像是给了AI一个带标签的笔记本,该存档时存档、该翻查时翻查。

2. "五路并行采样"重新定义决策质量

MiMo Code的Max Mode是一个颇具野心的功能:在每一个决策回合,同时跑5条独立的推理路径(temperature=1保证多样性),然后用同一模型的低温度版本做裁判,选出最佳方案执行。

在SWE-Bench Pro上,Max Mode比单次采样提升10-20%的性能。代价是4-5倍的token消耗——但换来了更可靠的单步决策。对于自动化执行场景(没有人类在旁边纠错),这个trade-off非常合理。

3. 小米用MIT协议打入AI工具生态

MIT协议意味着任何公司和个人都可以fork代码、修改、商用,几乎没有限制。OpenAI的Codex CLI虽然也开源,但绑定了OpenAI自家模型生态;Claude Code干脆不开源。MiMo Code支持接入DeepSeek、Kimi、GLM等多家模型API——工具层开放+模型层自由选择,这是一个完全不同的竞争姿势。

小米此举的战略意图非常清晰:靠开源工具层抢占开发者入口,靠MiMo-V2.5模型(限时免费)培养用户习惯,最终构建"硬件(小米设备)+ 模型(MiMo系列)+ 工具(MiMo Code)"的完整AI生态链。

SWE-Bench Pro实测对比:MiMo Code 62% vs Claude Code 57%▲ SWE-Bench Pro实测对比:MiMo Code 62% vs Claude Code 57%

我们能学到什么

1. AI编程工具赛道的竞争逻辑正在转变

2025年之前,AI编程工具的竞争逻辑是"谁的模型更强"。Cursor绑GPT、Claude Code绑Claude,工具本质上是模型的"分发渠道"。2026年这半年出现了根本性变化:工具层的工程能力正在和模型层的推理能力同等重要

OpenCode作为开源基础设施,让任何团队都能快速构建终端Agent(Hermes Agent的终端模式也是类似思路)。MiMo Code的成功证明:即使不用最强模型,通过并行采样、状态管理、跨会话学习这些工程手段,一样可以做出有竞争力的编程Agent。

这对AI创业者意味着:"模型-工具"之间的价值链正在重新分配。不一定要自研模型才能在AI工具赛道立足,工具层的独特工程能力本身就是护城河。

2. "记忆"是下一阶段Agent竞争的主战场

从Claude Code的Agent Skills到Hermes Agent的Memory系统,再到MiMo Code的Checkpoint写入器——2026年上半年的Agent军备竞赛正在聚焦于同一个能力:如何让Agent记住更多、更久、更结构化

这不是巧合。当一个Agent能稳定运行10步时,"记忆"不是瓶颈。但当Agent需要跑100步、处理百万行代码时,状态管理就不再是锦上添花,而是生存必须

3. 中国大厂的AI开源策略正在升级

从DeepSeek开源模型、到阿里开源Qwen系列、再到小米开源MiMo Code工具——中国AI公司的开源策略正在从"开源模型换口碑"升级为"开源工具层抢入口"。工具层的网络效应(用户越多、反馈越多、越难迁移)远强于模型层。

行动建议

  1. 如果你在用Claude Code或Codex CLI:花20分钟试用MiMo Code。一行命令安装(macOS/Linux:curl -fsSL mimo.xiaomi.com/install | bash),跑一个你熟悉的终端编程任务对比体验。重点关注长任务(>20步)下的上下文保持能力。
  2. 如果你是AI工具创业者:仔细阅读MiMo Code的官方技术博客(mimo.xiaomi.com/blog/mimo-code-long-horizon)。"计算-记忆-进化"三层架构是当前Agent设计的通用范式,它的并行采样(Max Mode)和checkpoint机制可以直接借鉴。
  3. 如果你在选型AI编程工具:不要只看SWE-Bench分数。MiMo Code的62% vs Claude Code的57%——5个百分点差距可能不如"是否支持你常用的模型API"重要。优先选择兼容你技术栈的工具。
  4. 关注长程Agent的基础设施机会:当编程Agent能稳定跑数百步时,会产生新的需求——Agent状态的可观测性、checkpoint的版本管理、多Agent协作时的共享记忆。这些都是2026年下半年的创业机会。

*参考来源:小米MiMo官方博客、GitHub XiaomiMiMo/MiMo-Code、KuCoin新闻报道、Gizmochina报道、HN讨论(2026年6月11日)*

本文由AI辅助创作,经人工审核编辑发布