AI风向

【AI风向】英伟达杀入CPU市场:RTX Spark能跑120B大模型,Hermes/OpenClaw成首批Windows原生Agent

6月1日Computex上,黄仁勋宣布Nvidia正式成为消费级PC芯片厂商,RTX Spark笔记本今秋上市,可本地运行1200亿参数AI Agent。微软同步发布Windows Agent原生安全框架,Hermes Agent和OpenClaw成为首批适配应用。

事件回顾:Nvidia不再只是"显卡厂"

今天凌晨,Nvidia在台北Computex上投下了一颗重磅炸弹——正式发布RTX Spark消费级超级芯片,标志着这家GPU巨头正式进入PC CPU市场,与Intel、AMD、Apple、Qualcomm正面竞争。

RTX Spark并非全新架构,而是与去年发布的DGX Spark个人AI超算采用同一颗GB10芯片。但这次,它被塞进了主流笔记本和迷你台式机中。旗舰版本搭载20个CPU核心、6144个GPU核心(CUDA核)、128GB LPDDR5X统一内存,AI算力达到1 petaflop(每秒1千万亿次运算)。

The Verge高级编辑Sean Hollister的标题一针见血:"Nvidia announces RTX Spark as 'the most efficient PC chip ever built'"(Nvidia宣布RTX Spark是"有史以来最高效的PC芯片")。但有趣的是,Nvidia没有提供任何具体数据或对比图表来支撑这个说法,仅由产品管理高级总监Mark Aevermann口头宣称。

首批RTX Spark笔记本电脑将在今年秋季上市,覆盖几乎所有主流品牌:华硕ProArt P14/P16、戴尔XPS 16、惠普OmniBook X14/Ultra 16、联想Yoga Pro 9N、微软Surface Laptop Ultra、微星Prestige N16 Flip AI。Aevermann透露,合作伙伴已在开发超过30款笔记本和10款台式机,覆盖不同价位段。

微软也同步发布了Surface品牌下最强的RTX Spark机型——Surface Laptop Ultra,Surface负责人Andrew Hill称之为"我们做过的最强大的产品"。

为什么对AI创业者重要:Hermes和OpenClaw被点名了

Nvidia官方新闻稿中,有一段话对AI创业内参的读者来说意义重大:

"AI agents have reached an inflection point, with open source projects such as OpenClaw and Hermes Agent achieving record-breaking numbers on developer networks like GitHub and OpenRouter. Yet broad adoption has been limited by the inability to run agents securely and privately on users' primary PCs."

翻译过来就是:AI Agent已经到了转折点,OpenClaw和Hermes Agent等开源项目在GitHub和OpenRouter上取得了破纪录的成绩,但广泛采用受限于无法在用户主力PC上安全、私密地运行Agent。

这是Nvidia和微软给出的解决方案:

1. Windows原生Agent安全框架 微软在Windows中加入了新的安全原语(security primitives),包括身份验证、容器隔离、策略控制和端到端安全能力。这意味着AI Agent可以作为Windows的一等公民运行,而非今天Sandbox中受限的"外来程序"。

2. Nvidia OpenShell运行时 OpenShell是Nvidia提供的Agent运行时环境,核心能力包括:

  • 用户可定义Agent的权限边界(能做什么、不能做什么)
  • 根据隐私策略智能路由——敏感查询留在本地模型,非敏感查询可上云
  • 对发送到云端模型的查询中的个人信息进行脱敏处理

3. Hermes Agent和OpenClaw的首批Windows原生应用 新闻稿明确写道:"This robust security and privacy layer is being adopted by leading agent developers such as Hermes Agent and OpenClaw in their new Windows apps."

这标志着这两个开源Agent项目从"开发者玩具"走向"消费级应用"的关键一步。Windows原生Agent应用将能够:

  • 操控Windows应用程序(键盘、鼠标、UI自动化)
  • 执行跨应用推理和任务编排
  • 在本地直接运行120B参数的大模型,无需联网

Nvidia举了三个具体场景:

  • 游戏主播:让PC自动关灯、静音麦克风、切换直播模式——一句话搞定
  • 设计师:用Adobe把草图变成完整图像,渲染3D模型,再生成AI视频——全程语音指令
  • 开发者:自动监控GitHub项目,自主修复QA问题,"接管笔记本的键盘和鼠标去做重复和无聊的任务"

技术细节:1200亿参数跑在本地意味着什么

RTX Spark最吸引AI创业者的看点是128GB统一内存。这允许在本地运行高达120B参数的大型语言模型,上下文窗口最大100万tokens。

对比一下目前主流的本地AI开发环境:

  • Apple M4 Max:最高128GB统一内存,但GPU算力和CUDA生态远不如Nvidia
  • Intel/AMD笔记本+独立显卡:CPU和GPU内存分离,大模型推理受限于显存(通常8-16GB)
  • 云端API(Claude、GPT):按token付费,大规模使用时成本快速攀升

RTX Spark的统一内存架构意味着:一个$2000-3000的笔记本就能替代$500+/月的云端AI推理账单。对于大量使用AI编码、内容生成、数据处理的AI创业者来说,这是实实在在的成本优势。

性能方面,Nvidia虽然没有提供具体基准数据,但给出了几个直观参考:

  • 渲染90GB的3D场景(通常需要专业工作站)
  • 编辑12K分辨率视频
  • 1440p分辨率下100fps运行《夺宝奇兵:古老之圈》3A大作
  • 图形性能约等于RTX 5070笔记本GPU

更关键的是,台积电3nm工艺+MediaTek联合定制的Arm架构CPU,在能效比上有望超过当前的x86阵营。Nvidia称RTX Spark在低负载时功耗可降至"个位数瓦特",满载80W。

DGX Station:企业级的核弹

同期发布的还有DGX Station for Windows——搭载GB300 Grace Blackwell Ultra桌面超级芯片的企业级AI工作站。

核心规格令人瞠目:

  • 748GB一致性内存
  • 20 petaflops FP4算力
  • 可本地运行1万亿参数模型
  • ConnectX-8 SuperNIC,800Gb/s网络
  • 可搭配RTX PRO 6000 Blackwell GPU扩展

定价未公布,但参考前代DGX Station($149,000起),这台Windows版本大概率是6位数美元的设备。Nvidia副总裁Chris Marriott表示:"DGX Station将超级计算级AI直接带入Windows,为数百万人日常设计、工程、研究和创作的平台注入AI能力。"

对AI创业者来说,这代表着一个信号:企业级AI Agent基础设施正在从Linux数据中心向Windows桌面下沉。未来一人公司或小团队可能租用/购买DGX Station级别的算力来运行复杂的多Agent工作流,而不必依赖云端。

我们能学到什么:AI创业者的三个机会

机会1:Windows Agent应用开发

首批适配的Hermes Agent和OpenClaw已经拿到了船票。但Windows Agent生态刚刚起步,以下方向存在明显空白:

  • 垂直行业Agent:法律文书自动化、医疗记录整理、建筑设计协同
  • Agent模板商店:类似iOS App Store的商业模式,为Windows Agent提供预配置工作流
  • Agent安全审计工具:OpenShell提供了权限框架,但企业需要第三方安全审计和合规方案

机会2:本地AI推理的降本增效

128GB统一内存+1 petaflop算力,意味着很多目前运行在云端的AI工作负载可以下沉到本地。对于:

  • AI内容创作者:本地运行Stable Diffusion/Flux级别模型,省去云端GPU租赁费
  • 独立开发者:用本地120B模型替代Claude API,年省数千美元
  • 小型SaaS团队:在本地完成AI推理,仅将结果同步到云端,降低延迟和成本

机会3:Arm on Windows的生态红利

RTX Spark采用Arm架构,需要Windows on Arm生态的完善。这意味着大量的应用迁移、适配和优化需求:

  • 传统x86应用在Arm上的性能调优
  • Arm原生AI推理框架的开发和维护
  • 跨架构的CI/CD工具链

Nvidia已经确认Blender、DaVinci Resolve、Cinema4D、Topaz Photo、CapCut等专业软件都已完成Arm原生适配。Adobe更是为RTX Spark重新架构了Photoshop和Premiere,称AI和图形性能提升2倍。

行动建议

  1. 关注Hermes Agent和OpenClaw的Windows版本发布节奏。这两个项目已经在官方新闻稿中被点名,意味着与Nvidia/微软有直接合作关系。率先学会在Windows上部署和定制这些Agent的人,将有6-12个月的先发优势。
  2. 评估本地推理对成本的降低。如果你的AI创业项目目前依赖Claude/GPT API,算一笔账:RTX Spark笔记本预计$2000-3500,能否在12个月内通过节省API费用收回成本?
  3. 研究OpenShell的API和权限模型。Nvidia的Agent运行时将成为Windows Agent生态的基础设施层,类似于iOS的App Sandbox。提前理解其安全模型和API设计,为未来开发Windows原生Agent做准备。
  4. 关注今秋首批机型的评测数据。Nvidia目前拒绝提供与Intel/AMD/Apple的性能对比数据,所有性能声明都是定性的。等到独立评测出炉后再做购买决策更稳妥。

风险提示

  • Nvidia首次进入消费级x86替代市场,驱动成熟度、软件兼容性、实际续航都是未知数
  • Arm on Windows的软件生态仍有大量空白,特别是企业级应用
  • "AI Agent操控桌面"的安全边界尚不明确,可能出现实际应用场景受限的情况
  • 定价策略未公布,如果首批机型定价过高($3000+),市场接受度存疑
  • 信息截至2026年6月1日,产品规格和发布时间可能有变动,请以官方最终公告为准
  • The Verge: "Nvidia announces RTX Spark as 'the most efficient PC chip ever built'" (2026-06-01)
  • NVIDIA Newsroom: "NVIDIA and Microsoft Reinvent Windows PCs for the Age of Personal AI" (2026-05-31)
  • NVIDIA Newsroom: "NVIDIA DGX Station for Windows Puts a Trillion-Parameter AI Supercomputer on Every Enterprise Desk" (2026-05-31)

#AI风向 #Nvidia #WindowsAgent #HermesAgent #OpenClaw #本地大模型 #一人公司

本文由AI辅助创作,经人工审核编辑发布