AI风向

【AI风向】DeepSeek终于支持视觉了!146分冲上HN热榜,AI创业者该兴奋什么?

DeepSeek在Chat端上线Vision功能,用户可上传图片让AI"看懂"世界。但API端尚未开放,这恰恰是AI创业者最应该关注的信号。

▲ DeepSeek Vision与其他主流视觉模型API价格对比(数据来源:各厂商官方定价,202▲ ▲ DeepSeek Vision与其他主流视觉模型API价格对比(数据来源:各厂商官方定价,2026年6月)

事件回顾

北京时间6月18日下午,DeepSeek悄然在Chat端(chat.deepseek.com)上线了Vision视觉理解功能。用户现在可以在对话框中上传图片,DeepSeek模型能够识别图片内容、描述场景、分析细节——这是DeepSeek首次在消费级产品中提供多模态能力。

消息迅速登上Hacker News热榜,获得146个points和66条评论,成为今日AI领域最受关注的工具更新之一。

实际上,DeepSeek在视觉模型领域并非新手。早在2024年底,DeepSeek就发布了DeepSeek-VL2(MoE视觉语言模型),但彼时仅限于研究论文和GitHub开源权重,并未对接到Chat产品。此次更新意味着DeepSeek将视觉能力正式产品化。

HN上多位用户实测反馈积极。用户earth2mars表示:"用一堆奇怪照片测试了,训练集似乎足够大,能准确判断照片里发生的事。"另一位用户则感叹:"多模态才是正道,DeepMind早就证明了这一点。"

为什么重要

对AI创业者而言,DeepSeek支持Vision有三个层面的重要意义:

第一,成本优势延伸到多模态。 DeepSeek一直以极低的价格著称——V3 API每百万token仅$0.27,是GPT-4o的1/50。如果Vision API延续这一定价策略,AI创业者就能以极低成本构建需要图像理解的应用:电商商品识别、文档OCR分析、UI自动化测试、监控画面解读等场景都将迎来成本骤降。

第二,Agent工具链的最后一环补上。 HN用户tornikeo的评论最值得关注:"我迫切需要Vision API——要让Claude Agents SDK跑起来,你需要一个支持视觉的API。如果DeepSeek API能'看见',它就能完整驱动Claude Code和Claude Agents SDK。"当前很多AI创业者用DeepSeek作为Claude Code的廉价后端,但缺少Vision能力限制了可处理的任务类型。这一补全将大幅扩展DeepSeek在Agent工作流中的应用范围。

第三,中国AI工具生态的里程碑。 DeepSeek成为首个在主流Chat产品中集成视觉理解的中国AI公司(通义千问、Kimi等虽有多模态模型,但产品化程度和海外影响力不及DeepSeek)。对做海外市场的AI创业者来说,这意味着有了一个国际化认知度高、性价比极强的中国模型可选。

▲ DeepSeek Vision驱动AI Agent工作流:从图片识别到自动化操作▲ ▲ DeepSeek Vision驱动AI Agent工作流:从图片识别到自动化操作

我们能学到什么

1. 关注API开放时间,提前准备场景。 Vision功能目前仅在Chat端可用,API尚未开放。但根据DeepSeek以往的产品节奏(V3 Chat上线后约2-4周开放API),Vision API大概率在2026年7月上线。聪明的创业者现在就应该开始测试Chat端的视觉理解效果,评估精度是否满足自己的业务需求,等API一开立刻切换。

2. 多模态正在成为AI工具的标配。 DeepSeek作为最后一家上线视觉的主流模型,说明"纯文本"模型的竞争窗口已经关闭。2026年下半年的AI工具如果还不支持图片输入,将很难获得用户认可。创业者在构建AI产品时,应从第一天就设计多模态交互。

3. 模型选择多元化正在加速。 HN评论中出现了MiniMax、MiMo、Qwen、Gemini Flash等多个替代方案的讨论——开发者正在主动寻找DeepSeek之外的低成本视觉模型。这表明视觉模型市场远未固化,创业者应保持灵活。

行动建议

  1. 立即测试:登录chat.deepseek.com,上传你的业务场景中的典型图片,测试识别准确度
  2. 准备迁移方案:如果你的产品当前依赖GPT-4o/Gemini的Vision API,可以开始评估DeepSeek Vision的成本优化空间
  3. 关注API公告:跟踪DeepSeek官方渠道(GitHub、Twitter),API一旦开放即可抢跑
  4. 场景挖掘:思考你的产品中哪些环节需要"看图理解"——客服看截图、运营看数据报表、质检看产品照片,这些都是Vision API的用武之地
  • Hacker News: "DeepSeek Introduces Vision" — 146 points, 66 comments (2026-06-18)
  • DeepSeek Chat: — Vision功能已在Web端上线
  • DeepSeek-VL2论文: GitHub deepseek-ai/DeepSeek-VL2
  • HN用户评论: tornikeo、earth2mars、jiehong等人的实测反馈

本文由AI辅助创作,经人工审核编辑发布