2026-05-20
Google I/O 新模型来了:四倍速不到半价,跑 Agent 的人可以先测一轮
Google I/O 2026 开完,Pichai 一句话我盯着看了好几遍。 Gemini 3.5 Flash 的输出速度,是同类前沿模型四倍,价格不到一半。 这俩数比排名实用。 跑过 Agent 的都懂。一个任务拆十几步,每步调一次模型,又贵又慢的话,再好的想法也塞不进日常工作流。你想想看,等模型返回三四秒,十几步…
Google I/O 2026 开完,Pichai 一句话我盯着看了好几遍。
Gemini 3.5 Flash 的输出速度,是同类前沿模型四倍,价格不到一半。
这俩数比排名实用。

跑过 Agent 的都懂。一个任务拆十几步,每步调一次模型,又贵又慢的话,再好的想法也塞不进日常工作流。你想想看,等模型返回三四秒,十几步下去小半分钟没了,中间还得处理各种中间结果。
Google 这次直接打成本跟速度,这两块以前是 Agent 落地最大的坎。
顺手记两个 benchmark。Terminal-Bench 76.2%,MCP Atlas 83.6%。不用背。你看方向就行:Google 在推代码、工具调用、长任务、真实工作流。跟比谁闲聊分高,完全两条路。
Google 自己用得也吓人。
内部 AI 开发者工具,3 月每天烧五千亿 token,现在三万亿了。全 Google 体系从每月 480 万亿涨到 3.2 千万亿。
量级搁在这,内部早把 AI 当生产系统跑了,早过了 demo 阶段。

Gemini Omni 这条线更直接。
任意输入到任意输出,第一步从视频切入。给它图片、音频、视频、文字,它能生成或编辑视频。Gemini App、Google Flow、YouTube Shorts 先接,开发者和企业 API 后面再推。
做内容的人很快就会撞上这条线。以前剪片子要转文字、截画面、找片段、改字幕,来回倒好几趟。Omni 跑顺以后,产品演示、广告素材、课程切片这些低复杂度视频,流程会被压到很短。
Antigravity 和 Spark 是第三条腿。
Antigravity 做 agent-first 开发平台。Spark 是个跑在 Google Cloud VM 上的个人 Agent,24 小时挂着执行任务,你睡觉它干活,后面还会接 MCP 工具。
Google 今年 I/O 的信号很集中:模型、多模态、开发平台、工具协议、个人 Agent,全部往“能执行任务”上收。
别急着说谁超过谁。模型竞争已经从拼 benchmark 转到拼速度、拼成本、拼工具调用、拼长任务执行了。这几个维度,比参数实在。
关注我,及时了解更多 AI 资讯和 AI 知识。大小项目开发和方案咨询,都可以私信。