返回文章列表

2026-05-20

Google I/O 新模型来了:四倍速不到半价,跑 Agent 的人可以先测一轮

Google I/O 2026 开完,Pichai 一句话我盯着看了好几遍。 Gemini 3.5 Flash 的输出速度,是同类前沿模型四倍,价格不到一半。 这俩数比排名实用。 跑过 Agent 的都懂。一个任务拆十几步,每步调一次模型,又贵又慢的话,再好的想法也塞不进日常工作流。你想想看,等模型返回三四秒,十几步…

Google I/O 2026 开完,Pichai 一句话我盯着看了好几遍。

Gemini 3.5 Flash 的输出速度,是同类前沿模型四倍,价格不到一半。

这俩数比排名实用。

Google I/O 2026 官方发布页

跑过 Agent 的都懂。一个任务拆十几步,每步调一次模型,又贵又慢的话,再好的想法也塞不进日常工作流。你想想看,等模型返回三四秒,十几步下去小半分钟没了,中间还得处理各种中间结果。

Google 这次直接打成本跟速度,这两块以前是 Agent 落地最大的坎。

顺手记两个 benchmark。Terminal-Bench 76.2%,MCP Atlas 83.6%。不用背。你看方向就行:Google 在推代码、工具调用、长任务、真实工作流。跟比谁闲聊分高,完全两条路。

Google 自己用得也吓人。

内部 AI 开发者工具,3 月每天烧五千亿 token,现在三万亿了。全 Google 体系从每月 480 万亿涨到 3.2 千万亿。

量级搁在这,内部早把 AI 当生产系统跑了,早过了 demo 阶段。

Google I/O 2026 三个 AI 更新

Gemini Omni 这条线更直接。

任意输入到任意输出,第一步从视频切入。给它图片、音频、视频、文字,它能生成或编辑视频。Gemini App、Google Flow、YouTube Shorts 先接,开发者和企业 API 后面再推。

做内容的人很快就会撞上这条线。以前剪片子要转文字、截画面、找片段、改字幕,来回倒好几趟。Omni 跑顺以后,产品演示、广告素材、课程切片这些低复杂度视频,流程会被压到很短。

Antigravity 和 Spark 是第三条腿。

Antigravity 做 agent-first 开发平台。Spark 是个跑在 Google Cloud VM 上的个人 Agent,24 小时挂着执行任务,你睡觉它干活,后面还会接 MCP 工具。

Google 今年 I/O 的信号很集中:模型、多模态、开发平台、工具协议、个人 Agent,全部往“能执行任务”上收。

别急着说谁超过谁。模型竞争已经从拼 benchmark 转到拼速度、拼成本、拼工具调用、拼长任务执行了。这几个维度,比参数实在。

关注我,及时了解更多 AI 资讯和 AI 知识。大小项目开发和方案咨询,都可以私信。