Gemini 3.5 Flash:更贵了,但 Google 打算用它驱动一切
来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-05-19 原文链接: https://simonwillison.net/2026/May/19/gemini-35-flash/
一句话总结
Google 在 I/O 大会上发布 Gemini 3.5 Flash 并将其部署到搜索、Gemini 应用等数十亿用户级产品中,但价格是前代 Flash 的 3-6 倍——三大 AI 实验室正同步试探 API 客户的价格承受力。
速览
- 跳过 Preview 直接 GA——Gemini 3.5 Flash 跳过
-preview阶段,直接面向全球数十亿用户正式发布 - 全面铺开到核心产品——覆盖 Gemini 应用、Google Search AI Mode、Antigravity 开发平台、Android Studio 和企业平台
- 价格大幅上涨——每百万输入 token $1.50、输出 $9,是 3 Flash Preview 的 3 倍、3.1 Flash-Lite 的 6 倍
- 逼近 Pro 定价——与 Gemini 3.1 Pro($2/$12)价格差距已很小,定位模糊
- 行业性涨价趋势——GPT-5.5 是 GPT-5.4 的 2 倍,Claude Opus 4.7 是 4.6 的 1.46 倍,三家同步提价
- Artificial Analysis 实测成本惊人——3.5 Flash (high) 跑基准测试花费 $1,551.60,远超 3.1 Pro Preview 的 $892.28
- 新 Interactions API——Google 推出服务端历史管理 API,对标 OpenAI Responses 模式
- SVG 生成能力亮眼——一只骑自行车的鹈鹕 SVG 令人印象深刻,14,403 输出 token,成本不到 13 美分
核心内容
直接 GA 并全面部署到消费者产品
Gemini 3.5 Flash 跳过了此前 Flash 系列惯用的 -preview 阶段,直接进入正式可用状态。Google 将其同时铺开到面向消费者的 Gemini 应用、Google Search 的 AI Mode,面向开发者的 Antigravity 平台、Google AI Studio、Android Studio,以及面向企业的 Gemini Enterprise Agent Platform。模型 ID 为 gemini-3.5-flash,知识截止 2025 年 1 月,支持百万级输入 token 和 65,536 最大输出 token,但不支持 computer use。
Flash 系列价格大幅上涨,逼近 Pro
这是 Flash 系列最大的变化。定价从前代的低价位跳涨:
| 模型 | 输入价格 | 输出价格 | 与 3.5 Flash 的比较 |
|---|---|---|---|
| Gemini 3.1 Flash-Lite | 低 | 低 | 3.5 Flash 贵 6 倍 |
| Gemini 3 Flash Preview | 中 | 中 | 3.5 Flash 贵 3 倍 |
| Gemini 3.5 Flash | $1.50/M | $9/M | — |
| Gemini 3.1 Pro | $2/M | $12/M | 仅差 33% |
Flash 本应是轻量低价的选择,但 3.5 Flash 的定价已经非常接近 Pro 级别,这使得 Flash 和 Pro 之间的定位变得模糊。
行业同步涨价:三大实验室在试探价格天花板
这不是 Google 独有的现象。OpenAI 的 GPT-5.5 价格是 GPT-5.4 的 2 倍,Anthropic 的 Claude Opus 4.7 考虑新 tokenizer 后是 4.6 的约 1.46 倍。三家同步提价意味着这是一个行业趋势——AI 实验室正在测试 API 客户愿意为更强模型支付多少。
Artificial Analysis 的基准测试实际成本数据更能说明问题:
- Gemini 3.5 Flash (high):$1,551.60——超过 Gemini 3.1 Pro Preview 的 $892.28
- Claude Opus 4.7 (Max Effort):$5,117.14
- GPT-5.5 (xhigh):$3,357.00
高推理模式下的成本已经是天文数字级别。与此同时,Google 却将这个更贵的模型免费提供给数十亿消费者使用,说明 Google 正在用消费者规模补贴来建立生态壁垒。
新 Interactions API 对标 OpenAI
Google 推出了 beta 阶段的 Interactions API,核心功能是服务端历史管理,这与 OpenAI Responses API 引入的模式一致。平台层面的竞争正在从模型能力延伸到开发者工具链。
SVG 生成:鹈鹕骑自行车的惊艳效果
用 “Generate an SVG of a pelican riding a bicycle” 这个经典 prompt 测试,3.5 Flash 生成了一只戴复古飞行员墨镜、在月光下骑行的鹈鹕——黑色背景配蝙蝠、车灯照亮前路,风格化程度很高。代码注释甚至包含 <!-- Pelican Eye / Sunglasses (Cool Retro Aviators) -->。Hacker News 用户评论:“这只鹈鹕看起来像去迈阿密参加加密货币大会的。“整个调用仅花费不到 13 美分。
名言金句
-
3.5 Flash is available today to billions of people globally. —— Google 官方博客
-
That pelican looks like it’s in Miami for a crypto conference. —— hedgehog, Hacker News
-
It feels like all three of the major AI labs are starting to probe the price tolerance of their API customers. —— Simon Willison
可行建议
- 评估迁移成本:如果你的项目依赖 Gemini Flash 系列的低价优势,3.5 Flash 的 3-6 倍涨价需要重新核算 token 预算
- 对比 Pro 与 Flash:3.5 Flash 与 3.1 Pro 价差仅 33%,考虑 Pro 是否是更好的选择
- 关注 Interactions API:如果你需要服务端对话历史管理,这是 Google 版本的实现,值得与 OpenAI Responses 做技术选型对比
- 跟踪 3.5 Pro 发布:团队承诺”下个月”推出,定价将揭示 Google 的完整价格策略
