jixiaxue 知识库
blog / simon-willison-blog · 2026-05-19-gemini-35-flash

Gemini 3.5 Flash:更贵了,但 Google 打算用它驱动一切

1 个章节 · 0 条产出 · 1 条证据
2026-05-19

Gemini 3.5 Flash:更贵了,但 Google 打算用它驱动一切

来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-05-19 原文链接: https://simonwillison.net/2026/May/19/gemini-35-flash/

一句话总结

Google 在 I/O 大会上发布 Gemini 3.5 Flash 并将其部署到搜索、Gemini 应用等数十亿用户级产品中,但价格是前代 Flash 的 3-6 倍——三大 AI 实验室正同步试探 API 客户的价格承受力。

速览

  1. 跳过 Preview 直接 GA——Gemini 3.5 Flash 跳过 -preview 阶段,直接面向全球数十亿用户正式发布
  2. 全面铺开到核心产品——覆盖 Gemini 应用、Google Search AI Mode、Antigravity 开发平台、Android Studio 和企业平台
  3. 价格大幅上涨——每百万输入 token $1.50、输出 $9,是 3 Flash Preview 的 3 倍、3.1 Flash-Lite 的 6 倍
  4. 逼近 Pro 定价——与 Gemini 3.1 Pro($2/$12)价格差距已很小,定位模糊
  5. 行业性涨价趋势——GPT-5.5 是 GPT-5.4 的 2 倍,Claude Opus 4.7 是 4.6 的 1.46 倍,三家同步提价
  6. Artificial Analysis 实测成本惊人——3.5 Flash (high) 跑基准测试花费 $1,551.60,远超 3.1 Pro Preview 的 $892.28
  7. 新 Interactions API——Google 推出服务端历史管理 API,对标 OpenAI Responses 模式
  8. SVG 生成能力亮眼——一只骑自行车的鹈鹕 SVG 令人印象深刻,14,403 输出 token,成本不到 13 美分

核心内容

直接 GA 并全面部署到消费者产品

Gemini 3.5 Flash 跳过了此前 Flash 系列惯用的 -preview 阶段,直接进入正式可用状态。Google 将其同时铺开到面向消费者的 Gemini 应用、Google Search 的 AI Mode,面向开发者的 Antigravity 平台、Google AI Studio、Android Studio,以及面向企业的 Gemini Enterprise Agent Platform。模型 ID 为 gemini-3.5-flash,知识截止 2025 年 1 月,支持百万级输入 token 和 65,536 最大输出 token,但不支持 computer use。

Flash 系列价格大幅上涨,逼近 Pro

这是 Flash 系列最大的变化。定价从前代的低价位跳涨:

模型输入价格输出价格与 3.5 Flash 的比较
Gemini 3.1 Flash-Lite3.5 Flash 贵 6 倍
Gemini 3 Flash Preview3.5 Flash 贵 3 倍
Gemini 3.5 Flash$1.50/M$9/M
Gemini 3.1 Pro$2/M$12/M仅差 33%

Flash 本应是轻量低价的选择,但 3.5 Flash 的定价已经非常接近 Pro 级别,这使得 Flash 和 Pro 之间的定位变得模糊。

行业同步涨价:三大实验室在试探价格天花板

这不是 Google 独有的现象。OpenAI 的 GPT-5.5 价格是 GPT-5.4 的 2 倍,Anthropic 的 Claude Opus 4.7 考虑新 tokenizer 后是 4.6 的约 1.46 倍。三家同步提价意味着这是一个行业趋势——AI 实验室正在测试 API 客户愿意为更强模型支付多少。

Artificial Analysis 的基准测试实际成本数据更能说明问题:

  • Gemini 3.5 Flash (high):$1,551.60——超过 Gemini 3.1 Pro Preview 的 $892.28
  • Claude Opus 4.7 (Max Effort):$5,117.14
  • GPT-5.5 (xhigh):$3,357.00

高推理模式下的成本已经是天文数字级别。与此同时,Google 却将这个更贵的模型免费提供给数十亿消费者使用,说明 Google 正在用消费者规模补贴来建立生态壁垒。

新 Interactions API 对标 OpenAI

Google 推出了 beta 阶段的 Interactions API,核心功能是服务端历史管理,这与 OpenAI Responses API 引入的模式一致。平台层面的竞争正在从模型能力延伸到开发者工具链。

SVG 生成:鹈鹕骑自行车的惊艳效果

用 “Generate an SVG of a pelican riding a bicycle” 这个经典 prompt 测试,3.5 Flash 生成了一只戴复古飞行员墨镜、在月光下骑行的鹈鹕——黑色背景配蝙蝠、车灯照亮前路,风格化程度很高。代码注释甚至包含 <!-- Pelican Eye / Sunglasses (Cool Retro Aviators) -->。Hacker News 用户评论:“这只鹈鹕看起来像去迈阿密参加加密货币大会的。“整个调用仅花费不到 13 美分。

名言金句

  1. 3.5 Flash is available today to billions of people globally. —— Google 官方博客

  2. That pelican looks like it’s in Miami for a crypto conference. —— hedgehog, Hacker News

  3. It feels like all three of the major AI labs are starting to probe the price tolerance of their API customers. —— Simon Willison

可行建议

  • 评估迁移成本:如果你的项目依赖 Gemini Flash 系列的低价优势,3.5 Flash 的 3-6 倍涨价需要重新核算 token 预算
  • 对比 Pro 与 Flash:3.5 Flash 与 3.1 Pro 价差仅 33%,考虑 Pro 是否是更好的选择
  • 关注 Interactions API:如果你需要服务端对话历史管理,这是 Google 版本的实现,值得与 OpenAI Responses 做技术选型对比
  • 跟踪 3.5 Pro 发布:团队承诺”下个月”推出,定价将揭示 Google 的完整价格策略

资源清单

Gemini 3.5 Flash:更贵了,但 Google 打算用它驱动一切

Gemini 3.5 Flash:更贵了,但 Google 打算用它驱动一切

2026 年 5 月 19 日

今天在 Google I/O 上,Google 发布了 Gemini 3.5 Flash。这次跳过了 -preview 修饰符,直接进入正式可用状态,而且 Google 似乎正在将它用于大量核心产品:

3.5 Flash 今天面向全球数十亿用户开放:

  • 通过 Gemini 应用和 Google Search 中的 AI Mode 面向所有人
  • 通过 agent-first 开发平台 Google Antigravity、Google AI Studio 和 Android Studio 中的 Gemini API 面向开发者
  • 通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 面向企业用户

与以往 Gemini 发布一样,最有趣的细节藏在 What’s new in Gemini 3.5 Flash 开发者文档里。它的平台功能集与之前的 Gemini 3.x 系列基本一致,但不支持 computer use。模型 ID 为 gemini-3.5-flash。知识截止日期为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。

Google 还在推广一个新的 Interactions API,目前处于 beta 阶段,在我看来这是他们对 OpenAI Responses 所引入模式的翻版——特别是服务端历史管理。

价格上涨了

Gemini 3.5 Flash 伴随着一次显著的价格上调。“Flash” 系列之前的模型是 Gemini 3 Flash PreviewGemini 3.1 Flash-Lite。新的 3.5 Flash 价格是 3 Flash Preview 的 3 倍,是 3.1 Flash-Lite 的 6 倍(参见价格对比)。

以每百万输入 token $1.50、每百万输出 token $9 的价格来看,它已经接近 Google 自家的 Gemini 3.1 Pro($2 和 $12)了。

Gemini 团队承诺 3.5 Pro 将在”下个月”推出——价格大概还会更高。

这契合一个趋势:OpenAI 的 GPT-5.5 价格是 GPT-5.4 的 2 倍,Claude Opus 4.7 在考虑新 tokenizer 后大约是 4.6 的 1.46 倍。

考虑到价格上涨,看到 Google 将它铺开到如此多的免费消费者产品中很有意思。感觉三大 AI 实验室都在开始试探 API 客户的价格承受力。

Artificial Analysis 发布了用其专有基准测试运行各模型的成本,这是一种有用的衡量方式,能把 tokenization 和推理 token 增加等因素纳入考量。一些值得对比的数字:

3.5 Flash (high) 跑基准测试的成本远高于 3.1 Pro Preview!

其他厂商的一些数字:

一只骑自行车的鹈鹕

我用”Generate an SVG of a pelican riding a bicycle”调用 Gemini API,得到了这只鹈鹕,效果相当炸裂

黑色背景,天空中有蝙蝠映衬着风格化的月亮。鹈鹕造型很酷。鸟喙画得非常好。自行车车架有点扭曲,从踏板到后轮的横杆缺失。车灯照亮了前方的路面。整体相当有风格。

代码注释中写着:<!-- Pelican Eye / Sunglasses (Cool Retro Aviators) -->

hedgehog 在 Hacker News 上评论

这只鹈鹕看起来像去迈阿密参加加密货币大会的。

这一次调用花了 11 个输入 token 和 14,403 个输出 token,总成本不到 13 美分

证据原始数据 (1 条)
transcript-raw
/Users/shanfang/Documents/pe/jixiaxuegong/blog/simon-willison-blog/2026-05-19-gemini-35-flash/transcript-raw.md