通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-04-23 原文链接: https://simonwillison.net/2026/Apr/23/gpt-5-5/#atom-everything

一句话总结

GPT-5.5 发布但暂无官方 API，Simon Willison 通过逆向工程 Codex CLI 的认证机制开发了 LLM 插件 llm-openai-via-codex，利用 ChatGPT 订阅直接调用 GPT-5.5，并用鹈鹕 SVG 基准测试验证了模型能力。

速览

GPT-5.5 发布但 API 缺席——模型已在 Codex 和 ChatGPT 中可用，但 API 因安全审查尚未开放
Codex 后门 API 半官方化——OpenAI 官方表态支持第三方工具（OpenClaw、Pi、Claude Code 等）通过 Codex 端点使用 ChatGPT 订阅
llm-openai-via-codex 插件——Simon 让 Claude Code 逆向工程 Codex 仓库并构建了 LLM 插件，可用现有订阅调用 GPT-5.5
鹈鹕测试结果——默认模式生成的 SVG 质量一般，xhigh 推理力度下效果显著提升（耗时近 4 分钟，9,322 推理 token vs 默认 39 个）
GPT-5.5 定价翻倍——API 价格为 GPT-5.4 的两倍（输入 $5/M、输出 $30/M），5.4 之于 5.5 如同 Sonnet 之于 Opus
参差不齐的前沿依旧——Ethan Mollick 评测显示 GPT-5.5 在某些任务出色、另一些受限，难以预测

核心内容

Codex 后门 API 的合法化历程

事情的背景是 AI agent 工具与大厂订阅 API 之间的矛盾。OpenAI 和 Anthropic 都提供远低于原始 API 价格的月度订阅。OpenClaw 直接对接了这一机制，被 Anthropic 封禁后引发风波。

OpenAI 顺势做了一个策略性的”好人”动作：雇佣了 OpenClaw 创始人 Peter Steinberger，并公开宣布欢迎第三方工具通过 Codex CLI 的同一机制接入。OpenAI 的 Romain Huet 明确表态：“我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅。“Peter Steinberger 也确认”OpenAI 订阅是官方支持的”。

这意味着 /backend-api/codex/responses 端点实质上成为一个半官方 API，任何人都可以用它来消费 ChatGPT 订阅额度。

llm-openai-via-codex 插件的构建过程

Simon 让 Claude Code 逆向工程了 openai/codex 仓库，弄清楚认证令牌的存储方式，然后构建了 llm-openai-via-codex 插件。使用流程：

安装 Codex CLI 并登录
uv tool install llm
llm install llm-openai-via-codex
llm -m openai-codex/gpt-5.5 'prompt'

支持 LLM 的全部功能：图片附件（-a）、持续对话（llm chat）、日志查看（llm logs）、工具调用（llm --tool）。

鹈鹕 SVG 基准测试对比

Simon 用标志性的”鹈鹕骑自行车 SVG”测试 GPT-5.5。默认推理力度下结果一般：喙不错，身体形状略奇怪，车架不太对。

加上 -o reasoning_effort xhigh 后效果显著改善：鹈鹕有渐变效果、身体结构合理、自行车形状基本正确。xhigh 版本大量使用 CSS（包括渐变），消耗 9,322 个推理 token，而默认模式仅 39 个——推理力度对输出质量的影响极其显著。

代价是时间：xhigh 模式耗时近 4 分钟。

GPT-5.5 定价与市场定位

GPT-5.5 API 定价为 GPT-5.4 的整整两倍：输入 $5/M token，输出 $30/M token。GPT-5.5 Pro 更贵：输入 $30/M，输出 $180/M。

GPT-5.4 将继续可用。Simon 类比：5.4 之于 5.5 如同 Claude Sonnet 之于 Claude Opus——同系列中更便宜但依然可用的选项。

Ethan Mollick 的详细评测结论：参差不齐的前沿（jagged frontier）依然成立。

名言金句

“I ask it to build things and it builds exactly what I ask for!”（我让它构建东西，它就精确地构建出我要求的东西！）——Simon 对 GPT-5.5 的初步评价
“We want people to be able to use Codex, and their ChatGPT subscription, wherever they like!”（我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅！）——OpenAI Romain Huet
“The jagged frontier continues to hold.”（参差不齐的前沿依然成立。）——Ethan Mollick 对 GPT-5.5 的评价

可行建议

如果你有 ChatGPT 订阅且想在终端使用 GPT-5.5，可以安装 llm-openai-via-codex 插件绕过 API 缺席的限制
对质量敏感的任务，使用 -o reasoning_effort xhigh 可大幅提升输出质量，但要接受更长的等待时间
GPT-5.4 价格为 5.5 的一半且依然可用，对成本敏感的场景值得继续使用

资源清单

通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

2026 年 4 月 23 日

GPT-5.5 发布了。它可在 OpenAI Codex 中使用，并正在向付费 ChatGPT 订阅用户推出。我获得了一些预览访问权限，发现它是一个快速、高效且能力极强的模型。和近来的常态一样，很难用语言描述它好在哪里——我让它构建东西，它就精确地构建出我要求的东西！

今天的发布有一个显著的缺失——API：

API 部署需要不同的安全防护措施，我们正在与合作伙伴和客户密切合作，以满足大规模服务的安全需求。我们将很快为 API 提供 GPT-5.5 和 GPT-5.5 Pro。

当我运行鹈鹕基准测试时，我总是倾向于使用 API，以避免 ChatGPT 或其他 agent 工具中隐藏的系统提示词影响结果。

OpenClaw 后门

过去几个月，AI 领域持续存在的一个矛盾点是像 OpenClaw 和 Pi 这样的 agent 工具如何与大厂提供的 API 交互。

OpenAI 和 Anthropic 都提供热门的月度订阅，以远低于原始 API 的价格提供模型访问。

OpenClaw 直接对接了这一机制，然后被 Anthropic 封禁。这引发了一系列连锁反应。OpenAI——最近雇佣了 OpenClaw 创始人 Peter Steinberger——看到了一个轻松刷好感的机会，宣布 OpenClaw 可以继续通过与其（开源的）Codex CLI 工具相同的机制与 OpenAI 的订阅集成。

这是否意味着任何人都可以编写代码，与 OpenAI 的 Codex 专用 API 集成来使用已有的订阅？

前几天 Jeremy Howard 问道：

有人知道 OpenAI 是否官方支持 Pi 和 Opencode（据我所知）使用的 /backend-api/codex/responses 端点吗？

结果是 3 月 30 日 OpenAI 的 Romain Huet 发推说：

我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅！这意味着在应用中、在终端中，也包括在 JetBrains、Xcode、OpenCode、Pi，现在还有 Claude Code 中。

这也是 Codex CLI 和 Codex 应用服务器开源的原因！

Peter Steinberger 回复 Jeremy 说：

OpenAI 订阅是官方支持的。

llm-openai-via-codex

所以……我让 Claude Code 逆向工程了 openai/codex 仓库，搞清楚认证令牌是如何存储的，并为我构建了 llm-openai-via-codex，这是 LLM 的一个新插件，它可以使用你现有的 Codex 订阅来运行 prompt！

（事后想想，我真希望当时用的是 GPT-5.4 或 GPT-5.5 预览版来写这个项目，那会更有趣。我确实考虑过用 Codex 和 GPT-5.5 从头重写这个项目来制造这个笑话，但最终决定不再花更多时间了！）

使用方法：

安装 Codex CLI，购买 OpenAI 计划，登录 Codex
安装 LLM：uv tool install llm
安装新插件：llm install llm-openai-via-codex
开始使用：llm -m openai-codex/gpt-5.5 'Your prompt goes here'

所有现有的 LLM 功能都可以使用——用 -a filepath.jpg/URL 附加图片，llm chat -m openai-codex/gpt-5.5 开始持续对话，llm logs 查看日志对话，llm --tool ... 尝试工具支持。

一些鹈鹕测试

让我们生成一只鹈鹕！

llm install llm-openai-via-codex
llm -m openai-codex/gpt-5.5 'Generate an SVG of a pelican riding a bicycle'

这是我得到的结果：

有点变形——喙不错，鹈鹕身体形状略微奇怪，腿至少延伸到了踏板，自行车车架不太对。

我见过 GPT-5.4 更好的结果，所以我加上 -o reasoning_effort xhigh 再试了一次：

那一次花了将近四分钟才生成，但我认为效果好得多。

鹈鹕现在有了渐变效果，身体构造好得多，自行车几乎是正确的形状（只是在踏板和前轮之间多了一根杆），整体明显更好的图像。

如果你比较 SVG 代码（默认、xhigh），xhigh 版本采用了非常不同的方法，更加依赖 CSS——渐变效果就是证明。xhigh 使用了 9,322 个推理 token，而默认模式只使用了 39 个。

关于 GPT-5.5 的更多说明

GPT-5.5 最值得注意的事情之一是定价。API 上线后的定价将是 GPT-5.4 的两倍——每百万输入 token 5 美元、每百万输出 token 30 美元，而 5.4 的价格是 2.5 美元和 15 美元。

GPT-5.5 Pro 更贵：每百万输入 token 30 美元、每百万输出 token 180 美元。

GPT-5.4 将继续可用。价格只有 5.5 的一半，感觉 5.4 之于 5.5 就像 Claude Sonnet 之于 Claude Opus。

Ethan Mollick 写了一篇GPT-5.5 的详细评测，用一系列有趣的挑战测试了它（和 GPT-5.5 Pro）。他的结论是：参差不齐的前沿（jagged frontier）依然成立，GPT-5.5 在某些方面出色，在另一些方面受限，且难以预测。