jixiaxue 知识库
blog / simon-willison-blog · 2026-04-23-gpt-5-5-via-codex-api

通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

1 个章节 · 0 条产出 · 1 条证据
2026-04-23

通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

来源: Simon Willison’s Weblog | 作者: Simon Willison | 日期: 2026-04-23 原文链接: https://simonwillison.net/2026/Apr/23/gpt-5-5/#atom-everything

一句话总结

GPT-5.5 发布但暂无官方 API,Simon Willison 通过逆向工程 Codex CLI 的认证机制开发了 LLM 插件 llm-openai-via-codex,利用 ChatGPT 订阅直接调用 GPT-5.5,并用鹈鹕 SVG 基准测试验证了模型能力。

速览

  1. GPT-5.5 发布但 API 缺席——模型已在 Codex 和 ChatGPT 中可用,但 API 因安全审查尚未开放
  2. Codex 后门 API 半官方化——OpenAI 官方表态支持第三方工具(OpenClaw、Pi、Claude Code 等)通过 Codex 端点使用 ChatGPT 订阅
  3. llm-openai-via-codex 插件——Simon 让 Claude Code 逆向工程 Codex 仓库并构建了 LLM 插件,可用现有订阅调用 GPT-5.5
  4. 鹈鹕测试结果——默认模式生成的 SVG 质量一般,xhigh 推理力度下效果显著提升(耗时近 4 分钟,9,322 推理 token vs 默认 39 个)
  5. GPT-5.5 定价翻倍——API 价格为 GPT-5.4 的两倍(输入 $5/M、输出 $30/M),5.4 之于 5.5 如同 Sonnet 之于 Opus
  6. 参差不齐的前沿依旧——Ethan Mollick 评测显示 GPT-5.5 在某些任务出色、另一些受限,难以预测

核心内容

Codex 后门 API 的合法化历程

事情的背景是 AI agent 工具与大厂订阅 API 之间的矛盾。OpenAI 和 Anthropic 都提供远低于原始 API 价格的月度订阅。OpenClaw 直接对接了这一机制,被 Anthropic 封禁后引发风波。

OpenAI 顺势做了一个策略性的”好人”动作:雇佣了 OpenClaw 创始人 Peter Steinberger,并公开宣布欢迎第三方工具通过 Codex CLI 的同一机制接入。OpenAI 的 Romain Huet 明确表态:“我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅。“Peter Steinberger 也确认”OpenAI 订阅是官方支持的”。

这意味着 /backend-api/codex/responses 端点实质上成为一个半官方 API,任何人都可以用它来消费 ChatGPT 订阅额度。

llm-openai-via-codex 插件的构建过程

Simon 让 Claude Code 逆向工程了 openai/codex 仓库,弄清楚认证令牌的存储方式,然后构建了 llm-openai-via-codex 插件。使用流程:

  1. 安装 Codex CLI 并登录
  2. uv tool install llm
  3. llm install llm-openai-via-codex
  4. llm -m openai-codex/gpt-5.5 'prompt'

支持 LLM 的全部功能:图片附件(-a)、持续对话(llm chat)、日志查看(llm logs)、工具调用(llm --tool)。

鹈鹕 SVG 基准测试对比

Simon 用标志性的”鹈鹕骑自行车 SVG”测试 GPT-5.5。默认推理力度下结果一般:喙不错,身体形状略奇怪,车架不太对。

加上 -o reasoning_effort xhigh 后效果显著改善:鹈鹕有渐变效果、身体结构合理、自行车形状基本正确。xhigh 版本大量使用 CSS(包括渐变),消耗 9,322 个推理 token,而默认模式仅 39 个——推理力度对输出质量的影响极其显著。

代价是时间:xhigh 模式耗时近 4 分钟。

GPT-5.5 定价与市场定位

GPT-5.5 API 定价为 GPT-5.4 的整整两倍:输入 $5/M token,输出 $30/M token。GPT-5.5 Pro 更贵:输入 $30/M,输出 $180/M。

GPT-5.4 将继续可用。Simon 类比:5.4 之于 5.5 如同 Claude Sonnet 之于 Claude Opus——同系列中更便宜但依然可用的选项。

Ethan Mollick 的详细评测结论:参差不齐的前沿(jagged frontier)依然成立。

名言金句

  1. “I ask it to build things and it builds exactly what I ask for!”(我让它构建东西,它就精确地构建出我要求的东西!)——Simon 对 GPT-5.5 的初步评价
  2. “We want people to be able to use Codex, and their ChatGPT subscription, wherever they like!”(我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅!)——OpenAI Romain Huet
  3. “The jagged frontier continues to hold.”(参差不齐的前沿依然成立。)——Ethan Mollick 对 GPT-5.5 的评价

可行建议

  • 如果你有 ChatGPT 订阅且想在终端使用 GPT-5.5,可以安装 llm-openai-via-codex 插件绕过 API 缺席的限制
  • 对质量敏感的任务,使用 -o reasoning_effort xhigh 可大幅提升输出质量,但要接受更长的等待时间
  • GPT-5.4 价格为 5.5 的一半且依然可用,对成本敏感的场景值得继续使用

资源清单

通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

通过半官方 Codex 后门 API 体验 GPT-5.5 的鹈鹕测试

2026 年 4 月 23 日

GPT-5.5 发布了。它可在 OpenAI Codex 中使用,并正在向付费 ChatGPT 订阅用户推出。我获得了一些预览访问权限,发现它是一个快速、高效且能力极强的模型。和近来的常态一样,很难用语言描述它好在哪里——我让它构建东西,它就精确地构建出我要求的东西!

今天的发布有一个显著的缺失——API:

API 部署需要不同的安全防护措施,我们正在与合作伙伴和客户密切合作,以满足大规模服务的安全需求。我们将很快为 API 提供 GPT-5.5 和 GPT-5.5 Pro。

当我运行鹈鹕基准测试时,我总是倾向于使用 API,以避免 ChatGPT 或其他 agent 工具中隐藏的系统提示词影响结果。

OpenClaw 后门

过去几个月,AI 领域持续存在的一个矛盾点是像 OpenClaw 和 Pi 这样的 agent 工具如何与大厂提供的 API 交互。

OpenAI 和 Anthropic 都提供热门的月度订阅,以远低于原始 API 的价格提供模型访问。

OpenClaw 直接对接了这一机制,然后被 Anthropic 封禁。这引发了一系列连锁反应。OpenAI——最近雇佣了 OpenClaw 创始人 Peter Steinberger——看到了一个轻松刷好感的机会,宣布 OpenClaw 可以继续通过与其(开源的)Codex CLI 工具相同的机制与 OpenAI 的订阅集成。

这是否意味着任何人都可以编写代码,与 OpenAI 的 Codex 专用 API 集成来使用已有的订阅?

前几天 Jeremy Howard 问道

有人知道 OpenAI 是否官方支持 Pi 和 Opencode(据我所知)使用的 /backend-api/codex/responses 端点吗?

结果是 3 月 30 日 OpenAI 的 Romain Huet 发推说

我们希望人们能在任何地方使用 Codex 和他们的 ChatGPT 订阅!这意味着在应用中、在终端中,也包括在 JetBrains、Xcode、OpenCode、Pi,现在还有 Claude Code 中。

这也是 Codex CLI 和 Codex 应用服务器开源的原因!

Peter Steinberger 回复 Jeremy 说:

OpenAI 订阅是官方支持的。

llm-openai-via-codex

所以……我让 Claude Code 逆向工程了 openai/codex 仓库,搞清楚认证令牌是如何存储的,并为我构建了 llm-openai-via-codex,这是 LLM 的一个新插件,它可以使用你现有的 Codex 订阅来运行 prompt!

(事后想想,我真希望当时用的是 GPT-5.4 或 GPT-5.5 预览版来写这个项目,那会更有趣。我确实考虑过用 Codex 和 GPT-5.5 从头重写这个项目来制造这个笑话,但最终决定不再花更多时间了!)

使用方法:

  1. 安装 Codex CLI,购买 OpenAI 计划,登录 Codex
  2. 安装 LLM:uv tool install llm
  3. 安装新插件:llm install llm-openai-via-codex
  4. 开始使用:llm -m openai-codex/gpt-5.5 'Your prompt goes here'

所有现有的 LLM 功能都可以使用——用 -a filepath.jpg/URL 附加图片,llm chat -m openai-codex/gpt-5.5 开始持续对话,llm logs 查看日志对话,llm --tool ... 尝试工具支持

一些鹈鹕测试

让我们生成一只鹈鹕!

llm install llm-openai-via-codex
llm -m openai-codex/gpt-5.5 'Generate an SVG of a pelican riding a bicycle'

这是我得到的结果

有点变形——喙不错,鹈鹕身体形状略微奇怪,腿至少延伸到了踏板,自行车车架不太对。

我见过 GPT-5.4 更好的结果,所以我加上 -o reasoning_effort xhigh 再试了一次

那一次花了将近四分钟才生成,但我认为效果好得多。

鹈鹕现在有了渐变效果,身体构造好得多,自行车几乎是正确的形状(只是在踏板和前轮之间多了一根杆),整体明显更好的图像。

如果你比较 SVG 代码(默认xhigh),xhigh 版本采用了非常不同的方法,更加依赖 CSS——渐变效果就是证明。xhigh 使用了 9,322 个推理 token,而默认模式只使用了 39 个。

关于 GPT-5.5 的更多说明

GPT-5.5 最值得注意的事情之一是定价。API 上线后的定价将是 GPT-5.4 的两倍——每百万输入 token 5 美元、每百万输出 token 30 美元,而 5.4 的价格是 2.5 美元和 15 美元。

GPT-5.5 Pro 更贵:每百万输入 token 30 美元、每百万输出 token 180 美元。

GPT-5.4 将继续可用。价格只有 5.5 的一半,感觉 5.4 之于 5.5 就像 Claude Sonnet 之于 Claude Opus。

Ethan Mollick 写了一篇GPT-5.5 的详细评测,用一系列有趣的挑战测试了它(和 GPT-5.5 Pro)。他的结论是:参差不齐的前沿(jagged frontier)依然成立,GPT-5.5 在某些方面出色,在另一些方面受限,且难以预测。

证据原始数据 (1 条)
transcript-raw
/Users/shanfang/Documents/pe/jixiaxuegong/blog/simon-willison-blog/2026-04-23-gpt-5-5-via-codex-api/transcript-raw.md