jixiaxue 知识库
evidence · 2026-04-15

信息源索引

/Users/shanfang/Documents/pe/jixiaxuegong/research/Harness-Engineering/evidence/信息源索引.md

信息源索引

本次调研使用的 24 篇源文章的结构化索引


文章列表

1. OpenAI Engineering — Leveraging Codex in an Agent-First World

字段内容
标题Engineering at OpenAI: Leveraging Codex in an Agent-First World
作者Ryan Lopopolo
日期2026-02-11
URLhttps://openai.com/engineering/leveraging-codex
质量分级P0(官方工程博客,含第一手实验数据)
框架位置2-工业实践案例.md(主)、0-概念定义与演化.md(AGENTS.md 定义)、1-架构与核心组件.md(linter + 结构测试)

核心论点:


2. Mitchell Hashimoto — My AI Adoption Journey

字段内容
标题My AI Adoption Journey
作者Mitchell Hashimoto(HashiCorp 联合创始人)
日期2025 年(具体日期未标注)
URLhttps://mitchellh.com/writing/ai-adoption-journey
质量分级P1(顶级工程师个人博客,操作性极强的第一手经验)
框架位置0-概念定义与演化.md(定义提炼)、4-开发者采纳指南.md(6阶段路径)

核心论点:


3. Martin Fowler — Harness Engineering

字段内容
标题Harness Engineering
作者Martin Fowler
日期2025-2026(具体日期未标注)
URLhttps://martinfowler.com/articles/harness-engineering.html
质量分级P1(软件工程领域最高权威之一,命名和定义直接影响行业话语体系)
框架位置0-概念定义与演化.md(权威定义、三层框架)、3-核心争议与辩论.md

核心论点:


4. Philipp Schmid — Agent Harness 2026

字段内容
标题Agent Harness 2026
作者Philipp Schmid(Hugging Face 技术负责人)
日期2026 年(具体日期未标注)
URLhttps://www.philschmid.de/agent-harness-2026
质量分级P1(顶级 ML 工程师,提出影响力强的计算机类比框架)
框架位置0-概念定义与演化.md(OS 类比)、1-架构与核心组件.md(三策略)、3-核心争议与辩论.md(轨迹竞争优势)

核心论点:


5. Latent Space — Is Harness Engineering Real?

字段内容
标题Is Harness Engineering Real?
作者Latent Space(swyx + Alessio Fanelli)
日期2026 年(具体日期未标注)
URLhttps://www.latent.space/p/harness-engineering
质量分级P2(顶级 AI 工程师 Newsletter,代表社区共识与争议全景)
框架位置3-核心争议与辩论.md(主)、2-工业实践案例.md(Cursor 估值)、0-概念定义与演化.md(社区采纳信号)

核心论点:


6. Stripe — Minions: How Stripe Uses AI Agents at Scale

字段内容
标题Minions: How Stripe Uses AI Agents at Scale
作者Stripe Engineering
日期2025-2026(具体日期未标注)
URLhttps://stripe.com/blog/minions-ai-agents
质量分级P0(顶级金融科技公司工程博客,含可信规模数据)
框架位置2-工业实践案例.md(主)、1-架构与核心组件.md(devbox + MCP 工具链)、4-开发者采纳指南.md(企业路径)

核心论点:


7. Cursor — Self-Driving Codebases

字段内容
标题Self-Driving Codebases
作者Cursor Engineering
日期2025-2026(具体日期未标注)
URLhttps://www.cursor.com/blog/self-driving-codebases
质量分级P0($500 亿估值公司工程博客,架构演进路径最完整)
框架位置1-架构与核心组件.md(四代架构演进、反脆弱性设计)、2-工业实践案例.md、3-核心争议与辩论.md(约束 vs 指令)

核心论点:


8. arXiv — OPENDEV: A Terminal-Native AI Coding Agent

字段内容
标题OPENDEV: A Terminal-Native AI Coding Agent
作者未标注(arXiv 论文)
日期2026 年(arXiv: 2603.05344)
URLhttps://arxiv.org/abs/2603.05344
质量分级P0(同行评审学术论文,提供架构模式的理论基础)
框架位置1-架构与核心组件.md(双 Agent 架构、惰性工具发现、自适应上下文压缩)

核心论点:


9. METR — SWE-bench Passing PRs Are Not Mergeable

字段内容
标题SWE-bench Passing PRs Are Not Mergeable
作者METR(Model Evaluation & Threat Research)
日期2025-2026(具体日期未标注)
URLhttps://metr.org/blog/swe-bench-passing-prs
质量分级P2(独立 AI 安全研究机构,评测方法论严谨,结论对行业有直接冲击)
框架位置3-核心争议与辩论.md(主)、4-开发者采纳指南.md(验证层设计)

核心论点:


10. Anthropic — Harness Design for Long-Running Agent Applications

字段内容
标题Harness Design for Long-Running Agent Applications
作者Anthropic Engineering
日期2025-2026(具体日期未标注)
URLhttps://www.anthropic.com/engineering/harness-design-long-running-apps
质量分级P0(模型开发商官方工程指南,具有最高权威性)
框架位置1-架构与核心组件.md(GAN 启发多 Agent 架构)、3-核心争议与辩论.md(两大失败模式)、4-开发者采纳指南.md(原则)

核心论点:



二、扩展信息源(补充搜索)

11. Andrej Karpathy — Context Engineering 定义推文

字段内容
标题Context Engineering 定义推文
作者Andrej Karpathy
日期2025-06-25
URLhttps://x.com/karpathy/status/1937902205765607626
质量分级P1(顶级 AI 研究者 X 推文,直接推动行业术语演变)
框架位置0-概念定义与演化.md

核心论点:


12. LangChain — Context Engineering for Agents

字段内容
标题Context Engineering for Agents
作者LangChain 团队
日期2025-07-02(更新 2025-10-19)
URLhttps://blog.langchain.com/context-engineering-for-agents/
质量分级P1(主流 Agent 框架官方博客,框架被行业广泛引用)
框架位置1-架构与核心组件.md

核心论点:


13. Anthropic — Effective Context Engineering for AI Agents

字段内容
标题Effective Context Engineering for AI Agents
作者Anthropic Applied AI 团队
日期2025-09-29
URLhttps://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
质量分级P0(模型开发商官方工程指南,具有最高权威性)
框架位置1-架构与核心组件.md、0-概念定义与演化.md

核心论点:


14. HumanLayer — Skill Issue: Harness Engineering for Coding Agents

字段内容
标题Skill Issue: Harness Engineering for Coding Agents
作者Kyle (@0xblacklight)
日期2026-03-12
URLhttps://www.humanlayer.dev/blog/skill-issue-harness-engineering-for-coding-agents
质量分级P1(实操性极强的第一手工程经验,含可量化的实验数据)
框架位置3-核心争议与辩论.md、4-开发者采纳指南.md

核心论点:


15. Charlie Guo (OpenAI) — The Emerging Harness Engineering Playbook

字段内容
标题The Emerging Harness Engineering Playbook
作者Charlie Guo(OpenAI Developer Experience Engineer)
日期2026-02-22
URLhttps://www.ignorance.ai/p/the-emerging-harness-engineering
质量分级P1(OpenAI 内部工程师视角,含三大标杆案例横向对比)
框架位置2-工业实践案例.md、3-核心争议与辩论.md

核心论点:


16. Octopus Deploy — Harness Engineering: The Power of AI

字段内容
标题Harness Engineering: The Power of AI
作者Steve Fenton
日期2026-03-13
URLhttps://octopus.com/devops/continuous-delivery/harness-engineering/
质量分级P2(DevOps/CD 领域专业视角,补充非 AI-native 工程师的理解框架)
框架位置1-架构与核心组件.md

核心论点:


17. arXiv — Natural-Language Agent Harnesses (NLAHs)

字段内容
标题Natural-Language Agent Harnesses (NLAHs)
作者Linyue Pan 等
日期2026-03-26
URLhttps://arxiv.org/abs/2603.25723
质量分级P0(同行评审学术论文,将 harness engineering 理论化和标准化)
框架位置0-概念定义与演化.md、3-核心争议与辩论.md

核心论点:


18. MIT Technology Review — From Vibe Coding to Context Engineering

字段内容
标题From Vibe Coding to Context Engineering
作者MIT Technology Review
日期2025-11-05
URLhttps://www.technologyreview.com/2025/11/05/
质量分级P2(权威科技媒体,记录行业叙事转变的标志性报道)
框架位置0-概念定义与演化.md

核心论点:


19. The New Stack — Context Is AI Coding’s Real Bottleneck

字段内容
标题Context Is AI Coding’s Real Bottleneck in 2026
作者Greg Foster(Graphite CTO)
日期2026-03-14
URLhttps://thenewstack.io/context-is-ai-codings-real-bottleneck-in-2026/
质量分级P2(CTO 第一手行业观察,工程实践视角鲜明)
框架位置3-核心争议与辩论.md

核心论点:


20. Epsilla — The Third Evolution

字段内容
标题Harness Engineering: The Third Evolution
日期2026-03-25
URLhttps://www.epsilla.com/blogs/harness-engineering-evolution-
质量分级P3(社区科普内容,演化叙事框架清晰)
框架位置0-概念定义与演化.md

核心论点:


21. 袁朝发 — Agent 不好用,也许不是模型的问题

字段内容
标题Agent 不好用,也许不是模型的问题
日期2026-03-14
URLhttps://yuanchaofa.com/post/harness-engineering-for-ai-agents
质量分级P3(中文社区首次系统阐述,Bitter Lesson 视角独特)
框架位置0-概念定义与演化.md、3-核心争议与辩论.md

核心论点:


22. 宝玉 (@dotey) — Harness Engineering 中文推介

字段内容
标题Harness Engineering 中文推介
作者宝玉 (@dotey)
URLhttps://x.com/dotey/status/2027156511555027252
质量分级P3(中文 AI 社区知名意见领袖,中文语境对接)
框架位置0-概念定义与演化.md

核心论点:


23. HN Discussion — Improving 15 LLMs at Coding

字段内容
标题HN Discussion: Improving 15 LLMs at Coding
URLhttps://news.ycombinator.com/item?id=46988596
质量分级P3(HN 社区真实反馈,集中呈现开发者认同与担忧)
框架位置3-核心争议与辩论.md

核心论点:


24. Louis-François Bouchard — The Missing Layer Behind AI Agents

字段内容
标题The Missing Layer Behind AI Agents
作者Louis-François Bouchard
日期2026-03-24
URLhttps://www.louisbouchard.ai/harness-engineering/
质量分级P2(概念层次区分最清晰的科普文章,适合入门引用)
框架位置0-概念定义与演化.md

核心论点:


信息源分布统计

质量分级数量文章
P0(官方/学术原始源)7OpenAI、Stripe、Cursor、arXiv(OPENDEV)、Anthropic(Harness Design)、Anthropic(Context Engineering)、arXiv(NLAHs)
P1(顶级工程师一手博客)6Mitchell Hashimoto、Martin Fowler、Philipp Schmid、Karpathy、LangChain、HumanLayer(Kyle)、Charlie Guo
P2(专业分析/独立研究)5Latent Space、METR、Octopus Deploy、MIT Technology Review、The New Stack、Louis Bouchard
P3(社区讨论/科普)4Epsilla、袁朝发、宝玉(@dotey)、HN Discussion

注:P1 列计 7 项(含 Charlie Guo),P2 列计 6 项(含 Louis Bouchard),合计 24 篇源。

框架节点覆盖情况

编号文件主要信息源
0-概念定义与演化.mdFowler(定义)、Hashimoto(操作定义)、Schmid(OS 类比)、Latent Space(社区采纳)、Karpathy(context engineering 定义)、Anthropic CE(重新定义问题)、arXiv NLAHs(理论化)、MIT TR(叙事转变)、Epsilla(三阶段演化)、袁朝发(中文首述)、宝玉(中文语义对接)、Louis Bouchard(三层区分)
1-架构与核心组件.mdCursor(四代演进)、arXiv OPENDEV(双 Agent)、Stripe(工具链)、Anthropic HD(GAN 架构)、LangChain(四策略框架)、Anthropic CE(四大实践领域)、Octopus Deploy(三大支柱)
2-工业实践案例.mdOpenAI(百万行代码)、Stripe(1000 PR/周)、Cursor(1000次提交/周)、Charlie Guo(三标杆横向对比)
3-核心争议与辩论.mdLatent Space(Big Model vs Big Harness)、METR(benchmark 危机)、Anthropic HD(失败模式)、HumanLayer(模型过度拟合 harness)、Charlie Guo(Brownfield 挑战)、arXiv NLAHs(标准化争议)、袁朝发(Bitter Lesson 视角)、The New Stack(上下文差距)、HN(平台锁定担忧)
4-开发者采纳指南.mdHashimoto(6阶段路径)、Stripe(企业路径)、METR(验证层设计)、HumanLayer(六大配置杠杆)