jixiaxue 知识库
evidence · 2026-04-15

Phase 2-3 合并编码 + 三角验证

/Users/shanfang/Documents/pe/jixiaxuegong/research/提示工程教程/evidence/phase2-3-merged-analysis.md

Phase 2-3 合并编码 + 三角验证

统计


核心原则表(合并后)

一、基础认知(P001-P006)

编号核心原则置信度来源数来源编号分类适用条件
P001LLM 是概率预测引擎,不是知识库:理解这一本质才能设计好 prompt——没有 prompt 锚定时模型会随机采样训练数据★★★★★3C027, C028, C029, A036通用始终适用,是所有 PE 的理论基础
P002Prompt Engineering 是迭代的科学过程,不是”基本提问”——需要 Plan→Draft→Evaluate→Refine→Deploy 的生命周期★★★★★4A056, A067, A109, B003, B048通用始终适用
P003不是所有问题都适合 PE 解决:延迟和成本有时换模型更有效;简单任务不需要复杂 prompt★★★★☆2A068, A103通用评估阶段决策
P004上下文工程 > Prompt 工程:管理整个上下文状态(token 预算、信息新鲜度、上下文腐烂),而非只写好指令★★★★☆3A140, A141, A142, A147通用agent/长对话场景尤其重要
P005PE 是技能组合:需要混合搭配多种策略,包括安全、工具集成、领域知识注入等全栈能力★★★★☆2C065, C066通用始终适用
P006模型对模式敏感:你犯错它犯错,你聪明它聪明——拼写、语法、格式都会传染给输出★★★★★3A018, A019, A083, C052通用始终适用

二、Prompt 结构与组织(P007-P018)

编号核心原则置信度来源数来源编号分类适用条件
P007系统提示词是行为锚点:在 user turn 之前提供上下文、指令和指南,精心编写能显著提升表现★★★★★4A001, A002, B006, C031通用所有 API 场景
P008推荐的系统提示结构:Identity/角色 → Instructions/规则 → Examples/示例 → Context/数据。复杂 prompt 有 10 个标准元素★★★★★5A041, A043-A054, B006, C001, C004-C009通用中等以上复杂度的 prompt
P009长文档/数据放在 prompt 顶部,查询/指令放在底部——查询在末尾可提升响应质量达 30%★★★★★4A078, A079, A050, A051, A113, B068通用含长文档的场景;另见矛盾 M003
P010用 XML 标签分隔内容边界:将变量数据与指令分离,用一致的描述性标签名,支持嵌套反映层级★★★★★5A015, A016, A021, A049, A076, A077, B008, C051通用Claude 专门训练过 XML 识别,但所有模型都受益
P011用 Markdown 标题和列表传达层级关系:编号列表用于顺序和完整性重要时★★★★★3A070, B007, C047通用始终适用
P012结构化模板比散乱技巧更高效:像代码模块一样设计 prompt,一次创建、无限适配★★★★☆3A020, C001, C002, C021通用生产环境/重复任务
P013Prompt 模板化:固定骨架 + 可替换变量({{variable}}<Variable>),实现重复任务的标准化★★★★★3A020, B014, C010通用生产环境
P014在长 prompt 末尾重申即时任务:比放在开头效果更好★★★★☆3A050, A057, B022通用长 prompt(>1000 tokens)
P015高频复用内容放在 prompt 开头以利用缓存降低成本和延迟★★★★☆2B009, A078通用API 生产环境
P016多文档场景用结构化包裹<document index="n"> + 唯一 ID,便于引用和追踪★★★★☆3A080, C053, B045通用多文档/多源处理
P017输出格式明确指定:语言、语法、结构化格式(JSON/XML/Markdown)和样式偏好,放在 prompt 末尾★★★★★5A022, A053, A107, B041, B051, C019, C025, C054通用需要程序化消费输出时必须
P018Prompt 可用多种格式承载:Markdown(默认推荐)、JSON、YAML。Markdown 表格适合同类数据,JSON 适合嵌套数据★★★★☆3C014, C047, C048, C049通用根据数据结构选择

三、指令编写原则(P019-P030)

编号核心原则置信度来源数来源编号分类适用条件
P019像对新员工一样清晰地解释任务:模型除了你告诉的内容之外没有任何上下文★★★★★3A005, A006, C032通用始终适用
P020直接要求你想要的行为(“Just Ask”原则):想让它做选择就明确说,想跳过前言就直接说★★★★★4A007, A008, A009, A069, A086, B052通用始终适用
P021告诉模型”做什么”而非”不做什么”:正面指令比否定约束更有效。避免过于宽泛的否定如”do not infer”★★★★★3A082, B063, C039通用始终适用
P022提供指令背后的原因/动机:解释”为什么”能让模型更好地泛化,比单纯禁止更有效★★★★★3A071, A072, B063通用始终适用
P023明确约束范围,防止模型扩展超出请求:只做直接要求的,不加额外功能和”改进”★★★★★4B019, B035, A130, A131, A132通用编码和生产环境尤其重要
P024遇到模糊指令时选择最简单的合理解释,或主动问澄清问题★★★★☆3B020, B025, C012通用另见矛盾 M001
P025提供明确的长度/格式约束:默认多长、简单问题多长、复杂问题用什么结构★★★★☆3B015, B016, B017, A118, A126通用需要一致性输出时
P026不要复述用户请求;直奔主题,跳过填充词、前言和不必要的过渡★★★★★3B018, B052, A127通用始终适用
P027定义明确的”退出机制”:告诉模型可以说不知道、可以拒绝、可以保持原答案不修改★★★★★4A037, A060, A115, B054通用减少幻觉的关键手段
P028高风险场景做自检:重新扫描未声明假设、不实数字、过强措辞★★★★☆3B028, A094, B026, B027通用法律/财务/合规/医疗场景
P029”通用指令优于规定性步骤”:‘think thoroughly’ 往往比手写步骤更好,模型推理能力可能超过人类预设★★★★☆2A092, A095通用新一代推理模型(Sonnet 4/Opus 4 等)
P030不同模型需要不同提示策略:推理模型给高层目标,基础模型给精确指令★★★★★3B001, A089, A090, B046通用模型选择/迁移时

四、角色与人格(P031-P034)

编号核心原则置信度来源数来源编号分类适用条件
P031角色提示改变风格、语气和回答深度:可以放在系统提示或 user turn 中★★★★★4A010, A011, A012, A013, C003通用始终适用
P032像写人格画像而非流程手册:赋予世界观、动机、价值体系比列步骤更有效★★★★☆2C020, A010通用复杂角色/长对话场景
P033Persona 会被模型严肃对待,可能优先于其他指令——需仔细审查避免歧义★★★☆☆1B066Gemini专属需跨模型验证
P034显式列举能力(Skills)和局限(Limitations),而非隐含期望模型推断★★★★☆2C006, C015, C016通用复杂角色设定

五、示例与 Few-shot(P035-P040)

编号核心原则置信度来源数来源编号分类适用条件
P035Few-shot 示例是最有效的 PE 工具:既能得到正确答案,又能得到正确格式。示例 > 冗长描述★★★★★5A032, A033, A034, A046, A048, B010, C067通用始终适用
P036示例要满足三要求:相关、多样、结构化。展示多样化输入范围,覆盖边缘案例,用 <example> 标签包裹★★★★★4A073, A074, A047, A106, A116, B010, C017通用始终适用
P037建议 3-5 个示例获取最佳效果;更多通常更好★★★★☆2A074, A048通用取决于 token 预算
P038Few-shot 的格式比内容更重要:即使用随机标签,有格式也比没格式好得多;标签空间和输入分布比标签正确性更重要★★★★☆2C068, C069通用(学术发现)理解 few-shot 工作机制时
P039在示例中展示思维链/内心独白,让模型学会推理过程★★★★★3C018, A093, A047通用需要推理的任务
P040用困难用例作为示例来训练模型处理边缘情况★★★★☆2C017, A047通用有已知边缘案例时

六、思维链与推理(P041-P048)

编号核心原则置信度来源数来源编号分类适用条件
P041给模型”思考时间”(CoT)能显著提升复杂任务准确性:让模型展示推理过程★★★★★5A026, A027, A030, C055, C071通用复杂推理/数学/逻辑任务
P042明确拼出思考步骤比笼统说”think step by step”更有效;用 XML 标签(<thinking> <scratchpad>)隔离思考区域★★★★★4A030, A031, A114, C057通用需要精确控制推理过程时
P043思考只有”大声”输出时才算数——不能要求只输出答案不输出思考过程(不适用于有 extended thinking 的模型)★★★★☆2A027, C058通用无 extended thinking 的模型
P044Zero-shot CoT:仅需”Let’s think step-by-step”即可触发推理,但需要”足够大的模型”★★★★★3C056, C072, C070通用大参数模型
P045Self-Consistency:采样多条推理路径,选最一致的答案——适用于算术和常识推理★★★★☆2C074, C075通用可多次采样的场景
P046Tree of Thoughts(ToT):维护思维树 + 搜索算法(BFS/DFS)进行系统性探索,适用于需要前瞻的复杂任务★★★☆☆1C076, C077, C078, C079通用(学术)复杂探索任务
P047让模型先列出正反论点再作判断,可改善复杂判断质量★★★★☆2A028, A112通用需要平衡分析的场景
P048先验证信息/能力是否存在,再生成答案(Split-Step Verification)★★★★☆2B064, A038通用减少幻觉

七、减少幻觉(P049-P053)

编号核心原则置信度来源数来源编号分类适用条件
P049让模型先提取相关引用再回答——减少长文档场景下的幻觉★★★★★4A038, A039, A081, B024, C053通用长文档/多文档场景
P050将断言锚定到具体章节而非泛泛而谈;引用关键细节(日期、阈值、条款)★★★★☆2B023, B024通用事实密集型任务
P051不确定时避免编造——用”Based on the provided context…”替代绝对断言;缺失字段设为 null 而非猜测★★★★★3B026, B027, B043, B044通用始终适用
P052假设场景中明确声明”提供的上下文是唯一事实来源”★★★★☆2B067, A123通用与模型训练知识冲突的场景
P053降低 temperature 减少幻觉:temperature 0 最接近确定性输出★★★★☆2A040, B055(反面)通用另见矛盾 M002

八、工具使用与 Agent(P054-P060)

编号核心原则置信度来源数来源编号分类适用条件
P054工具描述本身就是 PE:简洁 1-2 句说明做什么和何时使用,描述必须精确★★★★★3A139, B036, A065通用所有工具使用场景
P055鼓励并行工具调用以降低延迟★★★★★3A091, B037通用多工具场景
P056需要新鲜或用户特定数据时优先使用工具而非内部知识★★★★★3B039, C040, C041通用agent 场景
P057写操作后简短重述改了什么;高影响操作需要验证步骤★★★★☆2B040, B038通用有副作用的操作
P058命令语法的抽象层级是关键:太具体不灵活,太底层模型会幻觉;用大量描述和示例对抗幻觉★★★★☆2C045, C046通用自定义工具设计
P059Agent 更新应简短(1-2句):只在新阶段或计划变更时发送,避免叙述常规工具调用过程★★★★☆2B032, B033, B034, A128通用agent 场景
P060子代理架构:专门化代理处理聚焦任务,用干净的上下文窗口,返回压缩摘要★★★★☆2A138, A146通用复杂/长对话 agent

九、上下文管理(P061-P065)

编号核心原则置信度来源数来源编号分类适用条件
P061上下文是有限资源:找到”最大化预期结果概率的最小高信号 token 集合”★★★★★3A142, A147, C034通用始终适用
P062上下文截断策略:滑动窗口、优先保留 bot 回复、LLM 摘要替代历史消息★★★★☆2C035, A146通用长对话
P063动态修改上下文是好体验的关键:根据用户意图实时更换隐藏提示中的数据(RAG/语义搜索)★★★★★4C042, C043, C044, B012, A145通用需要外部知识的场景
P064Reminder 机制对抗长对话中的上下文丢失:强制模型在每次回复前回顾关键设定★★★★☆2C013, B031通用长多轮对话
P065Just-in-time 上下文策略:保持轻量级标识符,动态加载相关信息★★★★☆2A145, C042场景特定agent/工具使用场景

十、安全与约束(P066-P069)

编号核心原则置信度来源数来源编号分类适用条件
P066永远假设用户可以看到 hidden prompt 内容:永远不要在 prompt 中放不能让用户看到的信息★★★★★2C030, C038通用所有生产环境
P067约束针对正常用户设计,假设恶意用户可绕过所有约束;防越狱最佳实践是将最重要约束放在末尾★★★★☆2C036, C037通用面向公众的应用
P068破坏性操作执行前确认:用户批准一次不代表所有上下文都批准★★★★★2A136, A137通用有副作用的操作
P069Fine-tuning 安全红线:永远不要用真实客户数据做微调——模型会记住并泄露★★★★☆1C061通用fine-tuning 场景

十一、评估与迭代(P070-P072)

编号核心原则置信度来源数来源编号分类适用条件
P070先定义成功标准和评估方法,再开始 PE;构建评估体系监控提示性能★★★★★3A067, B003, B048通用始终适用
P071模型迁移时先不改 prompt,只换模型——一次只变一个因素,每次小改动后重跑 eval★★★★★3B046, B048, A089通用模型升级/迁移
P072生产环境应锁定模型快照版本以保证行为一致性★★★★☆1B002通用生产环境

关系网络

前置依赖

互补组合

上下位关系

条件分支


矛盾/差异分析

矛盾 M001:模糊指令时——澄清还是覆盖所有意图?

矛盾 M002:温度设置——降低温度减少幻觉 vs 保持默认 1.0

矛盾 M003:关键指令位置——开头还是末尾?

矛盾 M004:消息角色层级——显式优先级 vs 无区分

矛盾 M005:数据与问题的顺序——数据在前还是在后?

矛盾 M006:新模型的激进语言——需要还是不需要?


附录:未合并的模型专属/平台专属编码

以下编码具有参考价值但不纳入通用原则:

来源内容原因
B004, B005, B011, B013, B014OpenAI developer/user 角色、instructions 参数、Stored PromptsGPT 平台特性
B029, B030OpenAI compaction 端点GPT 平台特性
B047reasoning_effort 参数GPT 参数
B055, B056, B057, B058, B059, B060, B061, B062Gemini 温度、thinking_level、Thought Signatures、media_resolution 等Gemini 平台特性
A003, A004, A023, A024, A025, A035, A054, A066, A084, A085, A087, A088Claude 消息规则、预填、stop_sequences、行为标签Claude 平台特性
A089, A090, A091, A093, A096Claude 新模型行为调优Claude 版本特定
A125, A126, A127-A139Claude.ai/Claude Code 系统提示词设计Claude 产品特定
C022惩罚机制(strike rule)旧模型技巧,新模型慎用
C073, C076, C079, C080-C083Auto-CoT、ToT 自评估、ReAct 实现细节学术/高级技术
C059, C060, C062Fine-tuning 劣势、GPT-4 vs GPT-3.5 差异历史参考

合并映射速查

每条原则的完整来源追溯。

合并原则原始编码(去重后)
P001A036, C027, C028, C029
P002A056, A067, A109, B003, B048
P003A068, A103
P004A140, A141, A142, A147
P005C065, C066
P006A018, A019, A083, C052
P007A001, A002, B006, C031
P008A041, A043-A054, B006, C001, C004-C009
P009A050, A051, A078, A079, A113, B068
P010A015, A016, A017, A021, A049, A076, A077, B008, C051
P011A070, B007, C047
P012A020, C001, C002, C021
P013A020, B014, C010
P014A050, A057, B022
P015B009, A078
P016A080, C053, B045
P017A022, A053, A107, B041, B051, C019, C025, C054
P018C014, C047, C048, C049, C050
P019A005, A006, C032
P020A007, A008, A009, A069, A086, B052
P021A082, B063, C039
P022A071, A072, B063
P023B019, B035, A130, A131, A132, A133
P024B020, B025, C012
P025B015, B016, B017, A118, A126
P026B018, B052, A127
P027A037, A060, A115, B054, A121
P028B026, B027, B028, A094, B044
P029A092, A095
P030B001, A089, A090, B046
P031A010, A011, A012, A013, C003
P032C020, A010
P033B066
P034C006, C015, C016
P035A032, A033, A034, A046, A048, B010, C067
P036A047, A073, A074, A106, A116, B010, C017
P037A074, A048
P038C068, C069
P039A093, C018, A047
P040C017, A047
P041A026, A027, A030, C055, C071
P042A030, A031, A114, C057
P043A027, C058
P044C056, C070, C072
P045C074, C075
P046C076, C077, C078, C079
P047A028, A112
P048B064, A038
P049A038, A039, A081, B024, C053
P050B023, B024
P051B026, B027, B043, B044
P052B067, A123
P053A040
P054A139, B036, A065
P055A091, B037
P056B039, C040, C041
P057B038, B040
P058C045, C046
P059B032, B033, B034, A128
P060A138, A146
P061A142, A147, C034
P062C035, A146
P063B012, C042, C043, C044, A145
P064C013, B031
P065A145, C042
P066C030, C038
P067C036, C037
P068A136, A137
P069C061
P070A067, B003, B048
P071B046, B048, A089
P072B002