宝玉老师9-11月推文解析 | 千逐的个人博客

type

status

date

slug

summary

AI 编程的黄金时代，还是精致的陷阱？—— 宝玉的“人-AI”协同百日谈

我们似乎正处在一个软件开发的黄金时代，又或者，是一个巨大的幻觉之中。

AI 一声令下，代码如瀑布般涌现，过去数周的工作量，如今在几小时内就能完成。我们痴迷于这种前所未有的“产出”速度，仿佛只要油门踩得够深，就能抵达任何目的地。但一个我们不愿正视的悖论是：我们正以惊人的速度，奔向不确定的终点。当代码的生产成本趋近于零，一个更严峻的瓶颈浮现了：我们如何确保自己没有在用更快的速度，制造更精致的垃圾？

在 AI 席卷生产力领域的今天，我们不缺少更快、更强的工具，却稀缺一种能让我们发自内心感叹“如今的编程感觉有趣多了”的体验。过去数月，在中文 AI 圈备受关注的技术专家“宝玉”，通过其高强度的公开实践，为我们揭示了这场变革的核心驱动力：从简单的“提示词工程” (Prompt Engineering) 迈向更深邃的“上下文工程” (Context Engineering) 与“智能体管理”，是释放 AI 真正潜能的关键。

这不仅是技术的演进，更是一场关乎人类开发者如何重新定义自身价值的认知革命。

一、问题的缠结与真正的起点

“AI 写的代码不是资产，是债务。” 宝玉的这一断言，精准地捕捉到了当前许多开发团队的困境。以 Cursor、Claude Code 为代表的 AI 代码工具，一方面带来了惊人的开发效率，另一方面也悄然堆积了大量“杂质”——多余的代码、无用的注释、不可靠的单元测试层出不穷。许多团队甚至陷入了“凭感觉编程地狱”（Vibe Coding Hell），为了一个简单的功能生成了数千行冗余代码，导致项目在后期维护中举步维艰。

这种“AI 意大利面条”式的代码，引出了一个核心问题：我们究竟该如何驾驭这头才华横溢却时而“走神”的数字巨兽？当 AI 将“写代码”这件事变得越来越廉价，人类工程师的价值又在何方？宝玉的探索正是从这里开始，他试图回答的，是如何在不牺牲工程质量的前提下，真正将 AI 的生产力红利转化为可持续的价值。

二、主题脉络的再编织

纵览宝玉近期的分享，其思考与实践主要围绕以下几条脉络展开，它们共同编织出了一幅人机协同的新图景。

锚点清单：

[主线] 人机协同新范式： 从“凭感觉编程”到“凭感觉工程”的进化，强调人类经验在驾驭 AI 过程中的核心地位。

[支线] AI 工具链的“三国演义”： 对 Codex、Claude 和 Gemini 等主流 AI 编程工具进行深度对比与选型，探索其在不同场景下的优劣。

[支线] 提示词工程的“返璞归真”： 从对模板的盲目崇拜，回归到以目标为导向、以评估为核心的迭代式验证方法。

[语义意象] AI 即“实习生”： 将 AI 智能体比作一个才华横溢但需要被精确指导、管理和审查的数字劳动力，是贯穿其思想的核心隐喻。

三、观点与论据的净化表达

“Vibe Coding”（凭感觉编程）是一把双刃剑。 宝玉认为，它在原型开发阶段是无价之宝，能以极低的成本快速验证想法。他提出的“原型开发法”——第一版完全由 AI 主导，快速实现功能以确认需求，代码用完即弃；第二版在需求明确后，由人类专家主导系统设计，再让 AI 辅助实现——正是对这一理念的最佳实践。然而，若将其滥用于生产环境，而不加以严格的设计与审查，其产出的“技术债务”将是灾难性的。

真正的飞跃，是从“Vibe Coding”到“Vibe Engineering”（凭感觉工程）的升维。后者并非随意的代码生成，而是由经验丰富的开发者主导，将 AI 作为加速器，应用在自动化测试、代码重构、文档编写等环节。宝玉强调，软件工程的底层范式从未改变，AI 只是在加速迭代过程。 需求分析、系统设计、开发、测试、部署的循环依然存在，而设计先行、代码审查、自动化测试等传统软件工程纪律，在 AI 时代变得比以往任何时候都更加重要。

在工具选型上，他同样给出了清晰的判断。经过高强度对比测试，他认为 Codex (尤其是 GPT-5-Codex High 模型) 与 Claude Code (搭载 Opus 4.1/Sonnet 4.5) 是当前第一梯队的 Coding Agent。Codex 的优势在于其稳定性与强大的模型推理能力，虽然速度较慢，但“结果很稳定，bug 少”；而 Claude Code 的优势则在于其开箱即用的强大工具集和更优越的 Agentic 能力，尤其适合处理老旧或复杂的代码库。相比之下，Gemini 2.5 Pro 虽然编程能力不俗，但 Agent 能力的欠缺使其在 Agentic 任务中表现平平。

四、分歧与张力：同一问题的几种解读

在如何构建 AI Agent 的问题上，宝玉的观点与业界一些流行做法形成了鲜明对比。他明确表示不看好 OpenAI 的 Agent Builder 等低代码/无代码平台，认为这类工具“技术人员不屑于用，普通人用不来”，最终会陷入“为了不存在的问题提供的解决方案”的窘境。他更推崇代码优先的框架，如 Anthropic 的 Claude Agent SDK 和 Vercel 的 AI SDK，因为它们为开发者提供了最大的灵活性。

同样，在提示词工程领域，他并不推崇那些充满“熵增”、“场域”等玄学词汇的复杂模板。他认为，提示词工程的本质是一个不断“想法 -> 编写 -> 测试 -> 评估”的迭代循环。真正拉开差距的，不是你拥有多少模板，而是你“是否能评估出当前结果与目标的差距，以及知道怎么调整”。这再次强调了人类领域知识在人机协作中的不可替代性。

五、时间的脊梁：从片段到轨迹

回顾宝玉过去数月的思考轨迹，可以清晰地看到一条从工具测评到方法论沉淀的演进路径。

初期，他大量分享对 Claude Code 的使用技巧与惊叹，称其为“第一个真正能用的 Coding Agent”，并深入研究了其背后的工具调用与上下文管理机制。随着 GPT-5-Codex 的发布，他的重心开始向两者对比转移，逐渐形成了“Codex 为主，Claude 为辅”的策略，并开始深入思考两类工具在不同场景下的最佳应用模式。

近期，他的分享则更多地沉淀为方法论层面的思考，如“Vibe Coding 原型开发法”、“AI 编程时代的软件工程范式”，以及将 AI Agent 视为“技术管理者”进行任务拆解与结果验收的“管理学”隐喻。这标志着他的探索已从“术”的层面，深入到了“道”的层面。

六、可迁移的框架：把经验上提为模型

综合其所有实践，我们可以提炼出宝玉所倡导的**“AI 协同下的分层开发模型”**，这套心法对于任何希望在 AI 时代提升开发效能的团队都极具借鉴意义。

原型层 (Prototyping Layer): 对于新想法，大胆采用“凭感觉编程”，利用 AI Agent 的速度优势进行快速、可抛弃式的原型验证，其核心目标是探索需求，而非构建产品。

设计层 (Design Layer): 一旦需求明确，人类专家的领域知识和架构能力必须回归主导地位。在这一层，人负责定义系统架构、数据库模式、API 协议等核心设计，AI 可以作为辅助设计的“顾问”，但绝不能主导。

实现层 (Implementation Layer): 将设计好的模块或任务，拆解成 AI 可以理解的、边界清晰的小块，然后像“技术经理”给“实习生”派活一样，提供清晰的上下文（如参考代码、文档），让 AI 高效执行。

验证层 (Verification Layer): 人工代码审查是不可或缺的最后一道防线。AI 可以辅助审查，也可以大规模生成单元测试，但最终对代码质量的判断和合并权，必须掌握在人类专家手中。

七、知识锚点（供本地知识库调用）

[核心结论] AI 放大而非取代了高级工程师的价值。

[核心结论] 软件工程纪律（测试、规划、文档）在 AI 时代变得空前重要。

[核心结论] 人类开发者的价值正从“编写代码”转向“架构设计”与“管理 AI”。

[关键术语] Vibe Coding (凭感觉编程)：一种用于快速原型开发的 AI 编程方法，风险在于可能产生大量技术债务。

[关键术语] Vibe Engineering (凭感觉工程)：一种由资深开发者主导，结合 AI 工具进行系统性开发的高效实践。

[常见误解] AI 编程的本质是管理上下文。——宝玉认为这过于简化，其核心是“思考-行动-观察”的 Agentic 循环。

[应用边界] 不要让 AI 进行影响长远的架构决策；避免在没有清晰规划和严格审查的情况下，将其用于生产环境的核心代码。

八、回响：留给明天的问题

当 AI 接管了绝大部分的“如何实现”（How）时，人类工程师的终极价值，便在于定义“做什么”（What）和验证“为什么”（Why）。然而，在一个 AI 也能根据市场数据和用户行为，生成创新产品方案的未来，什么才是我们真正不可替代的核心价值？

这或许是宝玉的实践留给我们最深刻的思考题。答案不在别处，就在于我们每一次与 AI 协同、创造、并最终超越它的过程之中。

思想来源 (Source of Inspiration)： 宝玉 (dotey)

原始内容 (Original Source)： https://x.com/dotey