宝玉老师9-11月推文解析
type
status
date
slug
summary
tags
category
icon
password
commet
AI 编程的黄金时代,还是精致的陷阱?—— 宝玉的“人-AI”协同百日谈
我们似乎正处在一个软件开发的黄金时代,又或者,是一个巨大的幻觉之中。
AI 一声令下,代码如瀑布般涌现,过去数周的工作量,如今在几小时内就能完成。我们痴迷于这种前所未有的“产出”速度,仿佛只要油门踩得够深,就能抵达任何目的地。但一个我们不愿正视的悖论是:我们正以惊人的速度,奔向不确定的终点。当代码的生产成本趋近于零,一个更严峻的瓶颈浮现了:我们如何确保自己没有在用更快的速度,制造更精致的垃圾?
在 AI 席卷生产力领域的今天,我们不缺少更快、更强的工具,却稀缺一种能让我们发自内心感叹“如今的编程感觉有趣多了”的体验。过去数月,在中文 AI 圈备受关注的技术专家“宝玉”,通过其高强度的公开实践,为我们揭示了这场变革的核心驱动力:从简单的“提示词工程” (Prompt Engineering) 迈向更深邃的“上下文工程” (Context Engineering) 与“智能体管理”,是释放 AI 真正潜能的关键。
这不仅是技术的演进,更是一场关乎人类开发者如何重新定义自身价值的认知革命。
一、问题的缠结与真正的起点
“AI 写的代码不是资产,是债务。” 宝玉的这一断言,精准地捕捉到了当前许多开发团队的困境。以 Cursor、Claude Code 为代表的 AI 代码工具,一方面带来了惊人的开发效率,另一方面也悄然堆积了大量“杂质”——多余的代码、无用的注释、不可靠的单元测试层出不穷。许多团队甚至陷入了“凭感觉编程地狱”(Vibe Coding Hell),为了一个简单的功能生成了数千行冗余代码,导致项目在后期维护中举步维艰。
这种“AI 意大利面条”式的代码,引出了一个核心问题:我们究竟该如何驾驭这头才华横溢却时而“走神”的数字巨兽?当 AI 将“写代码”这件事变得越来越廉价,人类工程师的价值又在何方?宝玉的探索正是从这里开始,他试图回答的,是如何在不牺牲工程质量的前提下,真正将 AI 的生产力红利转化为可持续的价值。
二、主题脉络的再编织
纵览宝玉近期的分享,其思考与实践主要围绕以下几条脉络展开,它们共同编织出了一幅人机协同的新图景。
锚点清单:
- [主线] 人机协同新范式: 从“凭感觉编程”到“凭感觉工程”的进化,强调人类经验在驾驭 AI 过程中的核心地位。
- [支线] AI 工具链的“三国演义”: 对 Codex、Claude 和 Gemini 等主流 AI 编程工具进行深度对比与选型,探索其在不同场景下的优劣。
- [支线] 提示词工程的“返璞归真”: 从对模板的盲目崇拜,回归到以目标为导向、以评估为核心的迭代式验证方法。
- [语义意象] AI 即“实习生”: 将 AI 智能体比作一个才华横溢但需要被精确指导、管理和审查的数字劳动力,是贯穿其思想的核心隐喻。
三、观点与论据的净化表达
“Vibe Coding”(凭感觉编程)是一把双刃剑。 宝玉认为,它在原型开发阶段是无价之宝,能以极低的成本快速验证想法。他提出的“原型开发法”——第一版完全由 AI 主导,快速实现功能以确认需求,代码用完即弃;第二版在需求明确后,由人类专家主导系统设计,再让 AI 辅助实现——正是对这一理念的最佳实践。然而,若将其滥用于生产环境,而不加以严格的设计与审查,其产出的“技术债务”将是灾难性的。
真正的飞跃,是从“Vibe Coding”到“Vibe Engineering”(凭感觉工程)的升维。后者并非随意的代码生成,而是由经验丰富的开发者主导,将 AI 作为加速器,应用在自动化测试、代码重构、文档编写等环节。宝玉强调,软件工程的底层范式从未改变,AI 只是在加速迭代过程。 需求分析、系统设计、开发、测试、部署的循环依然存在,而设计先行、代码审查、自动化测试等传统软件工程纪律,在 AI 时代变得比以往任何时候都更加重要。
在工具选型上,他同样给出了清晰的判断。经过高强度对比测试,他认为 Codex (尤其是 GPT-5-Codex High 模型) 与 Claude Code (搭载 Opus 4.1/Sonnet 4.5) 是当前第一梯队的 Coding Agent。Codex 的优势在于其稳定性与强大的模型推理能力,虽然速度较慢,但“结果很稳定,bug 少”;而 Claude Code 的优势则在于其开箱即用的强大工具集和更优越的 Agentic 能力,尤其适合处理老旧或复杂的代码库。相比之下,Gemini 2.5 Pro 虽然编程能力不俗,但 Agent 能力的欠缺使其在 Agentic 任务中表现平平。
四、分歧与张力:同一问题的几种解读
在如何构建 AI Agent 的问题上,宝玉的观点与业界一些流行做法形成了鲜明对比。他明确表示不看好 OpenAI 的 Agent Builder 等低代码/无代码平台,认为这类工具“技术人员不屑于用,普通人用不来”,最终会陷入“为了不存在的问题提供的解决方案”的窘境。他更推崇代码优先的框架,如 Anthropic 的 Claude Agent SDK 和 Vercel 的 AI SDK,因为它们为开发者提供了最大的灵活性。
同样,在提示词工程领域,他并不推崇那些充满“熵增”、“场域”等玄学词汇的复杂模板。他认为,提示词工程的本质是一个不断“想法 -> 编写 -> 测试 -> 评估”的迭代循环。真正拉开差距的,不是你拥有多少模板,而是你“是否能评估出当前结果与目标的差距,以及知道怎么调整”。这再次强调了人类领域知识在人机协作中的不可替代性。
五、时间的脊梁:从片段到轨迹
回顾宝玉过去数月的思考轨迹,可以清晰地看到一条从工具测评到方法论沉淀的演进路径。
初期,他大量分享对 Claude Code 的使用技巧与惊叹,称其为“第一个真正能用的 Coding Agent”,并深入研究了其背后的工具调用与上下文管理机制。随着 GPT-5-Codex 的发布,他的重心开始向两者对比转移,逐渐形成了“Codex 为主,Claude 为辅”的策略,并开始深入思考两类工具在不同场景下的最佳应用模式。
近期,他的分享则更多地沉淀为方法论层面的思考,如“Vibe Coding 原型开发法”、“AI 编程时代的软件工程范式”,以及将 AI Agent 视为“技术管理者”进行任务拆解与结果验收的“管理学”隐喻。这标志着他的探索已从“术”的层面,深入到了“道”的层面。
六、可迁移的框架:把经验上提为模型
综合其所有实践,我们可以提炼出宝玉所倡导的**“AI 协同下的分层开发模型”**,这套心法对于任何希望在 AI 时代提升开发效能的团队都极具借鉴意义。
- 原型层 (Prototyping Layer): 对于新想法,大胆采用“凭感觉编程”,利用 AI Agent 的速度优势进行快速、可抛弃式的原型验证,其核心目标是探索需求,而非构建产品。
- 设计层 (Design Layer): 一旦需求明确,人类专家的领域知识和架构能力必须回归主导地位。在这一层,人负责定义系统架构、数据库模式、API 协议等核心设计,AI 可以作为辅助设计的“顾问”,但绝不能主导。
- 实现层 (Implementation Layer): 将设计好的模块或任务,拆解成 AI 可以理解的、边界清晰的小块,然后像“技术经理”给“实习生”派活一样,提供清晰的上下文(如参考代码、文档),让 AI 高效执行。
- 验证层 (Verification Layer): 人工代码审查是不可或缺的最后一道防线。AI 可以辅助审查,也可以大规模生成单元测试,但最终对代码质量的判断和合并权,必须掌握在人类专家手中。
七、知识锚点(供本地知识库调用)
- [核心结论] AI 放大而非取代了高级工程师的价值。
- [核心结论] 软件工程纪律(测试、规划、文档)在 AI 时代变得空前重要。
- [核心结论] 人类开发者的价值正从“编写代码”转向“架构设计”与“管理 AI”。
- [关键术语] Vibe Coding (凭感觉编程):一种用于快速原型开发的 AI 编程方法,风险在于可能产生大量技术债务。
- [关键术语] Vibe Engineering (凭感觉工程):一种由资深开发者主导,结合 AI 工具进行系统性开发的高效实践。
- [常见误解] AI 编程的本质是管理上下文。——宝玉认为这过于简化,其核心是“思考-行动-观察”的 Agentic 循环。
- [应用边界] 不要让 AI 进行影响长远的架构决策;避免在没有清晰规划和严格审查的情况下,将其用于生产环境的核心代码。
八、回响:留给明天的问题
当 AI 接管了绝大部分的“如何实现”(How)时,人类工程师的终极价值,便在于定义“做什么”(What)和验证“为什么”(Why)。然而,在一个 AI 也能根据市场数据和用户行为,生成创新产品方案的未来,什么才是我们真正不可替代的核心价值?
这或许是宝玉的实践留给我们最深刻的思考题。答案不在别处,就在于我们每一次与 AI 协同、创造、并最终超越它的过程之中。
思想来源 (Source of Inspiration): 宝玉 (dotey)
原始内容 (Original Source): https://x.com/dotey
Loading...