计算机图形学发展历史 | 千逐的个人博客

type

status

date

slug

summary

像素的黎明：从简陋光点到“第二现实”，我们如何一步步计算出幻象？

洞穴壁画的古老回响

从远古的洞穴壁画开始，人类就有一种无法抑制的冲动：将我们眼中的世界“复现”出来 [00:05]。岩壁上的手印，羊皮卷上的符号，乃至油画中对光影的精妙捕捉，都是我们试图抓住“真实”的足迹。

这种冲动从未消失。当科技的洪流涌入电子时代，它只是找到了新的画布。电子脉冲在电路中跃动，荧光屏上闪烁出微弱的光点 [00:18]，一个全新的“复现”之旅就此启程。这，就是计算机图形学的史诗。它不仅是一部关于技术迭代的历史，更是一场跨越几十年的哲学追问：我们能否在硅基之上，构建一个与物理现实并驾齐驱的“第二现实”？这场旅程的终点，或许会让我们重新质疑，你我眼前的世界，究竟是真实，还是幻象 [18:08]。

“画板”的诞生：从向量的精准到像素的王国

这场伟大的“造梦”之旅，其起点并非源于艺术，而是冰冷的工业与国防。一切始于实用主义的需求：工程师需要更直观的方式来与机器对话。无论是二战时期的雷达显示器 [00:37]，还是北美防空司令部庞大的SAGE系统 [01:10]，亦或是麻省理工为数控机床开发的编程语言 [01:24]，都在试图让计算机“可见”。

在那个年代，“图形”的含义是“线条”。波音公司的工程师威廉·菲特（William Fetter）为了研究驾驶舱的三维可视化，创造了“计算机图形学”(Computer Graphics)一词 [02:13]。而早期电子游戏的鼻祖《太空战争！》（Spacewar!）[02:40]，以及计算机交互的里程碑——伊凡·萨瑟兰（Ivan Sutherland）的《画板》（Sketchpad）[03:29]，它们的核心都是“向量图形”。这是一种属于数学家的优雅：用点和线的数学公式来定义形状，无论如何放大，线条永远精准而锐利 [07:48]。

然而，要“复现”世界，仅有骨架是不够的。一种更“粗暴”却也更包容的理念正在酝酿：与其只画线条，不如我们用无穷无尽的点，填满整个屏幕？“像素”（Pixel）和“帧缓存”（Frame Buffer）的概念应运而生 [04:55]。雅达利的《乓》（Pong）[06:20] 用简单的电路在电视上生成了像素块，而施乐帕洛阿尔托研究中心（Xerox PARC）的Alto电脑 [06:47] 则彻底奠定了“光栅显示”（Raster）的统治地位——用像素网格来绘制一切 [07:59]。这就是图形学的第一次分野：向量的精准，让位于像素的丰满。我们选择了一条更笨重，但也通往无限可能的道路。

“真实感”的迷思：一场关于光与影的算法长征

拥有了像素画布，新的问题接踵而至：如何让这片平面的网格，看起来“像”一个真实的三维世界？这开启了一场关于“真实感”的算法长征。

最初的3D模型只是空洞的线框 [03:54]，毫无真实感可言。真正的突破发生在犹他大学（University of Utah），这个计算机图形学的“黄金圣地” [04:45]。学者们意识到，真实感的关键在于“光”。1971年，亨利·古罗（Henri Gouraud）提出了“Gouraud着色法” [05:52]，通过计算多边形顶点的光照，并进行插值，让物体表面呈现出平滑的明暗渐变。然而，这种方法无法表现物体的高光。不久后，犹他大学的博士生裴祥风（Bui Tuong Phong）提出了“Phong着色法” [06:09]，它在像素级别进行光照计算，终于让物体表面绽放出了逼真的高光。

这场对光影的追逐，其精神图腾便是一只平凡的茶壶——“犹他茶壶”（Utah Teapot） [08:52]。这个模型被无数研究者用作测试基准，一遍遍地渲染，只为验证自己新算法是否能更逼真地模拟光线在曲面上的跳动。从简单的明暗，到复杂的纹理映射 [05:45]，再到后来的物理渲染，我们对“真实”的每一次细微推进，都凝结在这些关于光与影的算法之中。

标准之战：驱动“幻象”的无形之手

当算法日渐成熟，新的“巴别塔”困境出现了。硅谷图形公司（SGI）[11:40] 制造出了强大的图形工作站，个人电脑（PC）也开始崛起 [10:46]，但整个行业一片混乱。为SGI硬件编写的程序，无法在IBM的PC上运行 [10:56]。每个厂商都有自己的“方言”，开发者们寸步难行。

统一“语言”的战争开始了。最初，学术界试图制定一个大一统的国际标准，如PHIGS [11:32]。但这个标准过于庞大、迟缓，无法满足SGI等厂商对“实时渲染”的极致追求 [12:15]。于是，SGI将其内部高效的图形接口（Iris GL）[11:56] 进行精简和开放，一个跨时代的标准诞生了——它就是OpenGL（开放图形库）[13:50]。它如同一本通用的“3D绘画指南”，让开发者终于可以用一套统一的指令，在不同厂商的硬件上作画。

然而，微软并不打算将帝国的未来交到这个开放联盟手中。伴随着Windows 95的巨大成功 [14:20]，微软看到了PC游戏的庞大市场。1995年，它推出了自己的“全家桶”式API——DirectX [14:45]。为了狙击OpenGL，微软甚至亲自下场，将划时代的《毁灭战士》（Doom）移植为“Doom 95” [15:01]，以此昭告天下：Windows才是游戏的未来。这场OpenGL与DirectX的“标准之战” [15:45]，表面上是API的竞争，实则是对未来虚拟世界“生态主导权”的争夺。

“管线”的解放：从固化流程到可编程的“GPU宇宙”

在很长一段时间里，无论OpenGL还是DirectX，它们指挥硬件的方式都像在操作一条固定的“图形管线” [15:53]。数据（如模型的顶点）从一端进入，经过一系列固化在硬件上的流程——变换、裁剪、光栅化、着色——最后变成屏幕上的像素。开发者就像工厂的工头，只能调整参数，却无法改变流水线的结构。

真正的革命发生在21世纪初。硬件厂商和API设计者们做出了一个伟大的决定：解放这条管线。他们引入了“可编程着色器”（Programmable Shader）[16:00]。借助HLSL（用于DirectX）或GLSL（用于OpenGL）[16:08] 这样的着色语言，开发者终于可以随心所欲地编写代码，去精确控制顶点如何运动、像素如何着色。

这个看似微小的改动，其影响却石破天惊。它彻底释放了图形硬件的潜力。GPU（图形处理器）不再是只能画图的“显卡”，它变成了一台拥有成百上千个核心的、强大的并行计算设备 [16:12]。正是这次解放，不仅催生了今天游戏中照片级的“基于物理的渲染”（PBR）[16:16]，其强大的算力也溢出到了图形之外，成为了今天人工智能和科学计算的绝对主力。我们从“使用工具”的人，变成了“创造工具”的人。

最终的边界：当我们成为新世界的“造物主”

从雷达屏上的一个光点，到犹他茶壶的光影，从《毁灭战士》的走廊，到今天照片级的实时光线追踪 [17:14]。这场跨越七十余年的征程，本质上是人类在不懈地构建我们的“第二现实” [17:57]。

随着Vulkan [17:03]、Metal和DirectX 12这样“低开销”API的出现，开发者已被授予了前所未有的、对硬件的底层控制权。当元宇宙（Metaverse）和空间计算 [17:29] 开始将数字信息叠加在现实环境之上时，我们发现，绘制图形本身已不再是瓶颈，真正的瓶颈只剩下了我们的想象力 [17:22]。

我们始于“复现”世界的渴望。而今，我们正站在“创造”世界的边缘。未来，当人工智能、物理模拟与量子计算 [18:00] 彻底融入图形学，我们或许真的会迎来那一天——你我眼前的世界，已再难分清，究竟是物理的真实，还是计算机生成的终极幻象。

思想来源 (Source of Inspiration): 让水烧开

原始视频 (Original Video): https://www.youtube.com/watch?v=dmgH9pzDa7I