计算机图形学发展历史
type
status
date
slug
summary
tags
category
icon
password
commet
像素的黎明:从简陋光点到“第二现实”,我们如何一步步计算出幻象?
洞穴壁画的古老回响
从远古的洞穴壁画开始,人类就有一种无法抑制的冲动:将我们眼中的世界“复现”出来 [00:05]。岩壁上的手印,羊皮卷上的符号,乃至油画中对光影的精妙捕捉,都是我们试图抓住“真实”的足迹。
这种冲动从未消失。当科技的洪流涌入电子时代,它只是找到了新的画布。电子脉冲在电路中跃动,荧光屏上闪烁出微弱的光点 [00:18],一个全新的“复现”之旅就此启程。这,就是计算机图形学的史诗。它不仅是一部关于技术迭代的历史,更是一场跨越几十年的哲学追问:我们能否在硅基之上,构建一个与物理现实并驾齐驱的“第二现实”?这场旅程的终点,或许会让我们重新质疑,你我眼前的世界,究竟是真实,还是幻象 [18:08]。
“画板”的诞生:从向量的精准到像素的王国
这场伟大的“造梦”之旅,其起点并非源于艺术,而是冰冷的工业与国防。一切始于实用主义的需求:工程师需要更直观的方式来与机器对话。无论是二战时期的雷达显示器 [00:37],还是北美防空司令部庞大的SAGE系统 [01:10],亦或是麻省理工为数控机床开发的编程语言 [01:24],都在试图让计算机“可见”。
在那个年代,“图形”的含义是“线条”。波音公司的工程师威廉·菲特(William Fetter)为了研究驾驶舱的三维可视化,创造了“计算机图形学”(Computer Graphics)一词 [02:13]。而早期电子游戏的鼻祖《太空战争!》(Spacewar!)[02:40],以及计算机交互的里程碑——伊凡·萨瑟兰(Ivan Sutherland)的《画板》(Sketchpad)[03:29],它们的核心都是“向量图形”。这是一种属于数学家的优雅:用点和线的数学公式来定义形状,无论如何放大,线条永远精准而锐利 [07:48]。
然而,要“复现”世界,仅有骨架是不够的。一种更“粗暴”却也更包容的理念正在酝酿:与其只画线条,不如我们用无穷无尽的点,填满整个屏幕?“像素”(Pixel)和“帧缓存”(Frame Buffer)的概念应运而生 [04:55]。雅达利的《乓》(Pong)[06:20] 用简单的电路在电视上生成了像素块,而施乐帕洛阿尔托研究中心(Xerox PARC)的Alto电脑 [06:47] 则彻底奠定了“光栅显示”(Raster)的统治地位——用像素网格来绘制一切 [07:59]。这就是图形学的第一次分野:向量的精准,让位于像素的丰满。我们选择了一条更笨重,但也通往无限可能的道路。
“真实感”的迷思:一场关于光与影的算法长征
拥有了像素画布,新的问题接踵而至:如何让这片平面的网格,看起来“像”一个真实的三维世界?这开启了一场关于“真实感”的算法长征。
最初的3D模型只是空洞的线框 [03:54],毫无真实感可言。真正的突破发生在犹他大学(University of Utah),这个计算机图形学的“黄金圣地” [04:45]。学者们意识到,真实感的关键在于“光”。1971年,亨利·古罗(Henri Gouraud)提出了“Gouraud着色法” [05:52],通过计算多边形顶点的光照,并进行插值,让物体表面呈现出平滑的明暗渐变。然而,这种方法无法表现物体的高光。不久后,犹他大学的博士生裴祥风(Bui Tuong Phong)提出了“Phong着色法” [06:09],它在像素级别进行光照计算,终于让物体表面绽放出了逼真的高光。
这场对光影的追逐,其精神图腾便是一只平凡的茶壶——“犹他茶壶”(Utah Teapot) [08:52]。这个模型被无数研究者用作测试基准,一遍遍地渲染,只为验证自己新算法是否能更逼真地模拟光线在曲面上的跳动。从简单的明暗,到复杂的纹理映射 [05:45],再到后来的物理渲染,我们对“真实”的每一次细微推进,都凝结在这些关于光与影的算法之中。
标准之战:驱动“幻象”的无形之手
当算法日渐成熟,新的“巴别塔”困境出现了。硅谷图形公司(SGI)[11:40] 制造出了强大的图形工作站,个人电脑(PC)也开始崛起 [10:46],但整个行业一片混乱。为SGI硬件编写的程序,无法在IBM的PC上运行 [10:56]。每个厂商都有自己的“方言”,开发者们寸步难行。
统一“语言”的战争开始了。最初,学术界试图制定一个大一统的国际标准,如PHIGS [11:32]。但这个标准过于庞大、迟缓,无法满足SGI等厂商对“实时渲染”的极致追求 [12:15]。于是,SGI将其内部高效的图形接口(Iris GL)[11:56] 进行精简和开放,一个跨时代的标准诞生了——它就是OpenGL(开放图形库)[13:50]。它如同一本通用的“3D绘画指南”,让开发者终于可以用一套统一的指令,在不同厂商的硬件上作画。
然而,微软并不打算将帝国的未来交到这个开放联盟手中。伴随着Windows 95的巨大成功 [14:20],微软看到了PC游戏的庞大市场。1995年,它推出了自己的“全家桶”式API——DirectX [14:45]。为了狙击OpenGL,微软甚至亲自下场,将划时代的《毁灭战士》(Doom)移植为“Doom 95” [15:01],以此昭告天下:Windows才是游戏的未来。这场OpenGL与DirectX的“标准之战” [15:45],表面上是API的竞争,实则是对未来虚拟世界“生态主导权”的争夺。
“管线”的解放:从固化流程到可编程的“GPU宇宙”
在很长一段时间里,无论OpenGL还是DirectX,它们指挥硬件的方式都像在操作一条固定的“图形管线” [15:53]。数据(如模型的顶点)从一端进入,经过一系列固化在硬件上的流程——变换、裁剪、光栅化、着色——最后变成屏幕上的像素。开发者就像工厂的工头,只能调整参数,却无法改变流水线的结构。
真正的革命发生在21世纪初。硬件厂商和API设计者们做出了一个伟大的决定:解放这条管线。他们引入了“可编程着色器”(Programmable Shader)[16:00]。借助HLSL(用于DirectX)或GLSL(用于OpenGL)[16:08] 这样的着色语言,开发者终于可以随心所欲地编写代码,去精确控制顶点如何运动、像素如何着色。
这个看似微小的改动,其影响却石破天惊。它彻底释放了图形硬件的潜力。GPU(图形处理器)不再是只能画图的“显卡”,它变成了一台拥有成百上千个核心的、强大的并行计算设备 [16:12]。正是这次解放,不仅催生了今天游戏中照片级的“基于物理的渲染”(PBR)[16:16],其强大的算力也溢出到了图形之外,成为了今天人工智能和科学计算的绝对主力。我们从“使用工具”的人,变成了“创造工具”的人。
最终的边界:当我们成为新世界的“造物主”
随着Vulkan [17:03]、Metal和DirectX 12这样“低开销”API的出现,开发者已被授予了前所未有的、对硬件的底层控制权。当元宇宙(Metaverse)和空间计算 [17:29] 开始将数字信息叠加在现实环境之上时,我们发现,绘制图形本身已不再是瓶颈,真正的瓶颈只剩下了我们的想象力 [17:22]。
我们始于“复现”世界的渴望。而今,我们正站在“创造”世界的边缘。未来,当人工智能、物理模拟与量子计算 [18:00] 彻底融入图形学,我们或许真的会迎来那一天——你我眼前的世界,已再难分清,究竟是物理的真实,还是计算机生成的终极幻象。
思想来源 (Source of Inspiration): 让水烧开
原始视频 (Original Video): https://www.youtube.com/watch?v=dmgH9pzDa7I
Loading...