想象机器 · 数字艺术先驱档案 ← 博客
理论研究 2025 · 007

创造系统的人,与使用系统的人

计算机艺术七十年的真正分野——这条边界关乎一个比"是不是用了 AI"远更深的问题:这门艺术作为一门艺术的合法性。

2021年6月11日,德州奥斯汀,一位叫 Tyler Hobbs 的艺术家在 Art Blocks 平台上线了一段他写了几个月的 JavaScript 代码,命名为《Fidenza》。这段代码会生成一种叫"流场"(flow field)的几何结构——色块沿着一条看不见的曲线流动,在画面上形成既有规律又永远不会重复的有机图案。整套代码控制了 999 次铸造。每一次铸造,代码会跑一次,生成一张此前不存在、此后也不会再有的独特图像。

同一年的另一边,差不多同时,Midjourney 正式公测。一个用户输入"in the style of Tyler Hobbs, flow field, vibrant colors, organic shapes",几秒钟后,模型给出了四张相当像 Fidenza 的图。

这两件事表面上都在做同一件事:用算法生成图像。但它们本体上是完全不同的两件事——而这一点上的混淆,正在让"AI 艺术"这个词变得越来越没有意义。

两种工作的真正区别

先把这两件事并排放好:

2021 / Austin
Tyler Hobbs · Fidenza
几个月,从零写出一段流场算法,定义了一种之前不存在的视觉语言——色块、曲率、密度、调色板的所有规则,都由他定义。代码本身是作品,999 张图像是这段代码的实例。这套语言是 Hobbs 的原创贡献,可以被研究、被引用、被发展。
2021 / 任意地方
某用户 · "in the style of..."
几秒钟,在 Midjourney 已经训练好的视觉语言空间里,输入一段提示词,挑选一张满意的输出。视觉语言不是这个用户的——它是 Midjourney 工程团队和它训练数据里数千万张图像的产物。用户做的是策展式的选择,不是语言的创造。

这里的关键不是"哪一种更好"——这两种工作各有各的价值。关键是它们不是同一种东西

Hobbs 在创造一种系统;Midjourney 用户在使用一种系统。前者扩展了人类视觉语言的边界,后者在已有的边界内做选择。把这两件事都叫"AI 艺术"或都叫"计算机艺术",就像把作曲家和点歌的人都叫"音乐家"——技术上没错,但抹掉了一个本质区别。

三层控制深度

更精确地说,要判断一位艺术家站在这条分野的哪一侧,可以看三层:

第一层,执行控制。艺术家是否完全决定生成过程的每一步?Frieder Nake 写 ALGOL,机器严格执行——完全控制。Tyler Hobbs 写 JavaScript,链上验证执行——完全控制。Refik Anadol 训练自己的神经网络,控制训练数据、架构和参数——较高控制。一个用户在 Midjourney 里输入提示词——大部分决定其实是模型在做的,用户只在最后选了一张。

第二层,可复现性。给定相同的输入,这套规则是否能稳定重现?算法代码:给定 seed 完全可复现。自训练的模型:艺术家自己的版本可复现。商用大模型 prompt:模型一更新,你的"规则"就失效了——这意味着这套规则其实并不属于使用者,它属于模型公司。一套不属于你的"语言",不能成为你的艺术语言。

第三层,也是最关键的一层——这套生成机制本身,是不是这位艺术家的原创贡献?

当 Tyler Hobbs 写 Fidenza 那段代码时,生成的视觉语言是 Hobbs 的。
当用户写 Midjourney prompt 时,生成的视觉语言是 Midjourney 的——用户只是在它已有的可能性空间里做选择。

这才是真正的边界。写代码的艺术家在创造一种新的视觉语言;写 prompt 的艺术家(在大多数情况下)在使用已经被模型公司创造好的视觉语言。

为什么这条边界值得守住

有人会说:这种区分太严格了,不近人情。在大模型时代,创作的边界已经模糊,何必非要划清?

这个反驳听起来宽容,但它其实是一种错误的善意。把所有"用了 AI"的实践都笼统称为"AI 艺术",看似平等,实际上抹掉的是那些真正在做系统层面创造的艺术家的工作——他们花几个月、几年甚至几十年构建的算法、模型、训练流程,被简化为和一个十秒的 prompt 同等的"创作"。这不是平等,是把真正的创造稀释成普通的消费

七十年来,从纳克到莫尔纳到 Hobbs,这条谱系上的艺术家共同做了一件事——他们把"如何生成图像"从工程师的工作变成了艺术家的工作。他们把execution(执行)从机器手里抢回来,变成了一种艺术媒介。这件事的价值,恰恰来自它的难——来自一个艺术家愿意花时间去理解算法、调试参数、训练模型,把抽象的规则系统打磨成具体的视觉语言。

商用大模型把这件事的"成本"消除了,但同时也消除了它的"贡献"。当你只需要写一句"流场风格,鲜艳色彩"就能得到一张接近 Fidenza 的图时,Hobbs 那几个月的工作并没有被免费分享给你——它被抽取了,成为了模型公司的产品的一部分。你使用的不是 Hobbs 的语言,是 Hobbs 的语言被模型吸收后剩下的痕迹。

那么 AI 时代真正的艺术家在做什么

这条边界划清之后,我们就能更准确地辨认出:在大模型时代,真正站在"创造系统的人"这一侧的艺术家是谁。

梅莫·阿克滕(Memo Akten)在2017年开始的"学会观看"(Learning to See)系列,训练自己的神经网络在特定的视觉领域(海浪、火焰、星云),让网络把摄像头看到的任何东西"翻译"为它所知道的世界。他在创造一套属于他自己的认知系统,这套系统揭示的是机器视觉的局限,也是人类视觉的局限。

鍾愫君(Sougwen Chung)用自己二十年的绘画数据训练 D.O.U.G.,一个能在舞台上和她实时合作绘画的机器人系统。她创造的不是某张画,而是一个"人机协作"的系统范式——这个系统现在被 V&A 收藏的,正是它的神经网络模型本身。

Anna Ridler 用自己亲手拍摄的一万张郁金香照片,从零训练 GAN,生成《Mosaic Virus》——一件关于17世纪荷兰郁金香泡沫和当代加密货币泡沫的作品。她坚持用自己的数据集,因为她明白:如果用别人的数据,这件作品的语言就不是她的。

Holly Herndon 和 Mat Dryhurst 训练了 Holly+ ——Holly 自己的声音模型,然后把它开源,让其他艺术家用它创作。他们做的事情更激进——他们不仅创造了系统,还重新定义了"声音作为艺术家身份"这件事的所有权和使用方式。

这四位艺术家有一个共同点:他们没有止步于使用别人的工具,而是创造了自己的工具,并且这个工具本身就是作品。他们站在纳克和莫尔纳那条谱系的延长线上,只是手里的"机器"从绘图仪换成了神经网络。

这条边界对中国意味着什么

这件事对中国数字艺术界尤其重要,因为我们正处在一个特殊的时刻。

过去三年,大模型在国内的爆发让"AI 艺术"成了一个最热的词。各种"AI 艺术家"在小红书、微博、画廊、艺博会涌现。其中有真正在做系统层面工作的人——训练自己的 LoRA、微调模型、构建工作流——但也有相当一部分,做的其实只是"用 Midjourney 写 prompt"这件事的高级版本。这两种工作如果都叫"AI 艺术",中国艺术界就会重复一遍国际艺术界用了五十年才纠正过来的错误——把使用工具的人误认为是创造工具的人

这种误认有两个后果。第一,真正在创造系统的中国艺术家——那些花几年时间研究算法、训练模型、构建生成流程的人——会被淹没在大量"prompt 创作者"的喧嚣里,得不到应有的辨识度。第二,中国的策展人、机构、藏家会陷入一种判断困境——他们看到的所有"AI 艺术"看起来都差不多,无法区分谁在做真正的艺术贡献,谁只是在做高效的内容生产。

纠正这件事的方法很简单——重新启用那条七十年前就已经存在的判断标准:这位艺术家是在创造一种新的生成系统,还是在使用别人创造好的生成系统?

这个问题不带敌意,但它锋利。它能在五分钟之内分清楚一位创作者站在分野的哪一侧,而这种分清楚,对一个正在形成自己数字艺术叙事的国家来说,是必要的。

一种新实践,需要一个诚实的名字

最后必须说清楚一件事——这篇文章不是在贬低 AI prompt 创作。

用提示词与大模型协作,可以是一种真正有创造力的实践。一个有视觉判断力的人,可以在 Midjourney 的可能性空间里挑选出他人挑不出的图像,并通过持续的提示词工程发展出某种策展式的个人风格。这件事有它自己的价值,也有它自己的难度。

但它不是计算机艺术的延续。它属于一个新的、不同的艺术传统——更接近摄影刚出现时的那种实践:艺术家不再"创造图像",而是"选择图像"。摄影后来发展出了自己的美学、自己的批评语言、自己的大师谱系。AI prompt 创作大概也会走同一条路。

但那是另一条路。把它和计算机艺术混为一谈,既低估了 prompt 创作作为新媒介的独立性,也稀释了计算机艺术作为系统创造艺术的传统。

七十年前,纳克写下第一行算法的时候,他在做一件之前没有人做过的事——把"规则的创造"本身变成艺术。今天,一个真正的计算机艺术家仍然在做同一件事,只是手上的工具变了。中间这七十年,这条谱系从未中断。它需要的不是更多人挤进来,而是更清晰地被看见

这是想象机器档案做这件事的原因。

◈   ◈   ◈
本文为想象机器档案系列第007篇 / 2025
相关阅读:作品不是图像——计算机艺术的本体论 · 关于想象机器——当代数字艺术的前史
档案首页:gennexus.xyz
← 返回博客列表