创造系统的人,与使用系统的人
2021年6月11日,德州奥斯汀,一位叫 Tyler Hobbs 的艺术家在 Art Blocks 平台上线了一段他写了几个月的 JavaScript 代码,命名为《Fidenza》。这段代码会生成一种叫"流场"(flow field)的几何结构——色块沿着一条看不见的曲线流动,在画面上形成既有规律又永远不会重复的有机图案。整套代码控制了 999 次铸造。每一次铸造,代码会跑一次,生成一张此前不存在、此后也不会再有的独特图像。
同一年的另一边,差不多同时,Midjourney 正式公测。一个用户输入"in the style of Tyler Hobbs, flow field, vibrant colors, organic shapes",几秒钟后,模型给出了四张相当像 Fidenza 的图。
这两件事表面上都在做同一件事:用算法生成图像。但它们本体上是完全不同的两件事——而这一点上的混淆,正在让"AI 艺术"这个词变得越来越没有意义。
两种工作的真正区别
先把这两件事并排放好:
这里的关键不是"哪一种更好"——这两种工作各有各的价值。关键是它们不是同一种东西。
Hobbs 在创造一种系统;Midjourney 用户在使用一种系统。前者扩展了人类视觉语言的边界,后者在已有的边界内做选择。把这两件事都叫"AI 艺术"或都叫"计算机艺术",就像把作曲家和点歌的人都叫"音乐家"——技术上没错,但抹掉了一个本质区别。
三层控制深度
更精确地说,要判断一位艺术家站在这条分野的哪一侧,可以看三层:
第一层,执行控制。艺术家是否完全决定生成过程的每一步?Frieder Nake 写 ALGOL,机器严格执行——完全控制。Tyler Hobbs 写 JavaScript,链上验证执行——完全控制。Refik Anadol 训练自己的神经网络,控制训练数据、架构和参数——较高控制。一个用户在 Midjourney 里输入提示词——大部分决定其实是模型在做的,用户只在最后选了一张。
第二层,可复现性。给定相同的输入,这套规则是否能稳定重现?算法代码:给定 seed 完全可复现。自训练的模型:艺术家自己的版本可复现。商用大模型 prompt:模型一更新,你的"规则"就失效了——这意味着这套规则其实并不属于使用者,它属于模型公司。一套不属于你的"语言",不能成为你的艺术语言。
第三层,也是最关键的一层——这套生成机制本身,是不是这位艺术家的原创贡献?
当 Tyler Hobbs 写 Fidenza 那段代码时,生成的视觉语言是 Hobbs 的。
当用户写 Midjourney prompt 时,生成的视觉语言是 Midjourney 的——用户只是在它已有的可能性空间里做选择。
这才是真正的边界。写代码的艺术家在创造一种新的视觉语言;写 prompt 的艺术家(在大多数情况下)在使用已经被模型公司创造好的视觉语言。
为什么这条边界值得守住
有人会说:这种区分太严格了,不近人情。在大模型时代,创作的边界已经模糊,何必非要划清?
这个反驳听起来宽容,但它其实是一种错误的善意。把所有"用了 AI"的实践都笼统称为"AI 艺术",看似平等,实际上抹掉的是那些真正在做系统层面创造的艺术家的工作——他们花几个月、几年甚至几十年构建的算法、模型、训练流程,被简化为和一个十秒的 prompt 同等的"创作"。这不是平等,是把真正的创造稀释成普通的消费。
七十年来,从纳克到莫尔纳到 Hobbs,这条谱系上的艺术家共同做了一件事——他们把"如何生成图像"从工程师的工作变成了艺术家的工作。他们把execution(执行)从机器手里抢回来,变成了一种艺术媒介。这件事的价值,恰恰来自它的难——来自一个艺术家愿意花时间去理解算法、调试参数、训练模型,把抽象的规则系统打磨成具体的视觉语言。
商用大模型把这件事的"成本"消除了,但同时也消除了它的"贡献"。当你只需要写一句"流场风格,鲜艳色彩"就能得到一张接近 Fidenza 的图时,Hobbs 那几个月的工作并没有被免费分享给你——它被抽取了,成为了模型公司的产品的一部分。你使用的不是 Hobbs 的语言,是 Hobbs 的语言被模型吸收后剩下的痕迹。
那么 AI 时代真正的艺术家在做什么
这条边界划清之后,我们就能更准确地辨认出:在大模型时代,真正站在"创造系统的人"这一侧的艺术家是谁。
梅莫·阿克滕(Memo Akten)在2017年开始的"学会观看"(Learning to See)系列,训练自己的神经网络在特定的视觉领域(海浪、火焰、星云),让网络把摄像头看到的任何东西"翻译"为它所知道的世界。他在创造一套属于他自己的认知系统,这套系统揭示的是机器视觉的局限,也是人类视觉的局限。
鍾愫君(Sougwen Chung)用自己二十年的绘画数据训练 D.O.U.G.,一个能在舞台上和她实时合作绘画的机器人系统。她创造的不是某张画,而是一个"人机协作"的系统范式——这个系统现在被 V&A 收藏的,正是它的神经网络模型本身。
Anna Ridler 用自己亲手拍摄的一万张郁金香照片,从零训练 GAN,生成《Mosaic Virus》——一件关于17世纪荷兰郁金香泡沫和当代加密货币泡沫的作品。她坚持用自己的数据集,因为她明白:如果用别人的数据,这件作品的语言就不是她的。
Holly Herndon 和 Mat Dryhurst 训练了 Holly+ ——Holly 自己的声音模型,然后把它开源,让其他艺术家用它创作。他们做的事情更激进——他们不仅创造了系统,还重新定义了"声音作为艺术家身份"这件事的所有权和使用方式。
这四位艺术家有一个共同点:他们没有止步于使用别人的工具,而是创造了自己的工具,并且这个工具本身就是作品。他们站在纳克和莫尔纳那条谱系的延长线上,只是手里的"机器"从绘图仪换成了神经网络。
这条边界对中国意味着什么
这件事对中国数字艺术界尤其重要,因为我们正处在一个特殊的时刻。
过去三年,大模型在国内的爆发让"AI 艺术"成了一个最热的词。各种"AI 艺术家"在小红书、微博、画廊、艺博会涌现。其中有真正在做系统层面工作的人——训练自己的 LoRA、微调模型、构建工作流——但也有相当一部分,做的其实只是"用 Midjourney 写 prompt"这件事的高级版本。这两种工作如果都叫"AI 艺术",中国艺术界就会重复一遍国际艺术界用了五十年才纠正过来的错误——把使用工具的人误认为是创造工具的人。
这种误认有两个后果。第一,真正在创造系统的中国艺术家——那些花几年时间研究算法、训练模型、构建生成流程的人——会被淹没在大量"prompt 创作者"的喧嚣里,得不到应有的辨识度。第二,中国的策展人、机构、藏家会陷入一种判断困境——他们看到的所有"AI 艺术"看起来都差不多,无法区分谁在做真正的艺术贡献,谁只是在做高效的内容生产。
纠正这件事的方法很简单——重新启用那条七十年前就已经存在的判断标准:这位艺术家是在创造一种新的生成系统,还是在使用别人创造好的生成系统?
这个问题不带敌意,但它锋利。它能在五分钟之内分清楚一位创作者站在分野的哪一侧,而这种分清楚,对一个正在形成自己数字艺术叙事的国家来说,是必要的。
一种新实践,需要一个诚实的名字
最后必须说清楚一件事——这篇文章不是在贬低 AI prompt 创作。
用提示词与大模型协作,可以是一种真正有创造力的实践。一个有视觉判断力的人,可以在 Midjourney 的可能性空间里挑选出他人挑不出的图像,并通过持续的提示词工程发展出某种策展式的个人风格。这件事有它自己的价值,也有它自己的难度。
但它不是计算机艺术的延续。它属于一个新的、不同的艺术传统——更接近摄影刚出现时的那种实践:艺术家不再"创造图像",而是"选择图像"。摄影后来发展出了自己的美学、自己的批评语言、自己的大师谱系。AI prompt 创作大概也会走同一条路。
但那是另一条路。把它和计算机艺术混为一谈,既低估了 prompt 创作作为新媒介的独立性,也稀释了计算机艺术作为系统创造艺术的传统。
七十年前,纳克写下第一行算法的时候,他在做一件之前没有人做过的事——把"规则的创造"本身变成艺术。今天,一个真正的计算机艺术家仍然在做同一件事,只是手上的工具变了。中间这七十年,这条谱系从未中断。它需要的不是更多人挤进来,而是更清晰地被看见。
这是想象机器档案做这件事的原因。