22 · 09 · 18 号刊 第 21 期
诸位,秋安!感谢上期赞赏的朋友们。
本期三篇选文中,《你为什么这么忙?》来自 Tom Lingham 的个人博客文章,反思了作为团队负责人、管理层乃至决策层的忙碌现象;《克劳德·香农的熵概念是如何量化信息的》介绍了克劳德·香农提出的信息熵的概念及其应用;《DALL-E 的麻烦:关于利用人工智能加速数字艺术市场的五点思考》从艺术家的角度出发,对当下 AI 绘画冲击艺术家市场的现状进行了剖析与展望。
希望有所启发。
你为什么这么忙?
→ 原文链接: Why are you so busy? Tom Lingham / 博客 / 2022 年 8 月 29 日
免责声明:为了保护个人身份,文中故事的细节略有改动。
「我实在太忙了,几乎没有时间喘息,更不用说和我的团队一起做建模练习了」。这是我的一个同事在漫长的一天结束后,我问他做得怎么样时对我说的。我相信他是真诚的——他太忙了。他会在不经意的时候发 Slack 消息和电子邮件;经常在会议中途退出并在聊天中发出「要去参加下一个会议」的消息;在 Scrum-of-Scrum 会议上,当领导层就他们热情地推给他的最后期限向他提问时,他总是显而易见的紧张;而他的团队显然都倍感压力,两名关键团队成员已经离职。至少在我看来,其他人也在偷偷关注。
这多么可怕!他和团队都太忙了,无法完成本职工作,而且可能是灾难性的,这绝不是一个孤立的事件。
他们正在构建的系统是一个旧系统的替代品,该系统暴露了客户的个人数据。客户的姓名、年龄、出生日期以及他们的性别和族裔等身份信息都可以通过暴露在公共互联网上的系统以这种或那种方式获得。这真的不是那种你应该跳过任何安全基本要素的工作。
太忙的荒谬性
对我来说,这状况似乎很荒谬。他自己和团队都太忙了,无法正确地完成工作,也无法达到任何质量水平,这只会使事情变得更糟。公司已经划定了截止日期和范围,并且(几乎是兴高采烈地)忽略了对更多时间和资源的要求。他在这个角色上缺乏经验,这意味着他只是接受了这个命运,并给团队施加压力,让他们更快地交付以试图弥补。同时也意味着牺牲了高质量的工程实践。最令人失望的是,牺牲了整个团队的生活质量。他当时并没有意识到,但……
只要你的工作做得很好,并不断致力于业务优先考虑的下一件最重要的事情,任何超出团队能力范围的交付压力在客观上都是不合理的。
如果以下情况属实:
- 你的团队正在遵循软件工程实践,这些实践一次又一次地被证明是高性能技术团队的标志(想想 CI/CD 和 DevOps)。
- 你已经尽可能有效地模拟了团队的架构、工作和沟通(在你能影响的方面)。
- 你的团队总是在做下一件最重要的事情(按业务优先级)。
那么,你就没有更多的杠杆可以拉动,不会导致你自己和团队成员的生活质量下降,你需要仔细考虑为什么要这样做。
你可以牺牲质量,但是你的团队将不得不处理更多的计划外工作(因为生产中出现的问题),减少准备时间,增加变更失败率,等等。你可以要求团队超时工作,前提是他们同意并为额外工作时间支付丰厚的报酬(通常并非如此),那么你很快就会发现他们离职,去找那些更合理、更令人满意、报酬更高的工作(游戏行业正在逐步摸索)。
在这种情况下,公司对工作施加影响的唯一合理方式是:
- 缩小工作范围。
- 为额外的团队提供资金和/或进行相应地重组。
- 变更交付日期。
你只应该有目的地忙碌
在某些情况下,你需要磨练。也许你是一个初创公司,想在最后期限前完成一个 demo(演示),为了确保资金,你需要把这个 demo 搞定。也许你是一个雄心勃勃的团队,正在努力争取丰厚的奖金。不管是什么,这些都有一个共同点:他们都在追求一个既定的激励。
如果你太忙,为什么会这样?你和团队在追求什么?如果你因为别人施加的压力而太忙,为什么他们认为应该能够对你提出更多要求?
你太忙了,是因为公司期望你在某个日期前完成任务,而不顾你的团队的能力(他们正在提供高质量的产出,并且总是在做公司优先考虑的下一件最重要的事情)吗?那么这就是你需要与老板以及利益相关者进行的对话。这很可能是不合理的。
你太忙了,是因为团队正在处理之前遗留的工程质量问题吗?那么这就是你需要进行的另一次对话。公司应该帮忙释放能力,使团队能够解决这些问题,或者至少以积极的加班补偿支持团队,直到问题得到解决。如果做不到这一点,也许可以反思一下你当初为什么加入这家公司。
你太忙了,是因为团队正在处理由于你的决策而产生的工程质量问题吗?这是一个更艰难的对话,但你仍然需要进行。协商时间来解决质量问题,并与你的同事一起工作。这样做往往符合大家的最佳利益。
总结
你和你的团队永远不应该忙到无法正常工作,甚至开始讨厌工作。特别是如果你是一个团队负责人或高层,那么你实际上应该有自由的时间来独自思考,并与同事进行有机的交谈和设想。与流行的看法相反:背靠背的会议不是一种荣誉的象征,而是一个危险信号。
克劳德·香农的熵概念是如何量化信息的
→ 原文链接: How Shannon Entropy Imposes Fundamental Limits on Communication / Kevin Hartnett / Quanta Magazine / 2022 年 9 月 6 日
为了传达一系列的随机事件,如抛硬币,你需要使用大量的信息,因为信息没有结构。香农熵衡量了这一基本约束。
如果有人告诉你一个你已经知道的事实,他们基本上什么也没告诉你。而如果他传达的是一个秘密,那么可以说是真正传达了什么。
这种区别是克劳德·香农信息论的核心。它在 1948 年的一篇划时代的论文《通信的数学理论》( A Mathematical Theory of Communication 中首次提出,并提供了一个严谨的数学框架,用于量化准确地发送和接收消息所需的信息量,这是由预期信息可能表达的不确定性程度决定的。
举个例子,在一种情况下,我有一枚特制硬币——两面都是正面。我要将其翻转两次。需要多少信息来传达这个结果呢?完全不需要,因为在收到信息之前,你已经完全确定两次翻转的结果都是正面。
在第二种情况下,我用一枚普通的硬币进行两次翻转——一面是正面,另一面是反面。我们可以用二进制代码交流结果:0 代表正面,1 代表反面。那么有四种可能的信息——00、11、01、10——而每种信息都需要两个比特。
那么,这有什么意义呢?在第一种情况下,你对信息的内容有完全的确定性,并且需要零比特来传输它。在第二种情况下,你有 1/4 的机会猜到正确的答案——25% 的确定性——而信息需要两个比特的信息来解决这个模糊性。更为普遍的是,你对信息的内容了解越少,它需要传递的信息就越多。
香农是第一个在数学上精确阐释这种关系的人。他在一个公式中捕捉到了这一点,该公式计算了传递信息所需的最小比特数——一个后来被称为「香农熵」(Shannon entropy)的阈值。他还表明,如果发送者使用的比特数少于最小比特数,信息将不可避免地被扭曲。
加州大学圣地亚哥分校的信息理论家塔拉·贾维迪( Tara Javidi)说:「他有这种伟大的直觉,当你对学习某件事情感到最惊讶时,信息就会最大化。」
「熵」这个术语是从物理学中借来的,在物理学中,熵是对无序的一种衡量。一片云比一块冰有更高的熵,因为云相较于冰的晶体结构排列水分子的方式具有更多可能性。以此类推,一个随机信息具有很高的香农熵——它的信息可以有许多种排列方式,而遵守严格模式的信息则具有低熵。在物理学和信息论中,熵的计算方式也有形式上的相似之处。在物理学中,熵的计算公式包括对可能的物理状态进行对数计算。在信息论中,它是可能事件结果的对数。
香农熵的对数公式掩盖了它所描述的概念的简单性——因为思考香农熵的另一种方式是平均需要多少个「是」或「否」的问题来确定一条信息的内容。
例如,假设有两个气象站,一个在圣地亚哥,另一个在圣路易斯。每个人都想把自己城市的七天预报发给另一个。圣地亚哥几乎总是阳光明媚,这意味着你对预报的内容有很大的信心。圣路易斯的天气更不确定——出现晴天的可能性接近 50-50。
1954 年,克劳德·香农在贝尔实验室 / 弗朗西斯·贝洛的遗产 / 科学资源
传递每个七天预测需要多少个是或否的问题?对于圣地亚哥,第一个问题的有利可能是:预报中的七天都是晴天吗?如果答案是肯定的(而且很有可能是肯定的),你就可以只用一个问题确定整个预测。但是对于圣路易斯来说,你几乎必须一天一天地看完预报。第一天是晴天吗?第二天呢?
信息内容的确定性越高,平均而言,你用以确定它需要的「是」或「否」的问题就越少。
再举个例子,设想两个版本的字母游戏。在第一个版本中,我从英语字母表中随机选择了一个字母,我想让你猜出来。如果你使用最好的猜测策略,你平均要花 4.7 道题才能得到它。(一个有用的第一个问题是:「这个字母是在字母表的前半部分吗?」)
在游戏的第二个版本中,你不是猜测随机字母的数值,而是要猜测实际英语单词中的字母。现在你可以调整你的猜测,利用一些字母比其他字母出现得更频繁的事实(「这是元音吗?」),以及知道一个字母的价值有助于你猜测下一个字母的价值(q 几乎总是跟着 u)。香农计算出英语语言的熵是每个字母 2.62 比特(或 2.62 个是或否的问题),远远低于每个字母随机出现时所需的 4.7 比特。换句话说,模式减少了不确定性,这使得用相对较少的信息进行大量的交流成为可能。
请注意,在诸如此类的例子中,你可以提出更好或更差的问题。香农熵设定了一个不可侵犯的底线:它是传达一个信息所需的绝对最小比特数,或者说是或否的问题。
「香农表明存在着像光速一样的东西,一个基本的极限,」贾维迪说,「他表明,香农熵是一个基本的限制,即我们可以在多大程度上压缩一个源,而不会有失真或损失的风险。」
今天,香农熵在许多应用环境中都成为了衡量标准,包括信息压缩技术。例如,你可以压缩一个大型电影文件,这是因为像素颜色具有统计模式,就像英语单词一样。工程师可以为从一帧到下一帧的像素颜色模式构建概率模型。这些模型使得计算香农熵成为可能,方法是为模式分配权重,然后对所有可能出现的像素的权重取对数。这个值告诉你「无损」压缩的限制——在你开始丢失有关其内容的信息之前,电影可以被压缩的绝对最大值。
任何压缩算法的性能都可以与这个极限进行比较。如果你离它很远,你就有动力去努力寻找更好的算法。但如果你接近它,你就知道宇宙的信息定律使你无法做得更好。
关联阅读
DALL-E 的麻烦:关于利用人工智能加速数字艺术市场的五点思考
→ 原文链接: The Trouble with DALL-E / Kevin Buist / Outland / 2022 年 8 月 11 日
7 月 20 日,Open AI 宣布他们的图像生成器 DALL-E 可用于制作商业项目。考虑到成群的创作者可能会懒惰地使用 AI 来生产低工作量的 NFT,我在推特上表示,直接将 AI 输出作为 NFT 是一个坏主意。我被嘲笑并被称为「勒德分子」(十九世纪初英国手工业工人中参加捣毁机器的人)。也许我急于做出判断?所以我要求人们标记使用 AI 图像生成器的艺术家——无论是 DALL-E、Midjourney 还是其他——来制作 NFT。这条推文收到了许多热烈的回应,有几十位艺术家给自己和其他人打上了标签。许多艺术家表示,他们在最终确定为 NFT 之前对 AI 输出进行了改进或操作。其他人只是在铸造人工智能给他们的东西。然而,这些回应在艺术上都不是特别引人注目的,大多数似乎是在说明软件的能力,而不是艺术家本身的能力。当艺术家开始将这个工具融入他们的实践中时,对 AI 插图进行润色或添加并没有解决出现的基本问题。下面是关于艺术家如何找到(或不找到)使用人工智能图像生成器的有效方法的五个说明。
小故事讲述大道理
一些艺术家在我的推特上回复了一些看起来很有绘画性的图像。晕染和丰富的赭石色在手机和电脑的小玻璃屏幕上显得平淡无奇。这些不是绘画,也不是绘画活动的记录。看一幅画的最好的事情之一就是用你的眼睛走过图像的构造。艺术家为什么要这样安排?当他们通过图像工作时,他们改变了什么?什么事情发生得快,什么事情发生得慢?我们可以通过图像追踪艺术家的路径。而 AI 图像,即使是那些看起来像画家的图像,也不能提供这种体验。它们只是一个庞大的图像库的均值。区别就像一个人的生活故事和宏观的人口统计研究之间的区别。两者都描述了人类生活,但一个通过特殊性展示了普遍的真理,而另一个则呈现了一个由无数普遍性的黑盒提供的单一图像。当看 AI 图像时,我们无法将自己作为观众的主观性与艺术家作为创作者的主观性相匹配。我们看到的只是平均值,而不是特定的人类体验。
艺术是艺术家在世界上存在方式的记录
关于 AI 图像生成器的输出是否是艺术,Twitter 上存在争论。这场辩论并不有趣。当然,它们可以是:如果艺术家称一个图像为艺术,它就是艺术。更紧迫的问题是为什么会有这样的说法,这个说法对我们对图像的反应有什么作用,以及这个说法如何与艺术家作品的大背景相关联。将 AI 图像宣布为艺术的潜在问题在于它们缺乏什么。艺术品是艺术家设计的策略的记录。一个图像或物体承载着它自己制作的故事,以及它的制造者的故事。从更广泛的意义上说,它是艺术家在世界上的存在方式、他们如何制作物品、他们如何找到自己的声音的记录。这对于 jpg、绘画和大理石雕塑一样适用。媒介并不重要。 AI 图像生成器的问题在于隐藏了生成图像的策略。就 DALL-E 而言,它是 Open AI 拥有的专有公式。从这类作品中,我们唯一能说的关于艺术家在世界上的存在方式是,他们是 Open AI 的客户,是软件的使用者。调整提示以优化 DALL-E 的输出类似于玩电脑游戏。并不是说它不能是艺术。但艺术家应该要求更多的代理权。他们应该自己制作游戏,或者类似复杂性的系统,而不是接受单纯的玩家角色。
现在一切都可以是一种流派
对 AI 图像生成器的一些最尖锐的批评来自艺术家,他们声称,像大卫·奥莱利(David O'Reilly)一样,这些公司通过在无数未经认可的艺术家、插画家和摄影师的作品上训练他们的模型来进行知识和艺术盗窃。这一点似乎是短视的,因为 AI 只是将图像制作的一个重要方面自动化。人类是视觉采样机器,引用图片的词汇,就像我们用没有发明的单词说话一样。一个完全原创的图像将是难以辨认的。所有的图片,甚至是抽象的图片,都使用了从其他艺术家那里传来的视觉参考和引用的语言。
然而,有些事情正在发生变化。过去,有一套有限的单词、短语和叙事原型,可以激发出一个流派的视觉元素。例如,「牛仔」和「海盗」这两个词在我们的脑海中勾勒出的图像,是由我们对其各自流派的共同理解所决定的。但是,现在能够以一般方式被视觉化的单词和短语的清单已经不再局限于我们松散的流派清单。现在,我们可以从任何语言表达中引出图像,所有可能的短语都变成了微流派。这就是为什么奥莱利对抄袭的指控不成立。AI 并不完全是在抄袭艺术家。它是利用他们的图像来概括语言所能表达的一切的视觉描述。
所有图像都已存在
如果所有可能的语言表达都变成了微流派,那么很容易得出结论,所有可能的图像都已经存在,并且 AI 图像生成器实际上是一种搜索引擎。这让人想起概念艺术家雪莉·莱文(Sherrie Levine)在 1982 年发表的声明,她反思了世界是如何「充满到令人窒息的图像」。她写道:「我们知道,一张照片只是一个空间,在这个空间中,各种各样的图像,没有一个是原创的,融合和冲突。」「一幅画是从无数文化中心引出的一段引文。」这就是她如何证明一种艺术实践的合理性,其中挪用与剽窃调情。
与我们今天面临的大量图像相比,20 世纪后期的图像饱和度看起来很古怪。如果我们在 1982 年窒息,到 2022 年已经被淹死几十年了。更实际地说,这项新技术意味着图像制作的「语录组织」不再是单个艺术家需要自己组装的东西。这项工作已经完成。图像制作变成了搜索,就像博尔赫斯的「巴别图书馆」的视觉版本,关于一个无限图书馆的故事,每一个可能的字母组合都被打印在永无止境的卷中。最伟大的文学作品已经存在于某个地方。图书馆的居民只需要找到它们。
AI 图像削弱了 NFT 的潜力
NFT 是一种证书,应该标志着三件事:一个艺术家制作了证书所示的作品,证书和它所指向的媒体是独一无二的,以及一个人拥有证书所示的媒体。 AI 生成的 NFT 打破了这三个原则中的两个。艺术家没有制作图像,说他们找到了更准确。这件作品不是独一无二的,而是来自无限图像流的样本。当然,令牌仍然可以拥有。也许 AI 生成的 NFT 就像一张渔夫自豪地展示渔获物的照片。它们是发现的证据。
我对将 AI 图像铸造为 NFT 的做法的不安来自于 NFT 整体文化意义这一悬而未决的问题。也许铸造人工智能产出的便利性预示着对 NFT 的定义已经走到了死胡同:一种金融资产,依附于一幅模糊的绘画图像,与人类制作或站在一幅画前的丰富经验无关。我希望 NFT 可以描绘出超越通过平均图片和文字之间的联系所制作的艺术品。 DALL-E 是一个强大的工具,艺术家绝对应该使用它。但艺术家也应该拒绝满足于成为科技公司的客户。艺术家应该利用各种工具,不管是旧的还是新的,并推动它们超越自己的极限。如果 AI 可以将制作图片的工作自动化,为什么不使用 AI 文本生成器来编写提示,并使用基于 AI 的代码生成器来编写智能合约呢?艺术家们甚至可以训练一个 AI 来分析过去 NFT 投放的市场成功。艺术实践的哪些元素可以被 AI 取代的问题是可怕的,也是令人激动的,但这是一个应该由艺术家自己推动的调查。
速览
- 📐设计: 界面设计师的用户体验清单
- 🧠哲学: 如何以对抗的方式阅读哲学
- 🪙商业: Super.so 创始人 @traf 对创业历程的简短回顾
- 🎨艺术: 杰作故事:米开朗基罗的大卫
- 📦产品: 用户体验核心:产品开发中的 105 种认知偏差
捐赠
📮Shyrism.News 是一份甄选的时事通讯,两周一期,涵盖新奇趣闻、热点议题、前沿科技以及其他关于生活、关于未来的事物。以精心细致的筛选对抗外强中干的算法,以热情洋溢的文字中和冷漠呆板的代码。
如果您觉得「Shyrism.News」有价值,请支持和分享给你的朋友或社交网络。
感谢打赏的朋友,请务必备注称呼或邮箱,以免清理账户时丢失数据。