对 GPT 模型滥用的担忧
从 2022 年 ChatGPT 的诞生,到 2023 年的 AI 爆火,再到 2024 年的 AI 工具遍地开花。 AI 逐渐形成了一股不可阻挡的发展浪潮,而猫猫对目前的 AI 面向普通用户普及有不浅的担忧。
首先声明,猫猫对人工智能的健康发展全力支持,所反对的是部分用户的思想观念、使用方式以及所造成的后果。谨以此文表示担忧,并希望读者能够辨别手中的到底是「智能」还是工具。
本文除特别说明外「AI」均指目前市面上所谓 AI 模型,加引号是为了将目前的 AI 与自底向上型人工智能进行区分。
「目前」指 2024 年 4 月。
GPT 诞生
GPT 的诞生离不开自然语言处理领域的一篇重磅论文:Attention Is All You Need / 你只是需要注意力。
这篇论文提出了 「Transformer」模型架构,通过给模型增加注意力机制处理上下文之间的关联,使得训练成本大幅减少。从而使得大参数模型的训练成为可能。
其商业领域最大的成果则是 「GPT (Generative Pre-Training Transformer) / 生成式预训练」和「BERT (Bidirectional Encoder Representations from Transformers)」两个系列的语言模型。
「训练」、「理解力」、「模型」、「遵循指令」这些词语仿佛将人们带入了未来,机器开始理解人类话语,并且能够做出相应的反馈的景象似乎蔓延开来。
AIGC
有了理论基础,AI 发展高歌猛进,各个公司都在试图抢占这块蛋糕:
- Copilot
- Gemini
- Suno
- Stable Diffusion
- midjourney
- Sora
- 文心一言
- 云雀大模型
- ……
从国外到国内,各式各样的语言服务遍地开花。
有人云「原创从 PGC 到 UGC 再到 AIGC,内容生产时代变革」;
有人云「AI 将无所不能,AI 承包一切工作后,人类还能干什么」;
有人云「人工智能会学会人类思维并失控吗」;
文字、图片、音频、视频,互联网最基础的媒体目前均可被 AI 生成,市场潜力巨大。
PGC (Professional Generated Content / 专业生成内容) 时代由于需要专业人士进行内容创作,生产的速度比较缓慢,但同时在一定程度上保证了内容的专业性和正确性。
UGC (User Generated Content / 用户生产内容) 时代普通用户也能自己藏于创作,内容的形式和数量开始增长,内容的质量层次不齐,正确性需要接收者具有一定的知识进行判断。
AIGC (Artificial Intelligence Generated Content / 人工智能生成内容) 内容创作由于 AI 的加入,数量还是爆炸式增长。
互联网的整体体验在经过两年有余的「AI 变革」中发生了哪些改变呢? AI 拼凑文章铺天盖地; AI 生成图被当作创作成果拳打毕设脚踢画师; AI 配音的视频比比皆是,其中不乏 AI 文案、 AI 画面、AI 配音的 3A 大作。
这一切还有增强的趋势,甚至可以预测一切如此发展下去,世界的确可能会发生改变:上班使用 AI 工具创作由 AI 生成大纲的企划,下班后吃一餐由 AI 搭配的营养餐,脱下由 AI 设计的外套,打开电脑玩由 AI 翻译的 AI 是生成游戏。
对于目前普通使用者而言「AI 能够理解需求并给予成果」这一概念的逐渐普及,用户可以通过 AI 这一黑箱,无需劳动便可获得劳动成果。
目前「AI」的本质
很多人认为 AI 正变得更智能、更感性,正在理解人类。可惜的是,如果对于 NLP 领域有所了解,应该会知道:目前几乎所有的的自然语言处理都是基于统计频率进行预测的模式。
「目前」几乎所有的所谓 AI 都是将字/词使用在不同场的张量表示,通过提示词和算法计算出一个个后继字/词的概率,并综合计算,输出概率最高的内容。
而其他服务型 AI,本质也完全一样,其理论均为论文「Attention Is All You Need」,只不过将字/词替换为了部分画面特征(图片与视频型 AI)、声音的频率组合(音频型 AI)等或将其组合(人声型 AI)。
即使经过了人类算法的加持,AI 其输入本质还是提示词和大量样本的内部联系的频率。AI 并不会理解苹果是什么颜色,什么味道,AI 只知道与「苹果」这个词所代表的张量在「颜色」场下最接近的是「红」接着是「青」、「黄」,在「味觉」场下最接近的是「甜」、「酸」。「理解」与「张量」两种处理方式在宏观下可以得到近似的效果,但是两者本质完全是不同种类。
上一个如此名不副实的东西,叫做「智能手机」。
AIGC 正变为 AIGC
在 AI 的爆发式发展和面向普通人群的普及下,人们似乎理所当然地将 Chatgpt 及其相似衍生物的定位从一开始的聊天服务、翻译搜索的工具逐渐变成了百科全书、助理以及生成各式各样媒体文件的机器。
部分人一旦遇到超出自己能力和理解的事情,便向 ChatGPT 求助,把生成的回答当作真理, 随后口中偶尔冒出「GPT 说 xxxx」并附带「AI 现在能够理解语言,未来将会颠覆世界」之类的言论,成为所谓的「时代前沿者」。 部分人使用 AI 生成的内容,或是作为自己的作品进行投稿,或是对他人进行欺骗、威胁等进行非法牟利。
AIGC 作者中的确有专业生产者通过 AI 途径缩短工作流,但除了这些能保证内容质量的创作者,更多的还是希望通过最少的输入进行最大化输出的使用者,说白了就是达不到创作门槛的 AI 使用者尝试通过 AI 补齐创作门槛。但不管前者还是后者,创作的内容远远没有商业公司多,甚至差上几个数量级。
不限定严格的所有人,大部分人类也是重利益的,商业公司则是始终重利益的,他们知道数以十计的专业生成内容甚至用户生产内容远没有数以万计的人工智能生成内容来得简单快捷,甚至成本几乎为零。
对于以 1000 成本生成的 1 个质量为 1000 的内容与以 10 成本生成的 1000 个质量为 1 的内容,商业公司以利益考虑必然会选择后者,毕竟针对热点随意生成一些内容经由自动化和 SEO 优化后获得的点击远比认真做的 PGC、UGC 获得的点击要多,获得变现也可以碾压它们。
在以前,互联网入口很大一部分是搜索引擎,所以用户会看见商业公司的内容农场和虚假宣传。 互联网入口被分到了各个应用后,而在 AI 爆发之前,应用内容大部分为 UGC,由于推广门槛提高,除了广告多点,氛围也大多还行。
而现在,互联网上的内容根本就没人样,搜索引擎上到处都是内容农场。打开购物 app,评价全是刷的,图片全是 p 的。打开社交 app,到处都是 AI 味的推广,起号、对立的帖子数不胜数。假新闻满天飞,标题不说事,内容全靠扯,开局一张图,现在图都是生成的。
另一个严重的问题是:由于 AIGC 增多,而目前的 AI 远没达到完美的程度,所以互联网内容整体的质量和用户体验都是下降的。
与此同时,AIGC 还在阻碍 AI 今后的发展和自底向上人工智能的成长。 既然 AI 的输入之一是「大量样本」,并且内置于模型中,那么 AI 想要发展,就必然需要持续的优质样本。 那么这些样本的源头除了各个企业推出的数据集,就只有互联网了,更别说大部分数据集也是从互联网采集的,失去了 PGC ,各企业几乎所有数据的最终来源必然也是互联网本身。 而互联网内容质量的下降必然意味着在新算法/模型/体系提出之前,从长远的角度来看目前的 AI 发展会有一个峰值拐点,就是不知道这个拐点什么时候出现。
虽然各方平台也似乎多少能预见一些问题,开始对 AIGC 进行标注,但对于海量的 AIGC,和对不道德收益的诱惑,这仅仅是杯水车薪,AIGC 整体的低质,也导致「AIGC (Artificial Intelligence Generated Content / 人工智能生成内容)」正在变成「AIGC (Artificial Intelligence Garbage Content / 人工智能垃圾内容)」。
碎碎念
技术无罪,目前的 AI 若能正确使用——特指经由 AI 生成后经人工修正与查证再进行内容的发布,确实能如所宣称的是生产力的重大进步,可是由于利益因素,不管是公司还是个人,大部分都是直接将 AIGC 当作是自己的劳动成果。人类本身,就是整条生产线上的重大缺陷。
新闻平台上是震惊标题,内容是不能找到来源的无关「新闻」;
绘图平台上是手部缺陷的 AIGC,作者声称这是自己「创作」;
视频平台上是依靠标题和封面引流实际则是逻辑狗屁不通「作品」;
音乐平台也是以 AI 为噱头的「血汗结晶」;
游戏厂商推出使用 AI 绘图、AI 配音、AI 配乐、AI 脚本、AI 开发的 5A「游戏」;
将「コンティニュー / 继续」译为「孔帝纽」的「中文版」,
不经人工修正的 AIGC 不光是对行业质量的拉低,还是对认真的行业从业者的侮辱。
更搞笑的是某些公司推出 AI 论文生成工具,论文要是能生成还搞什么教育,科技全让 AI 发展得了。
如果说内容的缺陷最终可以靠人工弥补,那么 AI 犯罪则是一个潜在的重大问题。 文字信息可由 AI 伪造,图片可由 AI 伪造,视频可由 AI 伪造,声音也可由 AI 伪造。 单一个体一旦在互联网留下一定信息样本,就能生成一个赛博克隆,这个赛博克隆的用法可太多了,相信公安国安部门已经见过不少案例了。
最后,本文并不是技术恐惧。猫猫对人工智能的健康发展全力支持,使用新技术提高生产力是值得推广之事,也是不可阻挡之事。所反对的是部分用户的思想观念、使用方式以及所造成的后果。
希望内容生产者通过了解或部分了解新技术的原理之后再「正确」使用新技术,希望消费者能够辨别通过破坏行业长远潜能进行获利的「作品」。
胡言乱语
人类进步的动力来自涩涩,而不是怠惰。