跳至主要内容

我三年前写的这篇小说,预言了ChatGPT


去年年底Chatgpt发布后立即产生轰动,引发了新一波人工智能热潮(我们公司的市场部门也在宣传词里大量加入了AI字样,纯属蹭热点,呵呵)。我身边连电脑都用不顺的人,居然也都讨论起AI来了。其实早在三年前,我就在一篇小说里预言了与ChatGPT相似的产品!

我的小说《告别:瘟疫时期的爱情故事》最早于2020年6月发表在我的博客,后来也曾在Matters上连载。这篇小说前半部分是以Covid为背景的写实风格爱情故事,后半部分则加入了科幻元素。男主角为了追念染病去世的女友,创造了一个女友人格的AI(原文请见这里):

我的想法估计听起来荒诞不经,像是天方夜谭:我想要制造出一个和雯雯一样的人工智能。

在嘲笑我之前,请听我做一番解释。我无意也没有能力制造出一个科学怪人来。到底能不能制造出能像人类一样思考的人工智能,这仍旧是一个未解难题。我的想法其实很简单,就是想写出一个计算机程序合成雯雯的样貌和声音。我想再见雯雯一次,哪怕是虚拟的也好。依靠现在的人工智能技术,这个目标完全能够实现。我不能继续沉沦,再这样无所事事。无论想法多荒唐,这至少能让我忙起来。我在网上租用了昂贵的服务器,全身心投入到这个项目中。

一开始他只是想合成女友的声音和外形:

我从相对简单的任务着手:合成雯雯的声音。过去一年里雯雯给我发了很多视频、音频,我有足够多的声音素材。想要重现每一个字的读音并不困难,可以说只要截取雯雯的发音就可以了。但是这样的声音必然是机械化的,冰冷生硬,没有人类的感情。当人讲话时,词语和句子间会有间隔,音调会有高低起伏,速度时快时慢,此外还有个人化的发音习惯、口音特点。我用了现成的人工智能朗读引擎,把雯雯的声音素材导入进去,再一点点地调整模型参数。这一步进展的很顺利,很快我就听到与雯雯十分相似的声音了。

接下来是模拟雯雯的外形。我从图像专业公司购买了人体数字模型,这个模型可以做动作、做表情,模拟讲话时的口型,等等。当然这个模型是计算机动画,与雯雯长得一点都不像。我的下一步就是给模型换脸。这一技术非常热门,在网上有数不清的技术资源。我使用了深度学习技术,用雯雯的照片和视频来训练一个人工神经网络,把我电脑中的模型变成雯雯的样子。

后来他开始研究怎么让AI实现真正的对话:

到了第二天,我开始思考一个问题,怎样才能让程序自动地跟我聊天呢?

自然语言处理,也就是让人工智能理解人类的语言,是人工智能领域的一门显学。对于人工智能来说,理解单个词或者单个句子并不十分困难。可是人类的语言是精妙的,经常出现内容省略,每一句话都要在上下文语境中理解。比如说,我先讲了「我母亲下星期过生日」,之后又问「买什么礼物好」,那么人工智能需要明白我的意思是「我母亲过生日,我要给她买什么礼物」。这样的上下文语境可能会有很长的时间跨度,比如前两天说的笑话,甚至于去年一起看过的电影,在对话中我一提起这些话题来,对方就应该明白我的意思,而不需要我长篇大论把整个笑话、整部电影情节复述一遍。人类对话中还会大量使用文化典故,比如形容一个人是「猪八戒」「诸葛亮」,人工智能要准确地理解其中的隐含意义,而不是误以为在谈论小说和历史中的人物。家人、朋友、情侣之间会有更私人的谈话方式,有小圈子里的、只属于彼此的称呼、笑话、隐喻,这些就更没有规律、更加复杂了。而且人类讲话是连贯的,一句接着一句,这就要求人工智能要及时响应,运行速度要快,而不是每次讲话都停顿好久。

了解ChatGPT的朋友应该立即就会明白,这段内容讲的是Prompt,也就是自然语言提示词,AI通过提示词来生成对话。

小说中接下来还写到:

我安装好人工智能语言会话模型,再把我和雯雯之间所有的聊天记录全部导入进去。随着训练时长的增加,这个模型的对话能力越来越强,逐渐能够流畅地与我交流。然后我又补充了聊天记录之外的、自己与雯雯相处时两人共同的回忆,只要是我能想起来的,一处细节也不放过。就这样,人工智能生成的会话越来越像雯雯了。

这个就是模型训练的过程,与ChatGPT无异。区别在于,ChatGPT是通用模型,用网上海量数据训练。而小说中只是用私人数据训练,毕竟个人开发者不可能有大公司的人力物力。

最后更进一步,还添加了更多的交互方式:

最后一步是为人工智能增添额外的部件:语音识别、人像识别、表情识别等等。这些都是通用的技术,只需要一点点调整就能用了。这样一来人工智能就能通过摄像头看到我,认出我,直接通过语音与我对话、无需文字输入。

我相信随着技术发展,小说中写到的有人格的AI会成为现实。目前ChatGPT只是用来文字聊天,也没有性格可言。但是完全可以将ChatGPT的技术与虚拟形象相结合,并且添加独有的语言特色,让每个用户都有自己专属的AI。不知道大家知不知道恋爱模拟游戏LovePlus(爱相随),如果游戏中的角色有了ChatGPT一样的对话能力,无数宅男都会为之疯狂吧?更加实用的想法是虚拟秘书,辅助日常工作,还有同声传译等等。现如今Google、微软等大公司纷纷入场,数年之内必然会有面向大众的AI产品,绝对会成为新一波产业革命。

当然我要承认,自己的预言并没有那么了不起。虽然ChatGPT对外行人来说很新鲜,但是相关的机器学习理论技术早就有了。ChatGPT的成功,一方面要佩服开发者的技术能力,另一方面也是他们实在太有钱了。ChatGPT用了三万多片高性能显卡,初始投资就要8亿美元,训练一次的费用高达千万,每天的电费都要五万美元。我这样的普通人,也就只能在小说里幻想一下了!

眼见着自己的幻想成为现实,不得不感慨时代发展迅速。AI会给人类社会带来怎样的影响,现在还很难评估。有兴趣的朋友不妨读一读我的小说,没准能为您带来一些启发。

评论

此博客中的热门博文

读冰临神下的《死人经》

武侠小说衰落已久,老一辈武侠名家「金古梁温黄」中四位已经作古,硕果仅存的温瑞安也好多年没出过新书了。名噪一时的「大陆新武侠」同样归于平淡,成了明日黄花。在一片萧条的环境下,每当在网上聊起武侠,我总能看到有人提起《死人经》,称赞其为近年来罕有的武侠佳作。我起了好奇心,花大概一周的时间读完了《死人经》的第一卷《杀手少年》,聊聊想法。 这本书开头部分写的一般,主角惨遭灭门报仇雪恨这种故事实在太老套了。而且文字很平淡,人物对话写的尤其不好。写对话很考验作者的笔力,说什么话、怎么说话是塑造人物的重要手段之一。《死人经》里人物讲话差不多都是一个调调,而且偏书面语,给人感觉有点不自然。戏剧性强烈的地方、角色们互撂狠话时还成,日常对话就有些别扭。 很快地,这本书出色的情节就挽回文字上的那些小缺点了。主角被强盗掳走、卖到仇家金鹏堡里当奴隶,这时好戏才正式上演。主角在石堡里命悬一线,时刻处于危机之中,又处心积虑报仇,这段无论情节、风格、手法,明显是借鉴古龙的《白玉老虎》,专门培养杀手的金鹏堡几乎就是唐门的翻版。如同《白玉老虎》一样,《死人经》成功地渲染出压抑紧张的氛围,让读者时刻为着主角的将来提心吊胆。复仇故事讲究先抑后扬,主角前期越惨,后期复仇才越痛快。主角每天扛死尸,受虐待,自身无比弱小,处在石堡最底层,在绝望中拼命挣扎。主角陷害遥奴走火入魔、暗杀认识自己真实身份的杀手,随后被雪娘挟持,被设下三年内走火入魔的死亡期限,这一系列情节环环相扣,悬念迭起,写的特别好。读到这里,很惊讶于作者情节编排的老练,逐日连载的网络小说能维持这样稳定的质量真的很难得。雪娘教主角武功,让他和石堡千金上官如比武,这段明显是化用自《鹿鼎记》。主角落悬崖、奇遇大鹏鸟获得武功秘籍这段勉强算是俗而有力吧,武侠小说的主人公总是难逃落悬崖的命运。之后盗宝这段把之前的种种戏剧冲突一起引爆,处理的干净利落。 主角当上杀手学徒之后,故事陡然一变。虽说主角仍处在危机之中,却由被动转向主动。之前是受命运摆布,想放弃复仇也逃不掉,这时却开始主动出击了。主角从当初只有一腔愤恨的少年彻底转变成了冷静、聪明、阴狠毒辣的杀手。杀手学徒乱战这段写的很好,一群十余岁的少年间的血腥杀戮让人想到了《蝇王》。同时荷女这个角色开始登上前台,从配角变为两大女主角之一。荷女冷静沉着,办事滴水不漏,对主角衷心耿耿,几乎就是主角的女版化身。两人合练死人经

黑暗的宇宙:读刘慈欣的《三体全集》

第一次读《三体》已经是十年前的事了。那时《三体》在科幻圈子里已经非常出名了,不过还没有进入大众视野。我读完第一本后印象一般,就没继续读下去。转眼十年过去,《三体》的影响力持续提升,俨然成为新世纪头二十年里最成功的中文通俗小说。不仅国内互联网总提到《三体》,身边的外国朋友中也不乏《三体》书迷,搞得没读完全书的我似乎成了异类。为了搞懂「黑暗森林」「降维打击」,我终于花了一个星期,把三部曲从头到尾看完了。 三体 简单来说,三体系列讲的是地球与外星之间的星际战争。这题材算得上复古,《三体》的内容与风格都让人联想到上世纪四五十年代的经典科幻小说。 书中的外星人来自太阳系四光年之外的三体世界,这里有三个「太阳」。三个天体在万有引力作用下的运动规律是著名的三体问题,也正是这套书标题的由来。现在已知三体问题是无法精确求解的,三个太阳的运行轨迹没有规律,这给三体人所在的行星造成极其严酷的生存环境。过于靠近或过于远离太阳都是致命的,三体文明被毁灭了无数次,还有彻底坠入太阳的潜在危险。小说中借由电子游戏的形式,模拟了三体文明反复诞生与毁灭的过程。虽然听上去很复杂,其实不过是在说:外星人处于水深火热中,有强烈的移民外星的意愿。把三体问题换成其它危机,比如太阳衰败,这个故事同样成立。直到有一天,三体星接收到了地球发来的信号,发现地球是宜居星球,决定侵略地球。 考虑到三体人处于生死存亡之际,而且拥有远超地球文明的太空科技,我很奇怪为什么他们不主动寻找移民星球,而是被动地监听信号。能不能收到外星信号纯属偶然,而且按照书中的宇宙观,这信号很可能具有欺骗性,回复信号要冒非常大的风险。太阳系是距离三体世界最近的恒星系统,没理由不主动勘测。对比一下,离太阳系最近的半人马座阿尔发星,也就是小说中三体世界的原型,已经在科幻作品中被觊觎无数次了,三体人没理由从未关心过自己的邻居。 以三体人的科技水平,需要450年才能抵达地球。经过漫长的450年,没准到时候地球科技已经超过三体人了。为了解决这一问题,三体人制造了「智子」来封锁地球科技发展。 智子是小说第一部中最重要、也是最精彩的科幻设定,也为后来两部埋下伏笔。智子是一颗高维空间的质子,在二维空间展开后雕刻成智能计算机。按照书中的说法,从高维降到低维会「变大」(不妨想象一瓶墨水,变成二维——涂在纸上——会拥有庞大的面积)。一颗质子从九维降到二维,其面积足以包覆整

破碎迷幻的天才之作:读胡安·鲁尔福的《佩德罗·巴拉莫》

  提起外国文学,国内读者比较熟悉的主要是英法德美俄这些大国,还有邻近的日本。其它国家也不乏璀璨名著,只是很少受人关注。比如这本《佩德罗·巴拉莫》是墨西哥最著名的现代小说,可在国内恐怕没几个人听说过。我对墨西哥文化了解极少,要不是听说博尔赫斯和加西亚·马尔克斯对此书极度推崇,大概率也会错过这本书。 在《私人藏书:序言集》里,博尔赫斯称「《佩德罗·巴拉莫》是西班牙语各国文学中最优秀的小说之一,也是所有文学中最优秀的小说之一。」而马尔克斯更夸张,在《对胡安·鲁尔福的简短追忆》中他写道:「我能够背诵全书,且能倒背,不出大错。并且我还能说出每个故事在我读的那本书的哪一页上,没有一个人物的任何特点我不熟悉。」所以我是抱着非常高的期待来读这本书的。读完确实感觉不同凡响,堪称天才之作。 《佩德罗·巴拉莫》非常短,还不到十万字,份量却特别足,第一次读根本消化不过来。我想很多读者读完这本书后的第一反应就是从头再读一遍。 这本小说的故事情节很普通,主要讲一个名叫佩德罗·巴拉莫的地主,欺男霸女无恶不作,搞得民不聊生,村民死的死逃的逃,最后整个村庄衰败成一座死城。只要了解过一点儿拉美历史或小说,对这类暴权故事不会感到陌生。《佩德罗·巴拉莫》的出色之处不在于故事情节,而在于极具开创性的写作手法。 一般来说,一部小说会有统一的叙事视角,比如第一人称、第三人称,随之会有一个或数个推进叙事的线索人物。虽然倒叙、插叙的手法很常见,但绝大多数小说还是按照时间先后顺序来叙述的。而这本书将叙事视角、人物、时间、空间完全打乱了,感觉像是电影中的蒙太奇。 在小说一开始,「我」接受母亲的临终嘱托,回到家乡科马拉去寻找自己未曾谋面的父亲佩德罗·巴拉莫。可是读着读着,内容突然跳到一个男孩子身上,他正在想念着一个叫苏萨娜的女孩。再读几页我们会发现,这个男孩就是童年时代的佩德罗·巴拉莫。接下来笔锋一转,重新回到「我」这边,「我」在和借宿人家的房东爱杜薇海斯太太聊天,她滔滔不绝、颠三倒四地讲述着陈年往事,小说内容又变成了由她来叙述。整本书都是这样写成的,每隔几页就变成了一段貌似毫不相干的内容,仔细琢磨一下又相互关联。而且这本书不分章节,也不标注叙事者是谁,读的时候一定要全神贯注,否则一不小心就搞糊涂了。随着对人物和事件的熟悉,越读到后面故事会越清晰,慢慢理清人物关系和时空顺序,但是第一次读难免会错过或是混淆一些细节,所以