去年年底Chatgpt发布后立即产生轰动,引发了新一波人工智能热潮(我们公司的市场部门也在宣传词里大量加入了AI字样,纯属蹭热点,呵呵)。我身边连电脑都用不顺的人,居然也都讨论起AI来了。其实早在三年前,我就在一篇小说里预言了与ChatGPT相似的产品!
我的小说《告别:瘟疫时期的爱情故事》最早于2020年6月发表在我的博客,后来也曾在Matters上连载。这篇小说前半部分是以Covid为背景的写实风格爱情故事,后半部分则加入了科幻元素。男主角为了追念染病去世的女友,创造了一个女友人格的AI(原文请见这里):
我的想法估计听起来荒诞不经,像是天方夜谭:我想要制造出一个和雯雯一样的人工智能。
在嘲笑我之前,请听我做一番解释。我无意也没有能力制造出一个科学怪人来。到底能不能制造出能像人类一样思考的人工智能,这仍旧是一个未解难题。我的想法其实很简单,就是想写出一个计算机程序合成雯雯的样貌和声音。我想再见雯雯一次,哪怕是虚拟的也好。依靠现在的人工智能技术,这个目标完全能够实现。我不能继续沉沦,再这样无所事事。无论想法多荒唐,这至少能让我忙起来。我在网上租用了昂贵的服务器,全身心投入到这个项目中。
一开始他只是想合成女友的声音和外形:
我从相对简单的任务着手:合成雯雯的声音。过去一年里雯雯给我发了很多视频、音频,我有足够多的声音素材。想要重现每一个字的读音并不困难,可以说只要截取雯雯的发音就可以了。但是这样的声音必然是机械化的,冰冷生硬,没有人类的感情。当人讲话时,词语和句子间会有间隔,音调会有高低起伏,速度时快时慢,此外还有个人化的发音习惯、口音特点。我用了现成的人工智能朗读引擎,把雯雯的声音素材导入进去,再一点点地调整模型参数。这一步进展的很顺利,很快我就听到与雯雯十分相似的声音了。
接下来是模拟雯雯的外形。我从图像专业公司购买了人体数字模型,这个模型可以做动作、做表情,模拟讲话时的口型,等等。当然这个模型是计算机动画,与雯雯长得一点都不像。我的下一步就是给模型换脸。这一技术非常热门,在网上有数不清的技术资源。我使用了深度学习技术,用雯雯的照片和视频来训练一个人工神经网络,把我电脑中的模型变成雯雯的样子。
后来他开始研究怎么让AI实现真正的对话:
到了第二天,我开始思考一个问题,怎样才能让程序自动地跟我聊天呢?
自然语言处理,也就是让人工智能理解人类的语言,是人工智能领域的一门显学。对于人工智能来说,理解单个词或者单个句子并不十分困难。可是人类的语言是精妙的,经常出现内容省略,每一句话都要在上下文语境中理解。比如说,我先讲了「我母亲下星期过生日」,之后又问「买什么礼物好」,那么人工智能需要明白我的意思是「我母亲过生日,我要给她买什么礼物」。这样的上下文语境可能会有很长的时间跨度,比如前两天说的笑话,甚至于去年一起看过的电影,在对话中我一提起这些话题来,对方就应该明白我的意思,而不需要我长篇大论把整个笑话、整部电影情节复述一遍。人类对话中还会大量使用文化典故,比如形容一个人是「猪八戒」「诸葛亮」,人工智能要准确地理解其中的隐含意义,而不是误以为在谈论小说和历史中的人物。家人、朋友、情侣之间会有更私人的谈话方式,有小圈子里的、只属于彼此的称呼、笑话、隐喻,这些就更没有规律、更加复杂了。而且人类讲话是连贯的,一句接着一句,这就要求人工智能要及时响应,运行速度要快,而不是每次讲话都停顿好久。
了解ChatGPT的朋友应该立即就会明白,这段内容讲的是Prompt,也就是自然语言提示词,AI通过提示词来生成对话。
小说中接下来还写到:
我安装好人工智能语言会话模型,再把我和雯雯之间所有的聊天记录全部导入进去。随着训练时长的增加,这个模型的对话能力越来越强,逐渐能够流畅地与我交流。然后我又补充了聊天记录之外的、自己与雯雯相处时两人共同的回忆,只要是我能想起来的,一处细节也不放过。就这样,人工智能生成的会话越来越像雯雯了。
这个就是模型训练的过程,与ChatGPT无异。区别在于,ChatGPT是通用模型,用网上海量数据训练。而小说中只是用私人数据训练,毕竟个人开发者不可能有大公司的人力物力。
最后更进一步,还添加了更多的交互方式:
最后一步是为人工智能增添额外的部件:语音识别、人像识别、表情识别等等。这些都是通用的技术,只需要一点点调整就能用了。这样一来人工智能就能通过摄像头看到我,认出我,直接通过语音与我对话、无需文字输入。
我相信随着技术发展,小说中写到的有人格的AI会成为现实。目前ChatGPT只是用来文字聊天,也没有性格可言。但是完全可以将ChatGPT的技术与虚拟形象相结合,并且添加独有的语言特色,让每个用户都有自己专属的AI。不知道大家知不知道恋爱模拟游戏LovePlus(爱相随),如果游戏中的角色有了ChatGPT一样的对话能力,无数宅男都会为之疯狂吧?更加实用的想法是虚拟秘书,辅助日常工作,还有同声传译等等。现如今Google、微软等大公司纷纷入场,数年之内必然会有面向大众的AI产品,绝对会成为新一波产业革命。
当然我要承认,自己的预言并没有那么了不起。虽然ChatGPT对外行人来说很新鲜,但是相关的机器学习理论技术早就有了。ChatGPT的成功,一方面要佩服开发者的技术能力,另一方面也是他们实在太有钱了。ChatGPT用了三万多片高性能显卡,初始投资就要8亿美元,训练一次的费用高达千万,每天的电费都要五万美元。我这样的普通人,也就只能在小说里幻想一下了!
眼见着自己的幻想成为现实,不得不感慨时代发展迅速。AI会给人类社会带来怎样的影响,现在还很难评估。有兴趣的朋友不妨读一读我的小说,没准能为您带来一些启发。
评论
发表评论