从GPT3获得的启示：创造才是人类的未来-科技先锋的专栏

从GPT3获得的启示：创造才是人类的未来

2020-08-01 08:02:40栏目：默认栏目 IP属地：北京市

来源：王小凤人机与认知实验室

过去一周，一个新型AI震惊了硅谷圈。甚至有科技公司CEO说，他好像看到了未来的模样。这个新型AI就是GPT3。

GPT3是人工智能科技公司OpenAI开发的第三代语言模型。GPT3有着1750亿个参数量，而前一代GPT2也不过只有15亿个参数量，那么GPT3训练用到的参数是前者的117倍。阿尔法狗通过分析海量既有棋局的可能性，靠自我学习打败了人类。GPT3的学习模式和阿尔法狗相似，但是它能读懂“人话”还可以在一定程度上进行创造。

GPT3目前训练出的功能有：理解自然语言，并自动生成结果和对应代码；转换不同风格的语言；写段子、写小说、写论文；和人类聊天。其中，笔者认为GPT3较之前的AI有很大突破的是在很大程度上能理解自然语言。而笔者认为GPT3是否能真正写出具有价值的论文和文学作品还需要讨论，笔者接下来对此做出具体分析。

人类写论文的模式大概是大量输入-整合思考-输出的过程，而机器写论文的模式更像是海量输入-训练学习-输出的过程。当然人类和机器在写论文的过程中都存在不断反馈的过程，人还有特有的反思能力。对于输入，人和机器都可以输入论文，人还可以通过做实验输入实验数据等等。笔者认为接下来都可以训练人工智能做实验，这种人工智能的表现形式可以为软件或硬件的机器人。而输入论文的数量人是比不过机器的，人还存在一个遗忘的问题。人和人工智能相比，独有的是思考和反思的能力。如果在写论文过程中，思考和反思工作占少量的话，人类写的论文成果是比不过孜孜不倦“阅读”的机器。GPT3生成的论文依靠人类制造出来的确定的数据。因此，GPT3可以延展人类的思考，但其本身并没有实现真正的思考。

虽然GPT3不能独立写一份真正具有学术价值的论文，但是在实践中我们可以将人工智能作为工具辅助我们更好地写论文。面对卷帙浩繁的文献，人们阅读时不可能做到面面俱到，那么GPT3通过产出论文的形式就可以在一定程度上代替我们阅读那些没那么重要又读不完的书籍或者论文。而人们就可以从机器的延展（相当于读了海量文章产出的数据）中获得灵感或者拓展思路来写自己的论文，人们还可以根据这次的输出指导下次人工智能的输入，接下来重复以上过程（当然这个过程还可以优化）。

现在人工智能“写”出来的文学作品吸引人的更多是新奇，实际上仔细看一下就会发现乏善可陈，还存在情节生硬、套路重复等问题。人工智能写的作品还没有真正进入人们日常阅读的视野中，一个现实表现就是人类作者有大量粉丝，相比之下还没听说有人是某个人工智能的粉丝。以写诗为例，人工智能在诗歌这种有限规则下可以轻松写出大量看似诗歌的东西，但其文学价值一星半点，甚至其存不存在文学价值都要再做讨论。人工智能写的诗与诗人写的诗在很多方面是无法比拟的。一首经典的诗之所以能千古流传甚至吸引后人不断地鉴赏研究，不仅是文辞优美的短短几十字，还有诗人的生活背景以及这首诗的创作背景作为支撑。这样的诗有温度、有情感，容易引起人的共鸣和遐想。相较之下，人工智能写的诗就很单薄了，给人所见即所得的局促感。

笔者认为GPT3在技术上值得称赞的内容如下。GPT3在大量训练参数情况下还可以达到回归拟合及收敛。写文章可以在一定程度上做到逻辑分明、条理清晰的，要知道这一点人有时候都很难实现。在文章中可以产生机器自己的态度。后两点可能如OpenAI所说，GPT3已经成功地实现了某些“元学习”任务，比如不同语言之间的翻译，它可以自动抽象及提炼输入输出的内容。

将GPT3做为一个工具，未来的办公也会更加便捷。GPT3可以生成图表、法律条例转换器、图片文字识别等等，如果人们将这些功能应用到日常的办公场景中，将极大地节省人们的时间和精力。有人说未来是算法的天下，谁有最优的算法谁就主导未来。这句话同样可以用来讲人工智能。另外，将人工智能作为工具用好，信息可以在人、机、环境之间更畅通地流动，这会极大地提高人们的办公效率。

然而，GPT3也存在明显错误的地方。目前的GPT3会说出针对女性和少数族裔的歧视言论。这就是《追问人工智能：从剑桥到北京》一书中提到的人有“can”的问题，即能做还是不能做，而机器没有这个问题。笔者现在想到解决以上问题的做法只能是：从输入源头解决问题，训练AI与人类说话的模型时，输入没有歧视或者偏激的言论，输出也会是积极阳光的言论。GPT3还存在人工智能的通病：容易被反常识错误地引导。GPT3能回答出长颈鹿有2只眼睛，蜘蛛有八只眼。但是却会说：你的脚有两只眼，太阳有一只眼，一片草有一只眼。好像他不会意识到提问不对劲，只会老老实实地作答，而且也不会说“我不知道”。

除此之外，GPT3很难再往更智能的方向提升。OpenAI表示，它的表现或许已经接近现有NLP方法的上限。也有人表示“GPT3根本不聪明，它和一堆石头一样笨。不过这堆石头可以做很多我们认为需要聪明才能做成的事。未来的很多领域，假智能可能比真智能更占主导地位。”就算是这样，GPT3也是挺好用的。它落地的场非常多，比如估计股票盈亏趋势。

随着人工智能的崛起，很多人表达了对人工智能即将在工作岗位上取代自己的恐慌。归根到底机器还是擅长有限规则的事情，在未来基础的脑力工作不可避免将被人工智能替代。人要跑过人工智能要真正在思考上下功夫，因此，未来是创造的天下。在文学圈抄袭风气盛行，接下来作者也很难靠抄袭作品维持生计了，可以实现高度模仿的人工智能就完全可以取代他，相反原创作者永远不会被取代。在各行各业都会存在这种现象：重复的制造越来越廉价，创造越来越珍贵。人创造依赖灵感、顿悟、反思等等，这个过程是复杂艰辛的，但同时也只有不断思考，才能不被机器取代。因此，想法和灵感会随着时代的发展越来越宝贵，未来甚至可能会有关于灵感的知识产权。创造力和思考力也会成为人与人、人与机竞争的核心竞争力。

态势感知终究不是数学意义上的集合问题，原因在于其中的元素是非同构非同类的，而且会有相同元素（非互异性）产生出现。所以我们可称之为泛集合/伪集合问题。