人工智能应用或将超越人类背后的深思

　　目前的AI技术已经有了长足的进步，神经元算法带来的改善不容小视。这些智能算法被应用在人脸识别系统、智能手机助理系统以及谷歌自动驾驶汽车中。所以，不只是小编，大多数人都认为能只注重让人工智能变得更强大，同样要保证其健康性和有益性：AI 必须遵从人类的意愿，不能胡作非为。

　　你为什么坚持人工智能研究必须以可证实对人类有益为前提?

　　我认为这是一个错误的问题，因为“人类价值”不能被“证实”。当然，人类价值本身也没有准确的定义，谁又知道人类为什么存在呢，可能这永远都是个迷。但考虑到我们人类的行为的意义，你会希望机器人至少能体会到其中的大部分精髓。人工智能可能不能完全理解我们的所作所为，但它们至少要和我们站在同一战线上，有着共同的基本原则。换句话说，它们不能成为我们的绊脚石甚至伤害我们。

　　你打算怎么实现这一点?

　　我现在正在这方面努力。目前我觉得一种名为“逆强化学习”的技术可以派上用场。平常的学习原理很简单，基于你的表现好坏，你会得到奖励或者惩罚，你的目标也很明确，就是想方设法获得尽可能多的奖励。Atari的游戏就是一个这样的典型的系统。逆向学习则是完全相反的'过程，你首先得到结果，然后你去思考什么样的行为最可能带来这样的结果。比如，你的机器人看到你早上艰难的从床上爬起来，冲了一杯咖啡，在一个嗡嗡作响的箱子里加热了点煎饼，而且在吃这些东西时你脸上浮现出了愉快的深情，那么它的人工智能就会告诉它：人早上喝咖啡是好的。

　　逆强化学习有着海量的资料可以使用，无论是书籍、电影还是网络，上面有着成千上万的人类活动记录，智能体可以从中感受到人类追求的基本价值和遵循的基本原则。

　　你的研究生涯主要关注了理解人工智能是什么，并认为这是实现人工智能的前提。那么你目前有什么收获呢?

　　在八十年代的研究中我开始思考理性决策的问题，后来我发现这是一个不可能完成的任务。如果你是理性的，你会判断自己目前的状况、可选择做法、每种做法带来的结果，但是又有哪一种做法是百分之百确保得到想要的结果的呢?世界上的事情变化多的让人眼花缭乱，没有那么多事是确定的。理性行为的定义就要求你的能力盖过整个未来和宇宙，换句话说，它在计算上是不可能的。所以我换了思路：那么人类是怎样做决定的呢?

　　人类怎么做的?

　　人类的大脑是一部效率惊人的概率运算机器。它的诀窍不是准确掌握每一条信息，而是对未来有一个大概的预测，并推测最可能带来好结果的做法。拿下棋来说，如果是理性决策的人，他就只会走那些可以将军的棋子。现实中没有人这么下棋，人们不会考虑十几步之后的事情，他们会考虑几个可能的走法，看哪一种最可能带来优势。人一生大约会做20万亿的动作，做一次演讲会有13亿个动作，理性决策要求你预测13亿个动作后的准确状况，这太疯狂了。我们从不会想“我要先迈左脚再动右脚，再打开门……”而是想“我该去做演讲了”。

　　你可以证明人工智能系统不会重写自己的软件，覆盖人类预设的目标吗?

　　计算机程序有着许多不确定性。阿兰图灵曾指出一个计算机程序不可能判断另一个程序是陷入了无限循环还是最终会产生输出。因此，如果你有一个可以重写自身的程序，你就有了一个矛盾，你不能证明这个新程序是否具有某些性质，这个程序也不知道自己写了一个什么。所以，问题不是“AI是否会重写自己”而是“AI写出的程序会对我们有怎样的影响”。我们目前对人工智能的设计能力所知甚少。

　　目前有什么很有前景的研究领域吗?

　　最近出现了一种叫做“网络现实系统”的研究领域，它们的研究内容是计算机与现实世界相联，让电脑通过网络控制机器手臂等等。许多电影中出现了人工智能掌控交通的剧情，也是该领域的研究内容。另外，空中交通管制也是其应用的一种。

【人工智能应用或将超越人类背后的深思】相关文章：

1.游戏公司热衷回归A股背后的深思

2.关于电影制作+保底发行背后的深思

3.COC走红的背后，游戏外有哪些值得深思的地方

4.word如何将快捷键应用于新的或已有的样式

上一篇：我们是否生活在计算机应用中的思考下一篇：从谷歌来看看量子计算机应用的历程