阿里达摩院金榕：从技能到迷信，中国AI向那边去？

2022-11-17 09:37:32 作者：最美不过遇见你

导读：阿里达摩院金榕：从技术到科学，中国AI向何处去？,机器之心专栏作者：金榕（阿里巴巴达摩院副院长、原密歇根州立大学终身教授）如果从达特茅斯会议起算，AI 已经走过 65 年历程，尤其是近些...

呆板之心专栏

作者：金榕（阿里巴巴达摩院副院长、原密歇根州立大学终身传授）

假如从达特茅斯集会起算，AI 已经走过 65 年进程，尤其是近些年深度进修鼓起后，AI 迎来了亘古未有的繁荣。不外，近来两年中国 AI 高潮彷佛有所回落，在理论突破和落地应用上都碰到了挑衅，外界不乏批判质疑的声音，乃至连一些 AI 从业者也有些沮丧。

从 90 年月到美国卡耐基梅隆大学读博开始，我有幸成为一名 AI 研究者，见证了这个范畴的一些升沉。通过这篇文章，我将试图通过小我私家视角回忆 AI 的进展，审视我们当下所处的汗青阶段，以及探究 AI 的将来本相在那边。

本文的部门看法如下：

AI 期间序幕刚拉开，AI 现在还处于低级阶段，如同法拉第方才发觉了交换电，还未能从技能上升为科学。
以深度进修为代表的 AI 研究这几年取得了诸多令人赞美的前进，但部门也是运气的效果，其真正道理迄今无人知晓。
在碰到瓶颈后，深度进修有三个大概突破偏向：深度进修的基础了解、自监视进修和小样本进修、知识与数据的有机融合。
AI 在当下最大的时机：用 AI 办理科学紧张困难（AI for Science）。

一、AI 的汗青阶段：手事情坊

固然有人把当下归为第三波乃至是第四波 AI 海潮，乐观地以为 AI 期间已经到来，但我的见解要慎重一些：AI 无疑具有庞大潜力，但就现在我们的本领，AI 尚处于比力低级的阶段，是技能而非科学。这不但是中国 AI 的题目，也是环球 AI 配合面对的困难。

这几年深度进修的快速进展，极大转变了 AI 行业的面目，让 AI 成为民众平常利用的技能，乃至还显现了一些令民众惊异的 AI 应用案例，让人误认为科幻影戏马上酿成实际。但现实上，技能进展必要恒久积存，现在只是 AI 的低级阶段，AI 期间才刚开始。

假如将 AI 期间和电气期间类比，今日我们的 AI 技能照旧法拉第期间的电。法拉第通过发觉电磁感到征象，从而研制出人类第一台交换电发电机原型，不行谓不巨大。法拉第这批先行者，实践履历富厚，通过大量观看和重复试验，手工做出了种种新产物，但他们只是拉开了电气期间的序幕。电气期间的真正直进展，很大水平上受益于电磁场理论的提出。麦克斯维尔把实践的履历酿成科学的理论，提出和证明白具有跨期间意义的麦克斯维尔方程。

假如人们对电磁的了解停顿在法拉第的条理，电气革命是不行能产生的。试想一下，假如起风下雨打雷乃至连温度改变都市导致断电，电怎么大概酿成一个普惠性的产物，怎么大概酿成社会底子办法？又怎么大概显现种种百般的电气产物、电子产物、通讯产物，彻底转变我们的生存方法？

这也是 AI 现在面对的题目，范围于特定的场景、特定的数据。AI 模子一旦走出试验室，受到实际天下的滋扰和挑衅就时常失效，鲁棒性不敷；一旦换一个场景，我们就必要重新深度定制算法举行适配，费时费劲，难以范围化推广，泛化本领较为有限。

这是由于今日的 AI 很大水平上是基于履历。AI 工程师就像当年的法拉第，可以或许做出一些 AI 产物，但都是知其然，不知其以是然，还未能把握此中的焦点道理。

那为何 AI 迄今未能成为一门科学？

答案是，技能进展之迟钝远超我们的想象。回忆 90 年月至今这二十多年来，我们看到的更多是 AI 应用工程上的快速前进，焦点技能和焦点题目的突破相对有限。一些技能看起来是这几年鼓起的，现实上早已存在。

以主动驾驶为例，美国卡耐基梅隆大学的研究职员举行的 Alvinn 项目，在 80 年月末已经开始用神经网络来实现主动驾驶，1995 年景功自东向西穿越美国，历时 7 天，行驶近 3000 英里。鄙人棋方面，1992 年 IBM 研究职员开辟的 TD-Gammon，和 AlphaZero 相似，可以或许自我进修和强化，到达了双陆棋范畴的大家程度。

1995 年穿越美国项目开始之前的团队合照。

不外，因为数据和算力的限定，这些研究只是点状产生，没有形陈规模，天然也没有引起大众的遍及商议。今日因为贸易的遍及、算力的加强、数据的便利猎取、应用门槛的低落，AI 开始触手可及。

但焦点头脑并没有基础性的改变。我们都是试图用有限样原来实现函数类似从而形貌这个天下，有一个 input，再有一个 output，我们把 AI 的进修历程想象成一个函数的类似历程，包罗我们的整个算法及练习历程，如梯度降落、梯度回传等。

同样的，焦点题目也没有得到有用办理。90 年月学界就在问的焦点题目，迄今都未得到答复，他们都和神经网络、深度进修紧密相干。好比非凸函数的优化题目，它得到的解很大概是局部最优解，并非全局最优，练习时大概都无法收敛，有限数据还会带来泛化不敷的题目。我们会不会被这个解带偏了，轻忽了更多的大概性？

二、深度进修：大繁荣后遭遇进展瓶颈

毋庸讳言，以深度进修为代表的 AI 研究这几年取得了诸多令人赞美的前进，好比在庞大网络的练习方面，孕育发生了两个格外乐成的网络布局，CNN 和 transformer。基于深度进修，AI 研究者在语音、语义、视觉等各个范畴都实现了快速的进展，办理了诸多实际困难，实现了庞大的社会代价。

但回过头来看深度进修的进展，不得不感叹 AI 从业者非常荣幸。

起首是随机梯度降落（SGD），极大推动了深度进修的进展。随机梯度降落实在是一个很简洁的要领，具有较大范围性，在优化内里属于收敛较慢的要领，但它偏偏在深度网络中体现很好，并且照旧特别的好。为什么会这么好？迄今研究者都没有完善的答案。雷同如许难以了解的好运气还包罗残差网络、知识蒸馏、Batch Normalization、Warmup、Label Smoothing、Gradient Clip、Layer Scaling… 尤其是有些还具有超强的泛化本领，能用在多个场景中。

再者，在呆板进修里，研究者一向在鉴戒过拟合（overfitting）的题目。当参数格外多时，一条曲线可以或许把全部的点都拟合得格外好，它也许率存在题目，但在深度进修内里这彷佛不再成为一个题目… 固然有许多研究者对此举行了探究，但现在另有没有明白答案。越发令人惊奇的是，我们纵然给数据一个随机的标签，它也可以完善拟合（请见下图赤色曲线），最终得出拟合偏差为 0。假如根据尺度理论来说，这意味着这个模子没有任何毛病（bias），能帮我们解说任何效果。请想想看，任何工具都能解说的模子，真的可靠吗，包治百病的良药可信吗？

Understanding deep learning requires rethinking generalization. ICLR, 2017.

说到这里，让我们团体回忆下呆板进修的进展进程，才气更好了解当下的深度进修。

呆板进修有几波进展海潮，在上世纪 80 年月到 90 年月，起首是基于规章（rule based）。从 90 年月到 2000 年月，以神经网络为主，家人们发觉神经网络可以做一些不错的事变，但是它有很多底子的题目没答复。以是 2000 年月今后，有一批人实验去办理这些底子题目，最著名的叫 SVM（support vector machine），一批数学配景身世的研究者会合去了解呆板进修的历程，进修最底子的数学题目, 怎样更好实现函数的类似，怎样包管快速收敛，怎样包管它的泛化性？

当时候，研究者非常夸大了解，好的效果应该是来自于我们对它的深刻了解。研究者会非常在乎有没有好的理论底子，由于要对算法做好的阐发，必要先对泛函阐发、优化理论有深刻的了解，接着还要再做泛化理论… 也许这几项都得非常好了，才大概在呆板进修范畴有发言权，不然连文章都看不懂。假如研究者本身要做一个大范围试验体系，格外是漫衍式的，还必要有工程的富厚履历，不然基础做不了，当时候没有太多现成的工具，更多只是理论，多数工程实现必要靠本身去跑。

但是深度进修期间，有人做出了非常好的框架，方便了全部的研究者，低落了门槛，这真黑白常了不得的事变，促进了行业的快速进展。今日去做深度进修，有个好想法就可以干，只要写上几十行、乃至十几行代码就可以跑起来。成千上万人在试验种种百般的新项目，验证种种百般新想法，每每会冒出来非常让人惊喜的效果。

但我们大概必要意识到，时至本日，深度进修已碰到了很大的瓶颈。那些曾经关心深度进修乐成的好运气，那些无法了解的黑盒效应，今日已成为它进一步进展的桎梏。

三、下一代 AI 的三个大概偏向

AI 的将来本相在那边？下一代 AI 将是什么？现在很难给出明白答案，但我以为，至少有三个偏向值得重点探究和突破。

第一个偏向是追求对深度进修的基础了解，排除现在的黑盒状态，只有如许 AI 才有大概成为一门科学。详细来说，应该包罗对以下要害题目的突破：

对基于 DNN 函数空间的更全面描画；
对 SGD（或更广义的一阶优化算法）的了解；
重新思量泛化理论的底子。

第二个偏向是知识和数据的有机融合。

人类在做大量决定时，不但利用数据，并且大量利用知识。假如我们的 AI 可以或许把知识布局有机融入，成为紧张构成部门，AI 势必有突破性的进展。研究者已经在做知识图谱等事情，但必要进一步办理知识和数据的有机联合，探究出可用的框架。之前曾有些创新性的实验，好比 Markov Logic，便是把规律和底子理论联合起来，形成了一些有味的布局。

第三个紧张偏向是自监视进修和小样本进修。

我固然列将这个列在第三，但倒是现在值得重点推进的偏向，它可以补充 AI 和人类智能之间的差距。

今日我们每每听说 AI 在一些本领上可以逾越人类，好比语音辨认、图像辨认，近来达摩院 AliceMind 在视觉问答上的得分也初次凌驾人类，但这并不料味着 AI 比人类更智能。谷歌 2019 年有篇论文 on the Measure of intelligence 非常有洞察力，焦点看法是说，真正的智能不但要具有超群的技能，更紧张的是可否快速进修、快速顺应大概快速通用？

根据这个看法，现在 AI 是远不如人类的，固然它大概在一些方面的精度逾越人类，但可用范畴非常有限。这里的基础缘故原由在于：人类只必要很小的进修本钱就能快速到达效果，聪慧的人更是云云——这也是我以为现在 AI 和人类的重要区别之一。

有一个很简洁的究竟证明 AI 不如人类智能，以翻译为例，如今好的翻译模子至少要亿级的数据。假如一本书也许是十几万字，AI 也许要读上万本书。我们很难想象一小我私家为了进修一门说话必要读上万本书。

别的故意思的比拟是神经网络布局和人脑。现在 AI 非常夸大深度，神经网络每每几十层乃至上百层，但我们看人类，以视觉为例，视觉神经网络统共就四层，非常高效。并且人脑还非常低功耗，只有 20 瓦左右，但今日 GPU 根本都是数百瓦，差了一个数目级。闻名的 GPT-3 跑一次，碳排放相称于一架 747 飞机从美国东海岸到西海岸来回三次。再看信息编码，人脑因此时间序列来编，AI 是用张量和向量来表达。

或许有人说，AI 进展不必必然向人脑智能的偏向进展。我也以为这个看法不无原理，但在 AI 碰到瓶颈，也找不到其他参照物时，参考人脑智能大概会给我们一些开导。好比，拿人脑智能来做比拟，今日的深度神经网络是不是最公道的偏向？今日的编码方法是不是最公道的？这些都是我们今日 AI 的底子，但它们是好的底子吗？

应该说，以 GPT-3 为代表的大模子，大概也是深度进修的一个突破偏向，可以或许在必然水平上实现自进修。大模子有些像之前恶补了全部能看到的工具，遇到一个新场景，就不必要太多新数据。但这是一个最好的办理方法吗？我们现在还不知道。照旧以翻译为例，很难想象一小我私家必要装这么多工具才气把握一门外语。大模子如今都是百亿、千亿参数范围起步，没有一小我私家类会带着这么多数据。

以是，或许我们还必要陆续探究。

四、AI 的时机：AI for Science

说到这里，或许有些人会绝望。既然我们 AI 还未办理上面的三个困难，AI 还未成为科学，那 AI 另有什么代价？

技能自己就拥有庞大代价，像互联网就彻底重塑了我们的事情和生存。AI 作为一门技能，当下一个庞大的时机便是关心办理科学重点困难（AI for Science）。AlphaFold 已经给了我们一个很好的树模，AI 办理了生物学里困扰半个世纪的卵白质折叠困难。

我们要进修 AlphaFold，但没须要崇敬。AlphaFold 的树模意义在于，DeepMind 在选题上真黑白常锋利，他们选择了一些今日已经有充足的底子和数据积存、有大概突破的困难，然后设置装备摆设一个当下最好的团队，下刻意去霸占。

我们有大概制造比 AlphaFold 更紧张的结果，由于在天然科学范畴，有着许多紧张的 open questions，AI 另有更大的时机，可以去掘客新质料、发觉晶体布局，乃至去证明或发觉定理… AI 可颠覆传统的研究要领，乃至改写汗青。

好比如今一些物理学家正在思索，可否用 AI 重新发觉物理定律？已往数百年来，物理学定律的发觉都是依靠天才，爱因斯坦发觉了广义相对论和狭义相对论，海森堡、薛定谔等人开创了量子力学，这些都是小我私家举动。假如没有这些天才，许多范畴的进展会推迟几十年乃至上百年。但今日，随着数据越来越多，科学纪律越来越庞大，我们是不是可以寄托 AI 来推导出物理定律，而不再依靠一两个天才？

以量子力学为例，最焦点的是薛定谔方程，它是由天才物理学家推导出来的。但如今，已有物理学家通过网络到的大量数据，用 AI 主动推导出此中纪律，乃至还发觉了薛定谔方程的别的一个写法。这真的是一件非常了不得、有大概转变物理学乃至人类将来的事变。

我们正在推进的 AI EARTH 项目，是将 AI 引入景象范畴。气候预告已有上百年汗青，是一个非常庞大和庞大的科学题目，必要超等盘算机才气完成庞大盘算，不但斲丧大量资源并且还不是格外正确。我们今日是不是可以用 AI 来办理这个题目，让气候预告变得既高效又正确？假如能乐成，将是一件非常振作民气的事变。固然，这注定是一个非常困难的历程，必要时间和刻意。

五、AI 从业者：多一点兴趣，少一点功利

AI 确当下场合排场，是对我们全部 AI 研究者的磨练。不管是 AI 的底子理论突破，照旧 AI 去办理科学题目，都不是一挥而就的事变，必要研究者们既聪慧又坚决。假如不聪慧，不行能在不确定的将来捉住时机；假如不坚决，很大概就被吓倒了。

但更要害的是兴趣驱动，而不是长处驱动，不克不及急功近利，这些年深度进修的繁荣，使得中国大量人才和资金涌入 AI 范畴，快速推动了行业进展，但也催生了一些不确切际的期望。像 DeepMind 做了 AlphaGo 之后，中国一些人跟进复制，但对付焦点底子创新前进来说意义相对有限。

既然 AI 还不是一门科学，我们要去探究没人做过的事变，很有大概失败。这意味着我们一定有真正的兴趣，靠兴趣和洽奇心去驱动本身前行，才气扛过很多的失败。我们或许看到了 DeepMind 做成了 AlphaGo 和 AlphaFold 两个项目，但大概另有更多失败的、无人听闻的项目。

在兴趣驱动方面，外洋研究职员值得我们进修。像一些得到图灵奖的顶级科学家，每天还在一线做研究，亲身推导理论。还记得在 CMU 念书的时间，其时学校有多个图灵奖得主，他们通常根本都穿梭在种种 seminar（钻研班）。我了解此中一个叫 Manuel Blum，由于暗码学研究得到图灵奖，有一次我到场一个 seminar，发觉 Manuel Blum 没有座位，就坐在课堂的台阶上。他本身也不介怀坐那边，感兴趣就来了，没有座位就挤一挤。我曾有幸碰到过诺贝尔经济学奖得主托马斯 · 萨金特，作为经济学者，他早已功成名就，但他 60 岁开始进修广义相对论，70 岁开始进修深度进修，76 岁还和我们这些晚辈商议深度进修的希望… 或许这便是对研究的真正热爱吧。

说返国内，我们也不必妄自菲薄，中国 AI 在工程方面拥有环球领先的气力，认可 AI 还比力低级并非否认从业者的高兴，而是提示我们必要更坚决地恒久高兴，不必急于临时。电气期间假如没有法拉第这些先行者，没有一个又一个的点状发觉，不行能总结出理论，让人类迈入电气期间。

同样，AI 进展有赖于我们以庞大创新为向往，一每天高兴，不停实验新想法，然后才会有一些小突破。当一些聪慧的脑壳，可以或许将这些点状的突破团结起来，总结出来理论，AI 才会孕育发生庞大突破，终极上升为一门科学。

我们已经半只脚踏入 AI 期间的大门，这注定是一个比电气期间越发光辉、冲动民气的期间，但这统统的条件，都有赖于全部研究者的坚决不移的高兴。

相关推荐

精彩图集

图片推荐