数学家设计出机器学习永远「学不会」的问题
majer @ 2019.01.17 , 11:00 上午并非一切都是可知的。在一个人工智能和机器学习看起来无所不能的世界里,这似乎就是个异端邪说——但这是真的。
至少,根据数学家和人工智能研究团队的一项最新的科研成果,情况就是这样:他们发现,尽管机器学习的能力看似无穷无尽,但即使是最聪明的算法也受到了数学的制约。
“数学带来的优势有时会成为弱点……简而言之……并非一切都是可证明的。”第一作者、滑铁卢大学的计算机科学家Shai Ben-David领导的团队在论文中写道。
“我们在这里表明,机器学习也无法摆脱这一命运。”
伟大的奥地利数学家库尔特·哥德尔(Kurt Gödel)在20世纪30年代发展了所谓的不完备性定理——在某些体系中,存在着我们永远无法搞清真假的事实。
现在,Ben-David表明,机器学习受到同样的限制。
在他们的论证中,机器实际学习的能力——称为可学习性——可能受到数学体系的不完备性限制。换句话说,我们可以丢给AI一个“有意义”的问题——算法无论如何也无法得到答案。*很难用简短的文字解释“有意义”,它本身需要可操作性和明确性;反过来举出几个“无意义”的问题,自行体会一下:我是谁?为什么有人喜欢吃甜粽子?or世界上下一个瞬间死去的人是谁?or灵魂存在吗?……
以色列理工学院的高级研究员兼数学家Amir Yehudayoff向Nature解释说:“对我们来说,真是一个惊喜。”
在他们的研究中 ,使用了“估计最大值”(EMX)的机器学习问题,实例是:网站试图向最活跃的用户推送有针对性的广告——尽管负责的算法事先无法知道访问者的真实偏好。
在这种情况下,机器学习所用到的手段——被称为概率近似正确学习(又称PAC学习),就会牵扯出类似于连续统假设的数学悖论。
连续统假设在常规公理体系中属于无法被证明或证否的命题,并且考虑到EMX的条件,机器学习算法可能也会陷入类似的困境。
“[研究人员]发现机器学习问题,其命运取决于连续统假设,这使其解决方案永远无法实现,”并未参与研究、伊利诺伊大学芝加哥分校的数学家和计算机科学家Lev Reyzin在给Nature的评论中写道。
当然,对给定不同参数的EMX问题,结果也不尽相同。但在学术上,新论文提醒人们,计算机科学无法回避深奥的数学基础问题。
“机器学习作为一门数学学科已经足够成熟,现在又渗入到诸多数学子学科中,”Reyzin写道,算法甚至开始论证人类自身都无法证明的问题。
“也许这样的结果能为机器学习领域带来必要的谦逊之情,使其更加健康的发展,即使机器学习算法正在彻底改变世界。”
该研究结果发表在Nature Machine Intelligence上。
本文译自 sciencealert,由 majer 编辑发布。
PREV : 男女痛感大不同
NEXT : 1000条冷知识(15)