算法之国:中国人工智能的兴起
原版时辰 @ 2017.07.18 , 09:56 上午
credit: 译者画的
中国的大数据可能带领人类走向真正的人工智能。
今年年初,两片知秋之叶引起了全球对人工智能(AI)发展的关注。其一,前微软全球执行副总裁陆奇一月份表示,因自行车事故受伤离职休养后,他不会再回到世界上最大的软件公司,而是走马上任中国领先的搜索引擎某度的首席运营官。其二,一月晚些的时候,美国人工智能协会(AAAI)决定推迟举办年度会议,只因原计划位于一月的会议日期与中国农历新年相冲突。
最近的迹象显示,在一些AI领域上中国可能紧跟美国,甚至可能弯道超车。而这些AI领域被认为对未来发展至关重要,包括从语音助手到自动驾驶汽车。“百度是代表中国参与AI角逐的重要的选手”陆奇先生说,“我们有机会领导AI的未来。”
支持中国AI崛起的证据还有很多。白宫在2016年10月的一份报告中指出,在AI的分支“深度学习”上,中国发表的文章已经超过美国。据咨询公司普华永道预测,在2030年前,与AI相关的产业增长将将全球GDP增加16亿美元。据估计,近一半的收益将会累积在中国。在与AI有关的专利申请数量上,尽管美国在绝对数量上仍然领先,但中国研究人员提交的专利申请数量近几年增加了近200%(见下图)。
想要搞明白为什么中国玩AI玩得这么溜,需要考虑到AI领域所需的投入。计算能力和资本是最基本的两个条件,而中国在这两个条件上投入非常多。中国企业从某里巴巴和某企鹅等巨头到兴业数金公司和UCloud等初创公司都在迅速建立属于自己的数据中心。据咨询公司Gartner介绍,云计算市场近年来已经增长了30%以上,并将持续增长下去。而根据智库乌镇研究所(Wuzhen Institute)的统计,2012-2016年,中国的AI公司收到了26亿美元的资金。虽然这远低于美国同行收到的179亿美元,但金额总体增长很快。
然而,真正使中国成为AI应有之地的还有另外两个资源。一个是研究人才。微软的AI工作主管沈向洋(Harry Shum)说,除了强大的数学技能以外,中国还有在语言和翻译领域上的历史优势。负责领导某里巴巴150位数据科学家的闵万里说,寻找一流的AI专家在中国比在美国更难。但他预测,未来几年将会有所改变,因为大多数大学都推出了AI专业。据某种形式的估计,中国拥有世界五分之二以上训练有素的AI人才。
中国的第二个优势是数据,数据是AI最重要的组成成分。在过去,软件和数字产品大多数遵守代码中的规则,荣耀归于那些拥有最优秀程序员的国家。随着深度学习算法的出现,这些规则越来越多地基于从数据库中提取建立的模型。更多的可用数据,就意味着可以学习更多的算法和产出更智能的AI产品。
中国国家的规模和多样性为这一过程提供了强大的燃料。只要与日常生活相关的数据,全国近14亿人产生的数据几乎等量与其他所有国家数据之和。即使在处理罕见疾病的情况下,也有足够的样本来教授算法如何识别它。因为汉字打字比西方人的操作更为麻烦,人们往往比西方人更频繁地使用语音识别服务,所以互联网企业拥有有更多的语音片段来改善语音产品。
数据土豪
真正使中国能一骑绝尘甩开其他国家的关键点是其互联网用户数量:约7.3亿。几乎所有用户都手机在线,智能手机比台式电脑产生的数据更有价值,主要是因为它们包含各种传感器并随时携带在用户身边。例如,在大型沿海城市,用现金进行小额支付全部消失,人们使用手机上的某付宝和某信钱包这些服务来解决支付问题
中国用户似乎并不是非常关心隐私,这使得收集数据变得更容易。例如,这个席卷中国各大城市的共享单车服务不仅提供便宜的交通工具,而且是一种所谓的“数据狂欢”。当用户租用自行车时,有些公司会使用安装在自行车上的GPS设备来追踪租赁者的轨迹。(译者注:因为GPS定位非常耗电,所以共享单车只会定位停车点,据我所知摩拜是通过App开启手机GPS进行轨迹绘制的。)
年轻的中国人似乎特别热衷于AI为基础的服务,并且将他们自己数据交给这些服务区使用。微软发布的一个积极向上的聊天机器人小冰现在拥有1亿多中国用户。大多数用户在晚上11点到凌晨3点之间与小冰聊天,内容常常是他们白天遇到的问题。而小冰正在从用户互动中学习,变得越来越聪明。现在的小冰不再只是提供鸡汤和笑话,而是创作了第一首以“阳光失了玻璃窗”为题材写的诗集,这引起了中国文坛的激烈辩论,人工智能拼合文字写的诗能否被称为真正意义上的“诗歌”。
中国AI领域另一个重要支持力量就是政府。该领域在该国目前的五年计划中占有重要地位。同时技术公司正在与政府机构紧密合作:例如,百度被要求管理国家深度学习实验室。因此政府不太可能对AI公司进行过分严格的监管。该国有40多项含有细则的法律规定了如何在法律上保护个人资料,但这些法律很少得到执行。
企业家们正在充分利用中国的人才和数据优势发展自身。许多AI公司只在一两年前起步,但是与西方同行相比,这些公司的进展更为迅速。李开复解释说“中国AI创业公司经常迭代更新得更快。”他曾在2000年左右在谷歌子中国公司担任总裁,现在在风险投资公司创新工场当老板。
因此,中国已经拥有一群初生的AI牛犊,这些初创公司的总价值超过10亿美元。某条新闻是一家位于北京的新闻推荐引擎,利用使用读者兴趣和位置等信息进行机器学习来推荐的文章;它还使用人工智能过滤虚假信息(在中国主要是可疑的保健广告)。另一个AI创业公司某飞开发了一个语音助手可以将普通话翻译成各种外语,其中包括英语和德语,即便用户录入的是方言或录音混入了背景杂音都可顺利完成翻译。而旷视科技的脸部识别软件Face++几乎可以即时匹配不同人脸。
“天网”恢恢
在旷视科技总部,来访者被均视为识别对象。大厅内的摄像机取代了ID识别:公司员工不需要拿出工卡只需直接走过大厅就能识别身份。类似的设备位于办公室的各个地方,其反馈资料即使显示在屏幕墙上。当一张脸在屏幕墙上出现的时候,它立即被一个白色矩形包围,在旁显示有关该人的一些信息。而在该屏幕的右上角,用大写字母拼写“SKYNET”,这是终结者系列电影中旨在消灭人类的AI系统“天网”的名称。该公司已经与某付宝和迪迪(一家旅行公司)合作核查新用户的身份(将新用户的面孔与政府身份资料图片进行对比)。
鉴于类似旷视的初创公司的成功,中国的科技巨头也开始大力投资AI。中国互联网公司三巨头(统称BAT):某度、某里巴巴和某企鹅,正在开展许多相互重叠的服务,包括语音识别和脸部识别。不过居于他们现在的优势,他们同时也想在某一具体的AI领域拔得头筹。
某企鹅现在在三巨头中吊车尾,它的AI实验室才建立没几个月。但是,某企鹅必将在AI领域发挥重要作用:它比其他两巨头的数据多得多。其旗下某信app拥有近十亿个账户,也是数千个其他服务的平台,这些服务包括从电子支付和提供新闻,到城市地图和法律援助。某企鹅同时也是全球游戏界的大佬,其旗下LOL和部落冲突,在世界各地拥有超过1亿玩家。
某里巴巴早已是电子商务中的翘楚,而同时其投资数十亿美元来成为云计算领域的第一。在6月份在上海举行的一次会议上,其展示了一个名为“ET City Brain”(ET城市大脑)的AI服务,它使用视频识别来实时优化城市交通。它使用路边摄像机的镜头预测汽车的行为,并可以即时调整交通灯。在其公司总部所在地杭州,其称该系统使道路车辆通行速度平均提升了11%。某里巴巴还计划强化所谓的“ET医学大脑”,它将提供基于AI的服务用于开发新药和诊断医学影像。它已经与十几家医院合作以获取开发所需的数据。
但是某度的命运的红线与AI缠得更紧密,部分原因在于AI技术可能是赶上其它两巨头的重要机会。其将大部分资源投入到自主驾驶中:它想在2018年前将无人驾驶汽车推向市场,并在2020年之前为全自主汽车提供技术。7月5日,该公司在北京的AI开发者大会上宣布推出首款自驾车系统阿波罗(Apollo)。
阿波罗的惊人之处不仅仅在于汽车能安全地在路上行驶,同时它是一项对外界开放的项目。Google的子公司Waymo和电动汽车公司特斯拉等竞争对手均小心翼翼地保护他们的自动驾驶软件和数据不被盗用。某度的计划中不仅要开源其程序,而且要与其它人共享数据。这个想法的关键点在于,使用了某度AI技术的汽车制造商们也必须要共享其获得的数据,从而为自动驾驶汽车创建一个开放平台,用陆奇的话说是“自动驾驶汽车中的Android系统”。
在北京学当老司机
中国企业在出口AI产品方面的成功还有待观察:现在只有少数几家公司将产品出口国外。在理论上他们应该会获得一个称心的出口合同:在中国混乱的街道上训练而成的自动驾驶汽车在欧洲越来越文明的交通中应该完全没有问题(相比之下,在德国训练的自动驾驶车辆获得的算法进步可能远远还不如北京的一个交叉路口来的深远)。但西方的消费者使用这些自动驾驶汽车可能会犹豫,因为它们是在松懈的交通安全环境和对交通事故更容忍的大环境下训练而成的。据说北京市政府正在千方百计使其能成为自动驾驶汽车的试验城市。
AI领域还有另外一个风险。数据集是目前AI最有价值的投入,但其重要性可能会逐渐减小。AI公司已经开始使用模拟数据,包括来自电脑游戏的数据。而新开发的算法可能通过较少的样本集获得同样的智能效果。驭势CEO吴甘沙警告说,"最大的危机在于我们自满于数据方面的优势,而在算法创新上止步不前。"不过,现在中国看起来只是跃跃欲试的样子,而在未来争夺AI皇冠的赛跑中,中国与美国的差距将越来越小。
本文译自 the economist,由 原版时辰 编辑发布。
译者按:
(幕后煮屎者)明年打算转职当码农,现在学了HTML、CSS、JS,暂时可以写个简单完整的网页,下半年学NodeJS,计划从最简单入行,因为没有其他编程语言基础,有人建议我入行后找机会跳人工智能领域,所以在学习一些机器学习相关的慕课什么的。不知道各位前辈对这条路有什么好建议没?例如有什么坑?
PREV : 南极洲冰架崩裂,万亿吨冰山脱离
NEXT : 对孩子来说,玩多少电子游戏是“太多”?