[-]
在山河县附近的实验室里,IBM建造了一个啮齿动物大脑的大致等价物。它横跨48个该公司的实验性真北芯片,这种新品种处理器模拟大脑的生理构造单元。/ IBM

Dharmendra Modha领我到房间前面让我凑近细看,这货和浴室药柜差不多大,支在墙边一个架子上。透过透明外壳,可以看到内部的芯片、电路板和彩色灯光,看上去像是七十年代科幻电影里的道具,但Modha却描述它为“你正在看着一只小型啮齿动物”。

他的意思是一只小型啮齿动物的大脑——至少,其数码等价物。里面这些芯片设计成模仿神经元行为,这是生物大脑的基本构造单元。Modha说面前的系统横跨四千八百万个这样的人工神经细胞,大致上是一只啮齿动物脑部的神经元数量

Modha负责创造了这些“神经形态”芯片的IBM认知计算组。在硅谷远端的IBM研发实验室举行着为时三个星期面向学术和政府研究人员的“培训营”,这是他和他的团队第一次向外部世界分享他们这一不寻常的造物。房间前面的数码啮齿动物大脑插着各人的笔记本电脑,这群来源广泛的计算机科学家们正在探索该IBM架构的特色,并开始给这个叫做“真北”(TrueNorth)的芯片构建软件。

[-]
Dharmendra Modha

“我们想尽可能地接近大脑,同时保持灵活性。”
— DHARMENDRA MODHA, IBM

一些上月在科罗拉多的工程交流会上手了该芯片的研究者已经制作出了软件,可以鉴定图像、识别语音,以及理解自然语言。基本上,他们使用该芯片跑“深度学习”算法,同样的算法正驱动着互联网上最新的人工智能服务,包括Facebook的认脸算法Skype的实时翻译。但IBM芯片的潜力是它能在更小的空间里用相当节约的电力跑这些算法,让我们能把更多的AI塞进手机和其它微型设备里,包括助听器和手表等。

“神经突触架构能带给我们什么?它使我们能用非常、非常低的耗电做诸如图像分类的事情,它让我们在新环境里应对新问题。”在劳伦斯·利弗莫尔国家实验室研究深度学习国家安全方面应用的计算机科学家Brian Van Essen这样说。

真北是一场试图完善驱动深度学习和其它AI服务的硬件的广泛运动的一部分。谷歌、面本、微软等公司正在用机器的GPU(原本用来渲染图像的芯片)来跑他们的算法,并且他们正在向FPGA(能为特定任务编程的芯片)迁移。对于苏黎世联邦理工学院和苏黎世大学皮质计算组的博士生Peter Diehl来说,因为真北耗电极少,它在某些情况下表现超过GPU和FPGA。

[-]

密歇根大学计算机科学教授Jason Mars说,主要的差别在于,真北和深度学习算法契合得相当好。这些算法以IBM芯片同样的方式模拟神经网络,重现大脑中的神经元和突触,两者很好地相互映射。“该芯片给你一种高效率执行神经网络的方式.。”Mars这样说道。他回绝了这个月的培训邀请,但一直在密切关注芯片的进展。

虽说这样,真北芯片只适合部分深度学习过程——至少对于今天的芯片来说——有些人还质疑它的影响会有多大。虽然IBM现在正与外界分享该芯片,它离市场还有好几年。但对Modha来说,这是理所当然的,正如他所说:“我们正在为显著变革奠定基础。”

手机里的大脑

[-]
Peter Diehl

Peter Diehl最近出了趟国,那里的网路连接不大好,他的体验对比鲜明地映照出今天AI的局限性。没有了互联网,他就用不了Google Now之类服务,它们在语音识别和自然语言处理上应用了深度学习,因为大多数计算不是在手机而是Google的远程服务器上进行,“整个系统就崩坏了,”他说。

所以说,深度学习需要巨量的处理能力,这种处理能力通常由手机通过网络连接上巨型数据中心提供,而不是在单个设备上本地进行。真北背后的想法是,它能有助于至少把部分处理能力转移到手机和其它个人设备上,这样就能显著扩大AI对普通大众的可用性。

要理解这一点,你需要理解深度学习的工作方式,它分两阶段进行。首先,Google和Facebook等公司必须训练一个神经网络执行特定任务,例如,如果他们想要自动鉴别猫照片,它们就必须把成筐硬盘的猫照片喂给神经网络,然后,一旦模型经过训练,另一个神经网络必须来实际执行任务。你给出一张照片,系统就告诉你里面有没有猫。真北今天的存在形态,就是旨在促进这第二阶段。

一旦模型在巨型数据中心里经过训练,芯片就帮助你执行该模型。因为它又小又如此省电,它能被装进手持设备里。由于不需要通过网络传送数据,这就让你能更快地做更多事情。如果它被广泛使用,就能解除数据中心的很大负担。Mars说:“这就是未来,我们会看到更多处理跑在设备上。”

[-]
真北芯片,64x64共4096核心,1百万神经元,2.56亿突触,54亿晶体管

神经元,轴突,突触,尖峰

Google最近讨论了在手机上跑神经网络的努力,但对Diehl来说,真北能把该概念再推进几步。他解释说,区别是芯片和深度学习算法高度契合。每个芯片模拟约一百万个神经元,它们能通过类似突触的结构互相通信,而突触是大脑内神经元间的连接。

[-]

“硅片的运作方式和构成我们大脑的物质是非常不同的。”

该设定和你当前在市场上见到的GPU、FPGA等芯片很是不同,这些芯片连线用来执行特定的“指令”,而真北操控“尖峰”,这是与大脑中的电脉冲类似的更简单的信息片断。例如,尖峰能显示人说话时的嗓音变化,或者照片中像素间的颜色变化。“你可以把它想象成一个神经元发给另一个的单比特消息。”芯片的首席设计师之一Rodrigo Alvarez-Icaza这样说。

其结果就是一个耗电更少的简单得多的架构。尽管芯片包含54亿个晶体管,它只消耗约70毫瓦功率。相比之下,一个标准的Intel电脑处理器包括14亿个晶体管,消耗35到140瓦。即使是驱动智能手机的ARM芯片耗电也比真北多几倍。

[-]

当然,使用这种芯片也需要新品种的软件。这就是Diehl等研究者在真北培训营里正在探索的,它从八月初开始,在加州山河县的IBM研究实验室还要再持续一个星期。在某些情况下,研究者们把现有代码翻译成芯片能读懂的“尖峰”(然后再翻译回来),但他们也在为芯片构建原生代码。

临别礼物

和这些研究者一样,Modha主要用生物学术语来讨论真北。神经元。轴突。突触。尖峰。当然,芯片在某些方面就是这些湿件的镜像,但类比也有其局限。深度学习创业公司Skymind联合创始人Chris Nicholson说:“这类说法总是令人警惕,硅片的运作方式和构成我们大脑的物质是非常不同的。”

Modha也承认如此。当他在2008年接受国防部研究分支DARPA的5350万美元资助开始该项目时,目标是用完全不同种类的芯片材料以更完整的方式模拟大脑。但在某个时候,他意识到这不会很快发生,“野心必须与现实相平衡”,他说。

[-]
16个真北芯片,大概是世界上最贵的主板

在2010年因为猪流感而倒下期间,他意识到前进的最佳道路是松散模拟大脑的芯片架构——一个随着新硬件材料研发能最终以更完整的方式重现大脑的架构。他说:“你并不需要对神经元的基础物理、化学和生物进行建模才能引发有用的计算,我们想尽可能地接近大脑,同时保持灵活性。”

这就是真北。它不是一个数字大脑,但它是通往数字大脑的一步。随着IBM培训营的举行,该项目正在加速。房间前面的这台机器实际上是48台分离的机器,每台围绕其真北芯片而构建。下周,当培训营结业时,Modha会分开它们,让所有这些学者和研究者们带回自己横跨五大洲30多个机构的实验室。Modha指着一房间研究者们说:“人类使用技术来改造社会,说的就是这些人。”

[-]
David, Prometheus

本文译自 Wired,由 王丢兜 编辑发布。

[ 广告 ]
赞一个 (14)

PREV :
NEXT :