[摘要]Adam相比此前的系统,在图片识别方面精准度提升了一倍。
我们正在进入一个新的时代——人工智能时代。依靠大量的试验研究,谷歌、Facebook,微软和苹果等大型科技或互联网公司正寻求更为强大人工智能技术,其中包括语言识别,语言翻译,计算机视觉,以及图片识别。 打败谷歌Brain 在人工智能领域,谷歌相比对手走在了最前列。最近,该公司收购了多伦多大学一家神经网络方面的初创公司DNNResearch。据悉,这家公司创始人是机器“深度学习”(Deep Learning)方面的领军人物。此外,谷歌也公开讨论过新型人工智能技术,其中涉及了安卓手机上的语音搜索。谷歌在语音识别技术和计算机视觉精确度方面都创造了好几项纪录。 但是现在,微软研究团队表示,它们新开发出了一种新型人工智能系统,名叫Adam。微软在其近期组织的学术峰会上也是首次提到了这项新技术。微软表示, Adam相比此前的系统,在图片识别方面精准度提升了一倍,尤其是在识别狗的品种或者蔬菜种类方面。“Adam 旨在探索人类大脑的奥秘。”微软研究院院长彼得·李(Peter Lee)。 彼得·李宣称,在ImageNet 22K标准测试中,Adam 神经网络在图片识别方面的表现要比谷歌Brain快。ImageNet 22K标准主要向谷歌在线服务(包括安卓设备语音识别和谷歌地图等)提供了一种人工智能测评计算方法。这项测试需要系统具备处理2.2万张图片数据能力。在Adam之前,只有少数人工智能模型能够处理如此规模庞大的数据输入,其中就包括谷歌Brain。 不过,Adam并非凭借“深度学习”算法来打败谷歌,它的取胜之道是优化设备数据处理和调整系统与设备之间交流。微软这项研究的奠基人为Trishul Chilimbi。有意思人的是,Trishul Chilimbi此前并非人工智能领域专家,而是从事大规模计算机系统研究。 Adam工作原理 与其他“深度学习”系统类似,Adam运行于一组标准计算机服务器阵列,实际上它使用了微软Azure云计算服务。“深度学习”旨在通过构建人脑神经网络系统,更加紧密地模仿人类大脑工作方式。Adam在运行过程中需要大量的服务器,就如同人脑在运转过程中需复杂的神经网络一样。两者的区别在于,Adma利用的是一项名为“非同步”(asynchrony)技术。 随着计算系统变得日益复杂,系统内各部分彼此之间在交流时变得越来越困难。不过,“非同步”技术能够帮助解决这一问题。从根本上讲, “非同步”将系统分为多个小部分,它们在 “分享”各自运算和融合为一体前,彼此都是独立运行的。问题在于,尽管这种技术能够很好的应用在智能手机和笔记本电脑上(智能手机和笔记本电脑的内部计算分散在诸多不同芯片之上),但在包含了很多不同服务器的系统中(如神经网络),这项技术的表现算不上成功。 但是,诸多研究人员以及包括谷歌在内的科技公司在过去几年时间都在这一领域投入很多精力,而微软正是凭借华盛顿大学研发的“HOGWILD!”技术才占得先机。 “HOGWILD!”技术起初只是让机器内部每个处理器能够更为独立的运行。不同芯片甚至都能够写入相同的存储单元之中,彼此之间不会受到“重叠”影响。对于大部分系统来说,这种技术绝对不算什么“好东西”,它们可能会导致数据冲突,因为一台设备覆盖了其设备已完成数据编码。但在某些情况下,这种技术运作良好。正如华盛顿大学研究员所展示的,“HOGWILD!”可以大幅提升单个设备的运算速度。微软Adam在此基础之上做了改进,应用了 “HOGWILD!”技术。 “我们比HOGWILD!更疯狂,因为Adam的异步性更强。”Chilimbi表示。 尽管神经网络分布极其密集,且数据冲突风险很大,但这种方法行得通,是因为如果系统能够避开数据冲突,这种“冲突”则会带来一种相同的运算。 微软表示,Adam可以帮助神经网络更快速、更精确的来“训练”设备对图片的认知能力。让人感到惊讶的是,Adam运行的竟然是传统的计算机芯片,而非专门用于图形处理的GPU。目前,很多“深度学习”系统使用的是GPU,就是为了避免数据通信瓶颈。但Chilimbi表示,微软Adam选择的是不同的路径。 神经网络依靠的是海量数据,它所处理的数据比标准计算机芯片CPU要多得多。这也是为什么它们需要分散到很多机器上的原因。作为另一种选择,GPU可以来处理如此庞大的数据,且速度更快。但问题是,如果人工智能系统数据未能完全与GPU或者运行于多个GPU之上的单一服务器匹配,系统将会崩溃。 另外,数据中心的通讯系统运行速度还不足以跟上GPU处理信息的速度,这将会导致数据传输堵塞。正因为如此,一些专家表示, GPU并非处理大型神经网络系统的最佳选择。 微软将Adam描述为一种“奇幻”的系统,但某些深度学习领域专家则表示,微软Adam系统的工作原理跟谷歌人工智能并非完全不用。专家表示,如果不知道更多有关微软如何优化神经网络的细节,人们就很难知道微软Adam团队是如何来实现他们所宣称的成果。 前谷歌Brain部门研究人员马特·赛勒(Matt Zeiler)表示:“微软的研究成果跟人类已发现的研究成功背道而驰,但这也是它的亮点之处。”他表示,如果微软能够增加更多设备,那Adam的识别准确率就会越高。 未来潜力巨大 微软彼特·李表示, Adam项目目前还处于初级阶段。到目前为止,它只是在一款应用内部进行测试。测试结果显示,当你使用手机拍照时,Adam能够准确的识别照片上的物体。彼特·李使用Adam辨别出了狗的品种以及有毒的虫子。微软目前还未披露何时向大众市场推出这款应用的计划。不过,彼特·李表示,Adam未来肯定可以在电子商务、机器人,以及敏感度分析领域得到“重用”。微软目前也正在讨论研究,如果Adam运行在编程闸阵列(field-programmable arrays)或运行常规软件处理器上时,它的效率是否会提高。事实上,微软已经在测试这类芯片来提升Bing服务。 此外,彼特·李坚信,Adam将可以成为真正的人工智能技术,这种智能技术将跟人类处理语言、视觉和文本形态内容功能接近。但是,想要达到这种水平,微软还需要做很多。自上世纪50年代,人类就已经开始朝这个目标迈进。但现在,可以肯定的是,我们离目标又近了一步。 |