谷歌图像识别新进展：把图片内容直接写出来

luckspirit 发表于 2014-11-19 21:08

日前，谷歌研究院在图像识别领域取得新进展，根据其科学家发表的文章显示，未来谷歌的图像识别引擎不仅仅能够识别出图片中有什么，还能用一句话对整个图片内容进行准确描述。　　据悉，该技术基于机器语言翻译，通过通过一种递归神经网络（RNN）将一种语言的语句转换成向量表达，并采用第二种RNN将向量表达转换成目标语言的语句。　　谷歌所做的是，将以上过程中的第一种RNN用深度卷积神经网络（CNN）取代，而CNN可以用来识别图像中的物体。　　科学家表示目前研究仅处于早期阶段，但描述简单的场景已经比较合理了。<img alt="谷歌图像识别新进展：把图片内容直接写出来" src="http://www.ibmnb.com/attachments/2014/11/1280348_2014111920551417Nmp.jpg" style="border-top: black 1px solid; border-right: black 1px solid; border-bottom: black 1px solid; border-left: black 1px solid"><img alt="谷歌图像识别新进展：把图片内容直接写出来" src="http://www.ibmnb.com/attachments/2014/11/1280348_201411192055142kiyB.jpg" style="border-top: black 1px solid; border-right: black 1px solid; border-bottom: black 1px solid; border-left: black 1px solid"> 描述转换过程

页: [1]

专门网's Archiver

谷歌图像识别新进展：把图片内容直接写出来