luckspirit 发表于 2014-11-19 21:08

谷歌图像识别新进展:把图片内容直接写出来

<p>  日前,谷歌研究院在图像识别领域取得新进展,根据其科学家发表的文章显示,未来谷歌的图像识别引擎不仅仅能够识别出图片中有什么,还能用一句话对整个图片内容进行准确描述。</p><p>  据悉,该技术基于机器语言翻译,通过通过一种递归神经网络(RNN)将一种语言的 语句转换成向量表达,并采用第二种RNN将向量表达转换成目标语言的语句。</p><p>  谷歌所做的是,将以上过程中的第一种RNN用深度卷积神经网络(CNN)取代,而CNN可以用来识别图像中的物体。</p><p>  科学家表示目前研究仅处于早期阶段,但描述简单的场景已经比较合理了。</p><p align="center"><img alt="谷歌图像识别新进展:把图片内容直接写出来" src="http://www.ibmnb.com/attachments/2014/11/1280348_2014111920551417Nmp.jpg" style="border-top: black 1px solid; border-right: black 1px solid; border-bottom: black 1px solid; border-left: black 1px solid"></p><p align="center"><img alt="谷歌图像识别新进展:把图片内容直接写出来" src="http://www.ibmnb.com/attachments/2014/11/1280348_201411192055142kiyB.jpg" style="border-top: black 1px solid; border-right: black 1px solid; border-bottom: black 1px solid; border-left: black 1px solid"><br>描述转换过程</p>
页: [1]
查看完整版本: 谷歌图像识别新进展:把图片内容直接写出来