离线发悄悄话
8073
84
1678
至尊会员I
日前,谷歌研究院在图像识别领域取得新进展,根据其科学家发表的文章显示,未来谷歌的图像识别引擎不仅仅能够识别出图片中有什么,还能用一句话对整个图片内容进行准确描述。
据悉,该技术基于机器语言翻译,通过通过一种递归神经网络(RNN)将一种语言的 语句转换成向量表达,并采用第二种RNN将向量表达转换成目标语言的语句。
谷歌所做的是,将以上过程中的第一种RNN用深度卷积神经网络(CNN)取代,而CNN可以用来识别图像中的物体。
科学家表示目前研究仅处于早期阶段,但描述简单的场景已经比较合理了。
描述转换过程
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页
Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc
GMT+8, 2025-1-16 16:16 , Processed in 0.086658 second(s), 26 queries , Gzip On, OPcache On.
手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|在线留言|专门网