本篇文章1105字,读完约3分钟

在过去的几年里,图像识别技术取得了巨大的进步,这可能比任何其他领域都要快,而谷歌已经让终端用户体验到了这一进步。如果你想知道已经取得了多少进展,只需在谷歌照片上搜索你自己的照片。然而,识别物体(和基本场景)只是第一步。

今年9月,谷歌展示了它的新技术,它不仅能识别单个物体的图像,还能对照片中的不同物体进行分类(例如,水果篮中不同类型的水果)。

一旦你能做到这一点,你也可以完全用自然语言描述图像,这正是谷歌现在正在做的。根据谷歌研究公司最近的一份文件,该公司开发了一个具有自学能力的新系统,可以非常准确地描述如下图像。

正如谷歌研究人员指出的那样,解决这个问题的常用方法是先用计算机视觉算法来计算,然后用自然语言处理的方法来描述它。这听起来很合理,但谷歌研究人员认为,更好的解决方案是将最新的计算机视觉和语言模型整合到一个联合训练系统中,然后提取照片,直接生成人类可以阅读描述的单词序列。谷歌表示,在整合了两个递归神经网络后,这种方法在机器翻译中非常有效。这个自动描述系统的工作机制略有不同,但基本上都采用相同的方法。

谷歌新研究项目曝光:用文字自动说明复杂图像

这并不意味着谷歌的方法是完美的。根据不同的数据集,谷歌电脑字幕系统在bleu测试中的得分(通常用来比较机器翻译和人工翻译的质量)一般在27到59之间。人类通常得分约69分。然而,与其他得分不超过25分的方法相比,谷歌的自动描述系统已经向前迈进了一大步。

三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....

当前流行度:0

[娇娇]http://itougu.jrj/view/189514.j.....

当前流行度:0

1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??要坚强,要坚强。.....

当前流行度:0

你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........

当前流行度:0

缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......

当前流行度:0

那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....

当前流行度:1

你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....

当前流行度:0

咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....

当前流行度:0

来源:国土报中文版

标题:谷歌新研究项目曝光:用文字自动说明复杂图像

地址:http://www.g3gw.com/new/23544.html