2015年12月,谷歌发布了其云视觉API,来执行这些任务,如:识别人脸、标志和文字,探测物体并了解其环境的使用。一些客户都对这些功用感到十分振奋,在市场上其它企业也正在寻觅类似的一种服务,为使其习惯其事务模式。
机器为什么需求视觉呢?视觉是主要的感官。机器要可以了解人类,提供他们所需的支持,那么它们有必要可以在视觉领域进行观察和体现。这可能是一个小摄像头的方法,可以帮助盲人去“看”和感受盘绕他们周围的国际。或者是一个家庭监控体系,该体系可以正确识别一群漂泊猫之间的差异,或者移动树枝,和一个防盗的方法。
在曩昔的一年中,围绕着人工智能的嗡嗡声,一直在十分微弱的增加。咱们还从来没有如此接近的观察到这个技能的好处。2016年,将会看到新式的人工智能的供电设备,因为咱们对于人工智能,所面临的最困难的挑战之一,已经取得了进展:让咱们的设备,可以了解它们所看到的。
在咱们的日常生活中,由于设备逐步成为咱们不可分割的一部分,咱们已经看到假如没有足够的视觉才能,越来越多的使用程序将走向失败,其中包含空中无人机碰撞和机器人吸尘器“吃”了它们本不应该吃的东西。
机器视觉是人工智能正在快速开展的一个分支,旨在赋予机器可媲美人类的视觉。跟着研究人员使用专门的神经网络来帮助机器识别和了解实际国际的图画,机器视觉在曩昔几年取得了巨大的前进。现在的计算机在视觉识别上可以做到各种各样的工作,从识别网络上的猫到在诸多的照片中识别特定的面孔。不过,该类技能还有很长的路要走。今天,咱们看到机器视觉可以离开数据中心,并适用于全部从自主无人机到机器人身上,可以收拾咱们的食物。
为了更好的了解机器视觉,一个常见的类比,机器人视觉与人类自己的视觉,就好比天空中飞行的鸟类与飞机。两者终究都将依赖于基础物理学(如伯努利原理),来帮助它们飞入到高空中,可是,这并不意味着飞机将要摇动它的翅膀进行翱翔。仅仅因为人与机器可能会看到同样的东西,并且对这些图画进行解说的方法,甚至可能有必定的共性,最后的结果依然可能是具有很大的不同。
虽然基本的图画分类已经变得愈加简单,可是,当它涉及到从抽象的场景中提取含义和信息时,机器人就面临着一系列新的问题。幻觉就是一个很好的例子,机器人视觉依然还有很长的路要走。
举例来说,当人看到两张面临面的脸的轮廓图画时,他们看到的不仅仅是抽象的形状。他们的大脑会进行进一步的解读,让他们可以识别图画的多个部分,看到两张脸,又或者看到一个花瓶。但对于机器来说,这样的图画是十分难以了解的。基本的分类器分辩不了两张脸和花瓶,它看到的会是诸如短柄斧、吊钩、避弹衣甚至吉他的物体。该体系并不能断定那些物体是在该图画傍边,这说明这类图画的识别对于机器而言极具挑战性。
假如咱们看到一些更复杂的东西,这个问题甚至会变得愈加困难,比如BeverlyDoolittle(富康杜利特尔)的一幅画,虽然看到这个图的每个人,可能不可以发现,其实每个人的脸都在这块画布上,他们几乎立即看到,比映入他们眼皮更多的图片。另外,正如复杂的图画,实际国际也十分凌乱。在傍边正常飞行可不是光开发算法分析数据就可以实现的,它需求对真实场景有清楚的了解,进而可以相应作出行动。