解决方案-会员注册-腾龙公司客服中心【64881330】微信

2018/11/10

视觉智能让机器看到世界，现在又给我们带来新惊喜
视觉智能即人工智能人之所以拥有智力，与不停接收外界的信息刺激是息息相关的。视觉是人接收的所有信息刺激中非常重要的一部分。由此推之，要构建一个人工智能系统，处理好视觉感知同样是必不可少。这类视觉感知被称为计算机视觉（Computer Vision），简单定义即：给定一幅或者多幅图像（就像人类视网膜感光形成的图像信号），让机器理解其中的内容——里面有什么东西，它们之间的关系，整个图像信号意味着什么等。在5-10年前，绝大多数人都认为计算机视觉是人工智能的关联学科，而不是包含关系，人工智能主要面向让机器掌握学习、知识推理的能力，而计算机视觉则主要负责视觉的感知，是一个更浅层、更前级的东西。计算机一般通过摄像头来观察世界，看到(Seeing)和感知到(Perceiving)对计算机来说，存在巨大的不同。在图1中，一个字母a的图像，计算机读取到的是一串数字。如何让计算机通过这串数字，知道其代表的是字母a，这就是计算机视觉，也是人工智能需要解决的问题。从变化的像素到语义的概念，计算机视觉经过几十年的发展，通过特征表达和监督学习，取得了长足的进步。还是以字符识别为例，现代的智能系统能够在数码相机或手机拍摄的照片中，找到并且识别其中的文字，例如门牌号、餐馆的名称、指示牌等。这些文字有不同的字体，拍摄的角度有不同的变化，或在不同光线条件下拍摄，仍然能够被系统识别出来。