首页 > 新闻中心
    2018/11/10
  • 视觉智能让机器看到世界,现在又给我们带来新惊喜
  • 视觉智能即人工智能 人之所以拥有智力,与不停接收外界的信息刺激是息息相关的。视觉是人接收的所有信息刺激中非常重要的一部分。由此推之,要构建一个人工智能系统,处理好视觉感知同样是必不可少。 这类视觉感知被称为计算机视觉(Computer Vision),简单定义即:给定一幅或者多幅图像(就像人类视网膜感光形成的图像信号),让机器理解其中的内容——里面有什么东西,它们之间的关系,整个图像信号意味着什么等。 在5-10年前,绝大多数人都认为计算机视觉是人工智能的关联学科,而不是包含关系,人工智能主要面向让机器掌握学习、知识推理的能力,而计算机视觉则主要负责视觉的感知,是一个更浅层、更前级的东西。 计算机一般通过摄像头来观察世界,看到(Seeing)和感知到(Perceiving)对计算机来说,存在巨大的不同。在图1中,一个字母a的图像,计算机读取到的是一串数字。 如何让计算机通过这串数字,知道其代表的是字母a,这就是计算机视觉,也是人工智能需要解决的问题。 从变化的像素到语义的概念,计算机视觉经过几十年的发展,通过特征表达和监督学习,取得了长足的进步。还是以字符识别为例,现代的智能系统能够在数码相机或手机拍摄的照片中,找到并且识别其中的文字,例如门牌号、餐馆的名称、指示牌等。这些文字有不同的字体,拍摄的角度有不同的变化,或在不同光线条件下拍摄,仍然能够被系统识别出来。