除了深度学习,计算机视觉还有哪些方向值得研究
除了深度学习,计算机视觉还有哪些方向值得研究?
机器视觉的终极目的,是像生物一样,让机器拥有自己的视觉。顺着这个思路,机器视觉的目的和意义,就很明确了。明确了机器视觉的目的后,机器视觉的任务也就明确了。所以,机器视觉的任务,应该包括以下几类:1.三维空间机器视觉感知。2.基于视觉感知的视觉识别。3.加入时间参数后的机器视觉感知和识别,比如视觉定位,运动感知,物体追踪等。4.基于视觉感和知的基础上视觉概念的生成和对视觉事件的理解和解析。
综上,目前的深度学习技术只是完成了机器视觉任务的第二项任务中的一个小部分。存在的主要问题包括:1.深度学习技术只是定性,不能定量,例如,只知道识别物体,不知道物体的大小尺寸,因为不是基于三维空间数据,无法定量检测。反过来说,深度学习技术应该基于三维空间进行,这样就可以实现定量检测和准确识别。2.深度学习技术需要大样本,标注后的学习过程,无法实现无监督,小样本的示范性学习,学习时消耗的功率和算力太多。
所以,目前的深度学习技术开辟了机器自动学习的模式和时代,特别是大规模神经网络结构,开辟了机器向人类大脑结构学习的方法和思路。目前的机器深度学习技术架构以及基础的运算架构只是一种过渡性技术,不远的未来一定被其它具有自学习,自组织的架构所替代。机器视觉是机器学习技术的最佳应用场所,未来的趋势是基于三维数据的一次性示范学习,以及基于基本视觉元素和属性基础上的高阶机器视觉概念的自动生成和自动学习。