- 引言
三维模型对应关系在机器视觉、计算机图形学和模式识别等领域具有重要的研究意义,已广泛应用于游戏、自动驾驶和激光雷达等多个行业。目前,三维模型的对应关系计算方法可以分为基于模型的和基于数据的方法。基于模型的方法往往需要依靠模型的集合信息,如法向量(Tombari等,2010)、曲率(Pottmann等,2009)、热核(Sun等,2009)和波核(Aubry等,2011)等局部几何信息以及测地距离和扩散距离(Furuya和Ohbuchi,2015)等构建模型间的映射关系。基于数据的方法则是利用机器学习的方法来训练模型的特征描述符,如通过学习模型的光谱描述符计算出模型间的对应关系,然后将模型对应关系转换为标签问题(Mahmoudi和Sapiro,2009)。三维模型对应关系的研究主要是计算两个或多个模型之间的稀疏对应关系(杨军 等,2014)或稠密对应关系,研究方法包括点到点的映射、基于热核签名的映射、基于波核签名的映射、基于融合特征描述符的映射、函数映射、深度函数映射等。
- 国内外研究现状
在 随着三维模型间对应关系在计算机图形学和计算机视觉领域的应用越来越广泛,快速可靠的三维模型对应关系计算方法称为研究热点。传统的基于函数映射理论计算非刚性三维模型对应关系的方法,大多使用模型的局部描述符,但是传统的局部描述符对三维模型的对称性结构不够敏感,而且当模型受到噪声干扰时无法得到准确的对应关系。深度函数映射是最近提出的一种新型计算模型对应关系的方法,解决了已有算法匹配精度不高的问题。
目前,非刚性等距变换的三维模型间对应关系计算被许多研究者关注。Bronstein等(2006)计算模型间对应关系时使用了计算点对之间的测地距离的方法,但是对应关系优化非常困难。为了解决这一问题,Aigenrman等(2015)采用将模型映射到公共区域的方法来计算对应特征区域间的对应关系,该区域范围的选择主要取决于模型的拓扑,并通过函数映射理论计算模型间的对应关系。Ovsjanikov等(2012)首次提出函数映射的方法,将模型间对应关系的计算转换为求解相应的函数映射矩阵,从而能够得到较为准确的模型对应关系。该方法对发生非刚性型变的等距模型具有较好的映射效果,而对于非等距模型,由于模型间的拓扑结构信息已发生改变,无法计算出准确的函数映射矩阵,因此无法构建准确的对应关系。Kovnatsky等(2013)使用函数映射方法,将映射关系问题转换为最小二乘法的简单求解问题,虽然该方法能有效完成对应关系计算,但在恢复到点到点对应关系计算时往往具有很大挑战性且错误率较高。杨军和史纪东(2018)及杨军和闫寒(2018)提出了一种校准三维模型基矩阵的函数映射的对应关系计算方法。首先计算模型的拉普拉斯算子,获得模型的特征值和特征向量,并利用得到的特征向量构建基矩阵;然后计算模型基矩阵之间的校准矩阵,并用该矩阵对两个模型的函数基进行校准;最后计算校准模型所有点的高斯曲率来采样源模型尖端特征点,并在校准后的目标模型上遍历所有点,以寻求最优对应点来构建3维模型间的对应关系。该算法较为准确地构建了两个或多个模型间的对应关系,同时也克服了模型自身对称性影响对应关系计算的问题。但是该方法对于大尺度变形的模型或残缺模型,无法得到准确的对应关系。Halimi等人(2019)在函数映射理论的基础上,提出了深度函数映射的方法来计算模型间的对应关系,只要将源模型和目标模型的特征描述符输入深度函数映射网络中,即可输出模型间的对应关系。但由于该方法需要对输入网络的数据进行复杂的预处理,导致计算效率低下。Litany等(2017)在深度函数映射的基础上,利用神经网络学习模型的特征描述符,并将模型之间的对应关系计算设计为网络架构的一部分,可得到模型之间较为准确的对应关系。但该方法对于表面缺失部分较多的模型无法计算出准确的对应关系,且算法依赖模型间的真实对应关系作为监督。Rodola等(2017)提出了一种计算非刚性模型之间的部分函数映射关系的方法,将残缺模型与完整模型进行匹配,对部分函数映射关系的频谱进行了正则化,使用拉普拉斯矩阵的扰动分析有效解决了由于模型部件缺失导致的拉普拉斯特征函数的特殊结构问题,从而能够计算出较为准确的部分模型与完整模型之间的对应关系。但该方法对拓扑结构发生较大变化的模型或类间相似的异质模型,不能计算出正确的对应关系。
三维模型间的对应关系计算方法由传统的直接计算复杂的点到点的对应关系,逐渐发展为通过划分特征区域计算模型间对应关系、使用函数映射方法直接计算模型间对应关系以及利用深度学习思想来计算模型间对应关系。
目前,三维模型对应关系计算方法的主流趋势是利用输入模型的局部特征描述符,并借鉴二维图像利用局部特征描述符的匹配方法(Liu等,2016)来计算三维模型之间的对应关系。
三维模型的特征描述符应具有快速运算的特点和良好的局部性质,且在模型受到噪声干扰时具有较强的鲁棒性。目前三维模型描述符的计算方法主要有基于局部坐标系(Abbasi和Tajeripour,2017)的描述符计算方法和基于直方图(Salti等,2014)等描述符计算方法。
计算机图形学中广泛采用离散化采样技术,三维模型通常采用网格或点云的形式进行离散化表示,相应的拉普拉斯-贝尔特拉米算子的离散形式也越来越多地受到广泛关注。从计算曲率开始,Laplace-Beltrami operator(简称LBO算子)被引入数字几何处理,后来在网络曲面处理及三维模型分析中得到广泛应用。同时衍生出了种类繁多但不能相互替代的离散方法。其中在三角网络上基于余切的离散化方法已经比较成熟;近年来发展出的基于热核的计算理论,在收敛性方面有了重要突破,同时也扩展了应用领域。此外,Melzi等改进了传统的拉普拉斯-贝尔特拉米算子,得出局部流形谐波算子用于分析模型的局部信息,但该算法需要手动设置谐波参数,计算模型间的对应关系时自适性弱。
理想的LBO算子应满足对称性、局部性、线性和正权值四个条件,但对于一个任意网络均满足上述4个条件的离散方法是不存在的,因此要根据应用需求进行取舍。离散LBO算子的最大挑战来自于收敛性问题。通过研究计算离散网络平均曲率的方法,对LBO算子系数的确定起到了指导作用。
热核特征是三维模型的局部特征,在读取网络模型的顶点信息和三角形片面的信息的基础上,用余切矩阵函数该信息的权值矩阵和对角矩阵,将得到的对角矩阵的逆和权值矩阵相乘,计算出网络模型的拉普拉斯-贝尔特拉米矩阵,即LBO,将得到的LB矩阵进行特征分解,得到矩阵所有线性不相关的特征值以及特征值对应的特征向量并保存。选取特征信息中的特征值与特征向量,将他们作为两个参数带入热核函数中,热核函数对参数结果求和得到热核特征值。热传导方程是描述区域内温度随时间变化的偏微分方程,可以推广为LBO算子的表达形式,其中热核能够反映两点之间相互影响程度的大小。热核特征通过记录经过一段时间后点x的热量扩散到其他点来获取模型上该点的邻域内的集合信息。在不同姿态的同类模型中热核具有稳定的形状描述能力,因此可以作为三维模型点的特征描述符。热核公式的提出打破了余切公式在离散LBO算子计算理论方面的垄断地位,基于热核公式的离散化方法成为了近年来研究的热点。热核特征是基于谱的特征,2011年,波核特征提出,比热核特征效果更好,它去掉了能量随着时间变化的影响,引入了能量级,用能量级的概率分布来表示模型表面的形状特征。
其中,离散LBO算子计算方法的最新进展来自多边形网络方面。Alexa等从黎曼流形度量出发,给出了多边形网络上离散LBO算子的构造方法,对非凸及非平面情形仍然适用。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。