摘要:人体姿态估计是指对图像中人体关键部位和主要关节进行检测的过程,其作为人体动作识别和分析的主要内容,在计算机视觉等方向有教广阔的应用前景。随着微软公司推出的Kinect深度传感设备之后,基于深度图像的姿态识别技术得到了越来越多的学者关注。随着深度学习方法在几个计算机视觉任务中的成功,最近的工作集中在使用深度递归神经网络RNN来模拟人体运动,目的是学习执行诸如短期运动预测之类的任务时间相关。改进的公路单元MHU用于有效地消除静止关节并在给定运动环境的情况下估计下一个姿势。此外通过最小化长期运动预测的格拉姆矩阵损失来增强运动动态。该模型可以很好的预测人类未来的运动,从而进行人体姿态序列迁移合成。
关键词:人体姿态估计 上下文建模 递归神经网络 对抗网络 卷积神经网络 MHU
一、人体姿态估计简介
人体姿态估计作为机器人智能最重要的部分之一,可以对复杂环境变化做出快速和高保真的反映。例如,机器人可以通过预测周围主题的运动来毫不费力地避免路线碰撞。其通过在给定的图像或视频中对人体的关键部位或主要关节进行检测,最终输出人体全部或局部肢体相关参数的过程。人体姿态估计研究涉及了计算机视觉中几乎所有与人类有关的问题。随着Kinect等MOCAP设备的发展,以及姿态估计算法可以轻松准确地计算人体骨骼序列。因此它使我们能够通过分析观察到的骨架序列来预测未来的人体运动,这可以进一步帮助人体运动分析、识别、姿态估计甚至人机交互。
二、运动上下文建模简介
运动上下文建模旨在对历史人体运动进行编码,这可以进一步推动未来的骨骼运动。现有方法通过LSTM或者GRU简单的模拟运动,并且最后隐藏的状态被视为人体运动预测的运动上下文建模。Singh提出的对姿态和物体进行联合建模的姿态上下文树中,人体被分成10部分,为了交互作用,姿态被视为对象检测中的上下文去估计图像中的姿态,通过各种交互环境下多姿态上下文树的最大似然来推断最佳姿态-物体对。Yao提出了一个相互关联的上下文建模,在人类对象交互活动中对物体和人的姿态进行联合建模。目标检测为更好的人体姿态提供了有力的基础,同时人体姿态估计提高了物体与人交互的准确性。此外很多研究人员也提出了很多类似的方法。
三、递归神经网络简介
递归神经网络(Recursive NN,RNN)通过带有树状相似的神经网络结构来递归复杂的深度网络。递归神经网络包括一层内的加权链接。因为RNN包含循环,所以它们可以在处理新输入的同时存储信息。这种记忆使它们非常适合处理必须考虑事先输入的任务(比如时间序列数据)。递归神经网络(RNN)非常适合处理文本、语音、视频等时间序列数据样本。
四、对抗网络简介
对抗网络(GAN)是神经网络学习生成与已输出数据相似的数据。GAN包括两个模型:生成模型和判别模型。判别模型是一个分类器,用来确定给定的图像是真正的图像还是像人工创造的图像,这是一个使用卷积神经网络的二元分类。生成模型通过反卷积神经网络将随机的输入值转换成图像。在众多的训练迭代过程中,生成模型和判别模型通过反向传播算法,训练权重和偏置量。判别模型学习把真实的图像同生成图像区分开来。同时,生成模型通过判别模型反馈者生成更逼真的图像,使得判别模型无法分辨真实图像与生成图像。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。