Video-based Person Re-identification via 3D Convolutional Networks and Non-local Attention
摘要:
贡献: 3d卷积代替2d卷积 使用non-loca明确l处理不对齐问题(apm通过与相邻帧类似nonlocal 的操作也解决了不对齐)并捕获空时长范围依赖,注意但是没处理遮挡 引言里: 基于视频的识别包括提取特征和融合特征两部分 融合特征包括池化,rnn,以及注意力三种如下图。 这里rnn的缺点是: 阅读全文
posted @ 2021-03-17 11:57 penbol 阅读(303) 评论(0) 推荐(0)
浙公网安备 33010602011771号