面向文本与图像的跨模态行人重识别算法研究与优化任务书

 2022-01-27 15:28:40

全文总字数:4095字

1. 毕业设计(论文)的内容和要求

1、毕业设计内容:行人重识别是计算机视觉领域中较为热门的一个研究方向,传统的行人重识别通常被认为是目标探测(Object Detection)的后续,根据一张给出的行人图片(一般称为query),在图像数据库中检索出同一个行人的其他图片,由于不同图片中行人姿态、场景亮度、画面遮挡等情况迥异,从而导致了行人重识别任务具有不小的挑战性。

而在2017年香港中文大学CUHK-PEDES数据集的发布以及同时《Person search with natural language description》论文的发表,基于描述的行人重识别任务(Description-based Person Re-identification)开始吸引计算机视觉研究者的兴趣。

通常该课题涉及行人检索与行人重识别的相关研究,通常的行人重识别任务是以图搜图,但是在一些情况下,被搜寻对象的图片可能难以获取,因此本项目使用更容易获取的文本描述作为检索依据。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 实验内容和要求

围绕面向文本与图像的跨模态行人重识别展开研究,设计并构建跨模态行人重识别算法模型,实现模型优化与高效的跨模态行人检索,并在算法精度与创新点方面实现较大突破。

模型基于Python及其相关第三方库构建实现。

主要目标和要求如下:1. 有效的图像与文本特征提取子模块,能够充分利用各个模态的多粒度信息,整体特征与局部特征形成互补,利用注意力等机制突出具有鉴别力的特征元素,并减弱噪音元素的干扰;2. 精准的特征匹配与相似度衡量机制,合理利用多粒度匹配、多空间映射与重构、层叠式特征更新等方法,实现高精度的特征匹配;3. 实现较快速的基于文本描述的行人检索功能,能够得到输入的文本描述后按相似度由高到低给出相应行人的图像与ID信息;4. 算法模型多样化分布的行人图像与文本描述数据,具有一定的迁移与适应能力。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 参考文献

[1] Y.-J. Cho and K.-J. Yoon. PaMM: pose-aware multi-shot matching for improving person re-identification[J]. IEEE Trans. Image Process. 27(8), 37393752 (2018).

[2] J. Dai 等.. Video person re-identification by temporal residual learning[J]. IEEE Trans.Image Process. 28(3), 13661377 (2019).

[3] L. Shuang 等. Person search with natural language description[C]. in Proc. IEEE Conf. Comput. Vision and Pattern Recognit., pp. 51875196 (2017).

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 毕业设计(论文)计划

起讫日期 设计(论文)各阶段工作内容 备 注2020.12.28-2021.01.18 确定选题,下达任务书 2021.01.19-2021.02.21 撰写开题报告 2021.02.22-2021.03.31 算法与模型设计 2021.04.01-2021.04.15 各子模块优化 2021.04.16-2021.05.01 测试修改完善 2021.05.02-2021.06.03 论文撰写、修改和完善 2021.06.04-2021.06.10 论文打印,答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。