基于RGB-T图像的双流残差扩张网络人群计数算法 |
| |
引用本文: | 杨佩龙,陈树越,杨尚瑜,王佳宏.基于RGB-T图像的双流残差扩张网络人群计数算法[J].红外技术,2023(12):1177-1186. |
| |
作者姓名: | 杨佩龙 陈树越 杨尚瑜 王佳宏 |
| |
作者单位: | 常州大学计算机与人工智能学院 |
| |
摘 要: | 在人群计数中,针对尺度变化、行人分布不均以及夜间较差成像条件,提出了一种基于RGBT(RGB-Thermal)图像的多模态人群计数算法,称为双流残差扩张网络,它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中,前端网络用来提取RGB特征和热特征,扩张卷积模块进一步提取不同尺度的行人特征信息,全局注意力模块用来建立全局特征之间的依赖关系。此外,还引入了一种新的多尺度差异性损失,以提高网络的计数性能。为评估该方法,在RGBTCC(RGBT Crowd Counting)数据集和DroneRGBT数据集上进行了对比实验。实验结果表明,在RGBTCC数据集上与CMCRL(Cross-modal Collaborative Representation Learning)算法相比该算法的GAME(0)(Grid Average Mean absolute Errors)和RMSE(Root Mean Squared Error)分别降低了0.8和3.49,在DroneRGBT数据集上与MMCCN(Multi-Modal Crowd Counting Network)算法比...
|
关 键 词: | 人群计数 RGB-T图像 扩张卷积 全局注意力 多尺度差异性损失 |
|
|