共查询到20条相似文献,搜索用时 15 毫秒
1.
针对在基于深度学习语音增强的方法中因采用因果式的网络输入导致语音增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络(LCGRU)的语音增强方法。门控循环神经网络能够建模语音信号的时间相关性,但是其全连接结构破坏了语音信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,本文采用卷积核替代门控循环神经网络中的全连接结构,在对语音信号时间相关性建模的同时保留了语音信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,本文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语音增强性能。实验结果表明,本文所提出的网络结构在增强后的语音感知质量(PESQ),语音短时客观可懂度(STOI),分段信噪比(SSNR)等指标上均优于传统的网络结构。 相似文献
2.
3.
4.
5.
6.
为有效地对焊缝缺陷进行分类,从而判断焊接质量的等级,对传统卷积神经网络进行改进,提出一种多尺度压缩激励网络模型(SINet)。将4组两两串联的3×3卷积模块与Inception模块、压缩激励模块(SE block)相结合。通过多尺度压缩激励模块(SI module)将卷积层中的特征进行多尺度融合和特征重标定以提高分类准确率,并用全局平均池化层代替全连接层减少模型参数。此外考虑到焊接缺陷数量不平衡对准确率的影响,采用深度卷积对抗生成网络(DCGAN)进行数据集的平衡处理,并在该数据集上验证模型的有效性。与传统卷积神经网络相比,该模型具有良好的性能,在测试集上准确率达到96.77%,同时模型的参数个数也明显减少。结果表明该方法对焊缝缺陷图像能进行有效地分类。 相似文献
7.
针对深度学习训练成本高,以及基于磁共振图像的前列腺癌临床诊断需要大量医学常识且极为耗时的问题,本文提出了一种基于级联卷积神经网络(Convolutional Neural Network,CNN)和磁共振图像的前列腺癌(Prostate Cancer,PCa)自动分类诊断方法,该网络以Faster-RCNN作为前网络,对前列腺区域进行提取分割,用于排除前列腺附近组织器官的干扰;以基于ResNet改进的网络结构CNN40bottleneck作为后网络,用于对前列腺区域病变进行分类.后网络由瓶颈结构串联组成,其中使用批量标准化(Batch Normalization,BN)、全局平均池化(Global Average Pooling,GAP)进行优化.实验结果证明,本文方法对前列腺癌诊断结果较好,而且缩减了训练时间和参数量,有效降低了训练成本. 相似文献
8.
本文提出了两种X光图像处理方法,其中增强方法是运用调节参量在计算机上完成的,结果令人满意.复原法主要是在只考虑散射和光源尺寸的条件下来计算MTF(散射主要考虑增感屏的影响)在特殊情况下,可得到MTF的解析形式,它与计算机结果是一致的. 相似文献
9.
针对近红外图像彩色化过程中存在近红外与可见光图像间模态差异较大、图像域样式不佳而导致其彩色化结果出现色彩纹理不吻合的问题,提出一种基于空洞循环卷积的近红外图像彩色化方法。改进CycleGAN网络,利用级联结构和空洞卷积块的优势设计了一种名为空洞级联模块,该模块采用编解码级联结构,代替原模型残差网络中的单向连接结构,进行特征通道的级联。在编解码级联层中引入空洞卷积模块,利用空洞卷积不损失图像纹理细节的优势,进一步提取不同尺度的近红外图像特征信息,最后通过解码将近红外灰度图像上色成彩色近红外图像。算法在生成网络中采用空洞级联方式改善误着色问题;在判别网络中引用感知损失函数改善网络收敛速度慢的问题。并且在NIR_VIS数据集上开展验证和分析。实验结果表明,所提方法提升效果明显,更好地保持了原目标的结构及色彩纹理特征,有效地提升了近红外图像的可视化效果。 相似文献
10.
为有效利用行为视频的长时时域信息,提高行为识别准确率,提出一种结合有序光流图和双流卷积神经网络的行为识别算法。首先利用Rank支持向量机(SVM)算法将连续光流序列压缩总结成单幅有序光流图,实现对视频长时时域结构的建模;然后设计一个包含表观和短时运动流与长时运动流的双流卷积网络,分别以堆叠RGB帧、有序光流图为输入提取视频的表观和短时运动信息与长时运动信息;最后将双流网络的C3D描述子和VGG描述子融合后输入线性SVM进行行为识别。在HMDB51和UCF101两个数据集的实验结果表明,该算法能够有效利用空域表观信息和时域运动信息,具有较高的行为视频识别准确率。 相似文献
11.
12.
《光学学报》2020,(7)
针对光纤布拉格光栅(FBG)传感网络中重叠光谱的中心波长解调问题,提出一种基于门控循环单元(GRU)网络的波长检测方法。该方法将FBG重叠光谱的波长解调问题转换为模型回归问题,同时考虑到光谱数据的序列特征和频谱特性,采用GRU网络实现对光谱数据的特征学习,训练得到相应的波长检测模型,从而实现对重叠光谱的精确快速解调。经实验验证,所提方法能够解决FBG传感网络光谱部分重叠或完全重叠条件下的中心波长的精确解调问题,其方均根小于1 pm的测试结果占总数的88.2%。相比现有的解调方式,所提方法在检测精度和稳定性上均有一定的提升,为提高FBG传感网络的复用能力提供了新的途径。 相似文献
13.
14.
《光学学报》2017,(3)
为了解决传统高斯光束片状光照明显微成像技术高轴向分辨率时视场范围(FOV)小的问题,结合艾里光束片状光照明样本成像与去卷积算法,实现了光片显微镜对样本的高轴向分辨率大视场成像。数值模拟了高斯光束与艾里光束经过物镜聚焦后的光强分布。搭建实验光路系统,在液晶空间光调制器上加载三次相位图生成艾里光束,并扫描光束生成片状光照明荧光微球、染色的斑马鱼肌肉组织进行成像实验。在艾里光束光片显微镜成像结果基础上,建立去卷积算法进行图像恢复,克服了艾里光束光片显微镜成像范围大但轴向分辨率不高的问题,对荧光微球成像,探测放大倍率为42倍,FOV从高斯光束光片显微镜的25μm扩大到208μm;对染色的斑马鱼肌肉组织进行成像,探测放大倍率为53倍,FOV由20μm扩大到167μm。仿真和实验表明,通过艾里光束光片显微镜与去卷积算法的结合可以在扩展光片显微镜成像视场的同时提高轴向分辨率。 相似文献
15.
马铃薯是世界第四大粮食作物,具有丰富的营养价值。但其在贮藏和运输过程中易被镰刀真菌侵染而产生干腐病,最终造成巨大资源浪费和经济损失,因此实现马铃薯干腐病的早期快速无损检测是必要的。在样品被病原菌侵染时,经历了健康—潜育期—轻度病害—重度病害的阶段,其中潜育期的样品难以识别,主要源于病害发生时间较短,表面未形成肉眼可见的病斑,与健康样品相似。为了实现马铃薯干腐病潜育期的识别,结合高光谱成像和深度学习展开马铃薯干腐病早期诊断研究。以健康和不同腐败程度马铃薯为实验对象,获取健康和不同病害等级的马铃薯高光谱图像。然后基于ENVI人工选取健康部位和不同腐败程度样品的病斑部位为感兴趣区域(ROI),并计算ROI的平均光谱值作为该样品的最终光谱信息。以光谱数据作为输入变量,病害等级作为输出变量,建立卷积神经网络(CNN)模型,并对其网络结构进行优化,对比分析不同模型的预测结果,筛选出最优网络层模型为Model_3_3。并基于此结构进行学习率的优化,得到Model_0.0001识别效果最好,其总体准确率、精度、灵敏度和特异性分别为99.68%、 99.76%、 98.82%、 99.54%。为了进一步... 相似文献
17.
X光图像中缺陷的自动提取方法研究 总被引:4,自引:0,他引:4
针对炭素制品X光图像的特点,对其缺陷的提取技术进行了研究,提出了基于迭代的阈值构造方法和基于数学形态学的边缘提取算法。为快速准确地提取缺陷,设计了目标边界提取算法和基于小波变换的图像增强算法,实现了原始图像中目标区域的增强及其背景的去除。在此基础上,为排除噪声干扰的影响,采用数学形态学和迭代阈值分割相结合的方法从目标区域中提取出缺陷区域,并在迭代阈值分割的基础上,利用基于数学形态学的边缘提取算法提取了缺陷的边缘。实验结果表明,该法很好地实现了缺陷区域及其边缘的自动提取,且受噪声影响很小,为进一步的缺陷特征参量的提取与选择奠定了良好的基础。 相似文献
18.
19.
《光学学报》2017,(10)
针对移动平台有限的计算资源以及基于彩色图像的道路检测方法在极端光照情况下及路面类型变化时存在的不足,提出了一种融合彩色图像和视差图像的基于9层卷积神经网络的快速道路检测算法。提出一种数据输入层预处理方法,将视差图变换为视差梯度图以强化地面特征,降低网络深度需求。所提两种网络结构为双通道后融合网络和单通道前融合网络,分别用于卷积特征分析和快速道路检测。实验使用KITTI道路检测数据集并人为划分为普通和困难两组数据集,对该算法进行实验对比和分析,结果表明:与基于彩色图像的卷积神经网络方法相比,该算法在普通数据集上最大F1指标(MaxF1)提升了1.61%,在困难数据集上MaxF1提升了11.58%,算法检测速度可达26frame/s,可有效克服光照、阴影、路面类型变化等影响。 相似文献
20.