期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘莹陈永彬《声学学报》1995,(3)

本文提出一种新的讲话者识别方法，该方法仅对带鼻辅音音节的鼻声母段及声韵过渡段用极零模型来表示其语音特征，并采用该模型参数的加权组合距离进行判决，实验表明，这个新方法降低了运算量，同时首选正识率达到了８６％以上。相似文献

2.

基于连续高斯混合密度HMM的汉语全音节语音识别研究 总被引：5，自引：0，他引：5

国立新莫福源李昌立《声学学报》1995,(5)

本文在大量语音分析实验的基础上，对ＨＭＭ用于汉语全音节语音识别进行了较为深入的探讨，建立了一个连续高斯混合密度ＨＭＭ的汉语全音节语音识别系统．该系统在训练算法上撇开了传统的Ｂａｕｍ－Ｗｅｌｃｈ算法，代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段Ｋ平均算法。对于ＨＭＭ的模型单元的选择，单元的结构以及模型参数的选取，充分考虑了汉语语音的特点；并在语音特征上做了深入的实验分析工作，采用了符合人耳听觉特性的Ｍｅｌ－Ｓｃａｌｅｄ参数，用ＦＦＴ倒谱代替了ＬＰＣ倒谱，同时利用了语音的动态谱特征和能量特征。另外，本文还针对汉语声母的特点，独特地提出了变帧移分析策略。整个识别系统的首选正识率为９１．１％．相似文献

3.

汉语连续语音数据库的语料设计 总被引：10，自引：0，他引：10

祖漪清《声学学报》1999,(3)

质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持．在目前阶段,汉语语音数据库应限制在朗读言语（readspeech）的音段方面。为了描写语流中的音变现象,考虑如下语音单元：（1）不计声调的音节（401个）。（2）音节间的双音子415个。（3）音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果．（4）所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个．为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型．选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99．8％个无调音节,100％的双音子,99．6％的三音子,以及17类句型。相似文献

4.

基于声韵分割的汉语单音节识别方法

下载免费PDF全文

徐近霈杨子云沙宗先《应用声学》1989,8(1):5-9

本文提出一种以声韵分割为基础的汉语无调单音节识别方法。这种方法由于引入声韵分割信息和声韵分段判别,显著改善了单音节的正识率。用三男一女的发音对全部403个汉语无调音节考核结果表明,第一位平均正识率为83.9％,前三位平均正识率为96.0％。相似文献

5.

基于汉语单字尾音可切除原则和假设检验知觉理论的连接词识别算法 总被引：1，自引：0，他引：1

张杰黄志同《声学学报》1999,(4)

指出汉语单字语音存在一种可截尾特性,并且得到与之相关的三个结论（称为尾音可切除原则）：（１）如果适当切除单字部分青尾特征,识别率不会明显下降,甚至有所提高．（２）切尾后识别时间明显缩短,分析和实验结果表明：若采用动态时间规整算法（ＤＴＷ）,识别时间与特征矢量长度的平方成正比关系．（３）实验指出,音尾特征的截除极限为特征矢量总长度的１／３．根据上述原则,从假设一检验的认知理论出发,提出一种汉语连接词的识别算法,并在ＤＴＷ模型上得以实现．实验测试集包括２００个特定人发音样本,其中２字词１６２个,３字词２２个,４字词１６个,正识率为９１％．该算法对待识词的字数没有限制,井且随待识字数的增加,识别时间只作线性增长．相似文献

6.

全音节汉语语音识别系统的声学模型研究

关存太陈永彬吴伯修《声学学报》1994,(5)

本文在分析了汉语单音节发音的音节结构的基础上，定义了基于声韵母类的语音识别单元，从声学角度确定了用于汉语全音节识别系统的声学单元，并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计，给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明，本文定义的语音识别单元具有很高的检测一致性，建立在其上的识别，系统也具有很高的鲁棒性；文中给出的预选方法在最好的情况下，可以减少一半以上的运算量，而预选精度几乎达到１００％。相似文献

7.

汉语和外语的基频模式的对比研究 总被引：3，自引：1，他引：2

张家胡兴慧《声学学报》1995,(1)

利用声门电阻抗仪（Ｌａｒｙｎｇｏｇｒａｐｈ）精确地提取嗓音基频，在宏观（篇章）和微观（基音周期）两个层次上，对汉语和英语、德语、日语的基频模式进行了对比研究。发音人是１４名中国人，１４名外国人。试验结果表明：１．９０％音域汉语与外语无大差别；２．连续言语的基频正负颤动对于不同的语言和男女发音人来说，是差不多相同的；３、在连续言语中负颤动因数大于正颤动因数；４．以音节每秒计的说话速度，中国人要比外国人低。相似文献

8.

汉语孤立字全音节实时识别系统 总被引：1，自引：0，他引：1

陈韬李昌立莫福源《声学学报》1993,(3)

本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99％左右,音节识别前5个候选的正确识别率分别为82％,91％,94％,96％,97％;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施. 相似文献

9.

音节混淆字典及在汉语口音自适应中的应用研究

刘明宽徐波黄泰翼胡伟湘《声学学报》2002,(1)

提出了一种基于对识别器识别错误的统计分析建立音节混淆字典，并应用该音节混淆字典作为识别器的先验知识来校正结果的识别方法。这种近似的音节混淆字典可以分与语境无关和相关两种情况讨论，作为一种先验知识，它综合地刻画了说话人的发音特征、识别器的识别特征以及二者之间的相对关系。实验中，我们应用语境无关／相关的音节混淆字典于识别带上海口音的普通话识别器，使其音节误识率分别下降１５％及２０％。在此基础上，本论文结合常规的声学模型参数重估自适应ＭＡＰ（最大后验概率）算法进一步研究了这种方法应用于语音识别系统的实际效果。结果证明，二者互为补充，更大地提高了识别器的精度。相似文献

10.

汉语双音节调位的矢量量化(VQ)研究

孔江平吕士楠《声学学报》2000,(2)

本项研究从实际语音材料出发,运用曲线拟合和矢量量化的方法,对汉语双音节调位的模型进行了系统地研究。研究结果表明;（１）利用曲线拟合和矢量量化技术对汉语双字词声调组合进行模式归类是一种可行和有效的方法。（２）虽然在部分声调组合中不同样品间的离散比较小,但大部分双音节词的声调组合模式可以分为几个子类,因此用一个总体平均的统计模式是不够的．（３）音高曲线的差异明显表现为声调高音点的不同,它是与双字词的音节重音模式相关联的。相似文献

11.

汉语塞音选择性特征自动萃取的小波变换方法 总被引：1，自引：0，他引：1

杜利民侯自强《声学学报》1996,(6)

本文提出了汉语语音导引特征的概念，讨论了语音导引特征在自动语音识别中用于导引匹配搜索的运用方式和重要作用；提出并设计了汉语塞音选择性特征自动萃取的小波变换方法和数字信号处理算法。本文方法和算法从声学信号处理和检测的角度，将汉语清辅音声波输入信号自动分为塞音子集ＢＤＧ：｛ｂ，ｄ，ｇ｝、塞音子集ＺＺＨＪＧＰＴｃＣＨＱＫ：｛ｚ，ｚｈ，ｊ，ｇ，ｐ，ｔ，ｃ，ｃｈ，ｑ，ｋ｝和擦音集ＦｓＳＨｈＸ：｛ｆ，ｓ，ｓｈ，ｘ，ｈ｝；对输入的合清辅音的音节，计算检测并输出汉语自动语音识别系统可以利用的清辅音类属标记ｂ．ｄ．ｇ、ＳＴＯＰ／ＢＤ和ｆ．ｓ．ｓｈ．ｘ．ｈ以及它们的音段起始时标；从声学信息计算检测的角度为汉语自动语音识别系统提供一种新的“从粗到细”的辅助匹配结构。算法可用性模拟实验采用实际语音的数据库数据，以手工标注信息作为自动检测分类正确与否的对比标准。对１２６７个汉语全音节中，总数９１３个待分类清辅音的初步分类结果表明：正确分类率分别为ｂ．ｄ．ｇ：９６．１％，ＳＴＯＰ／ＢＤ：９５．１％和ｆ．ｓ．ｓｈ．ｘ．ｈ：８９．０％，总体平均正确分类率为９３．６％。相似文献

12.

普通话声母和韵母的统计特性

下载免费PDF全文

孙金城倪宏莫福源李昌立《应用声学》1995,14(3):35-41

本文对普通话书面语中声母、韵母的动态与静态分布特性及其差异作了统计分析，结果表明：普通话声母间的、韵母的动态与表态的相对分布关系一致，语音间的相对分布主要与发声系统有关，不受频度的影响。普通话声母、韵母的动态与静态的出现率差异，与声母发音方法和韵线组合结构、声母发音部位与韵母四呼的配合关系、音节的成字率和字的频度有关，主要受送气与不送气声母、韵母的动态与静态的出现率差异最大，多音节词中的韵母的动态相似文献

13.

汉语连续语音识别中一种新的音节间相关识别单元 总被引：1，自引：0，他引：1

李春王作英《声学学报》2003,(2)

考虑汉语连续语音中的协同发音现象对语音识别性能的提高是非常重要的。针对汉语语音的特点,提出了一种新的在汉语连续语音识别中考虑音节间协同发音现象,对声学模型进行细化的识别单元。然后基于语音学知识对音节间上下文影响进行分类,实现单元间状态参数的共享,降低了模型的复杂程度,保证了模型的可训练度。这种方法和传统方法的最大不同在于:这种方法完全利用语音学知识进行聚类,而传统方法采用数据驱动的聚类方式。识别实验表明,基于语音学分类的音节间相关识别单元对识别性能有明显的改善,系统的首选误识率降低了17％。相似文献

14.

近红外光谱分析技术识别奶粉中淀粉掺假的研究 总被引：1，自引：0，他引：1

王宁宁申兵辉关建军赵中瑞朱业伟张录达严衍录郑煜焱董成玉康定明《光谱学与光谱分析》2015,35(8):2141-2146

将蒙牛、伊利、完达山三个品牌的奶粉样品掺入不同量的淀粉构成32份实验样品。在跨度近两个月时间内,用JDSU微型近红外光谱仪,分五天重复5次采集这些样品的中波近红外漫反射光谱。采用仿生模式识别（BPR）算法对样品进行掺假识别定性分析,并研究了分析的可靠性与模型的稳健性。以90%作为评价分析结果（样品掺杂的正确识别率 CAR与正确拒识率 CRR）的阈值：将测试结果高于此阈值的所有样品中掺入淀粉的最低含量分别称为样品掺杂的正确识别限与正确拒识限。结果显示：三个品牌奶粉样品分别各自建模时,若用同一天测定的部分光谱数据建立模型,预测该天剩余光谱,样品掺杂的正确识别限与正确拒识限都可以达到0.1%。对于三种品牌奶粉合并后的纯奶粉及其淀粉掺杂样品混合建模时,若用同一天测定的光谱建模与测试,样品掺杂的正确识别限也可以达到0.1%,正确拒识限则为1%;若用不同时间采集的光谱进行交叉测试,正确识别限与正确拒识限都只有5%;若用四天的光谱数据联合建模,测试第五天的数据,正确识别限可以稳定达到1%,正确拒识限可以达到5%。应用两种算法对奶粉中淀粉含量进行定量分析比较,进一步验证了有关定性分析对样品掺杂正确识别限和正确拒识限的可靠性。相似文献

15.

汉语语音资料库的语音学标记及人工切分 总被引：2，自引：0，他引：2

朱维彬张家《声学学报》1999,(3)

介绍了汉语语音综合资料库的一个子库：CAS－SYL。该数据库包括汉语全部有调音节1267个,共计10个发音人;全部语音数据由人工完成音段切分及语音学标注。针对汉语音节的声韵结构,语音学标注水平被定位在半音节层次上．语音学标注符号系统采用了计算机可读的音标符号系统一汉语SAMPA－X（extendedSAMPhoneticAlphabet）．还介绍了语音学标注策略,音段定位原则,基于语音波形的声门关闭时刻：GCI（GlottalClosedInstant）的声学线索。同时对声韵间的协同发音的声学体现进行了总结。最后对人工切分带来的非稳定性进行了分析．相似文献

16.

一种基于后验概率差值的拒识算法

下载免费PDF全文

李莹莹王成友蔡宣平《应用声学》2004,23(5):32-35

本文提出了一种孤立词语音识别系统中基于后验概率差值的拒识算法。研究了作为拒识特征时，输入词的后验概率和后验概率差值之间的区别，并将多层感知人工神经网络用于拒识特征的学习。相比现存的几种拒识算法，本算法几乎不需要额外的计算和存储量。当识别率为98．2％时，拒识率达到了95．4％。相似文献

17.

基于过零点间时间间隔对P，T，K，Z，ZH，H等六个声母的识别

欧贵文《声学学报》1994,(3)

语音波形过零率是一个很重要的语音特征．它通常是语音端点判别和音素粗分类的基本要素．但是，它也有不稳定的一面，所以很少看到有人将它用到语音细分类和识别中．本文提出了把一串过零点间时间间隔作为辨认普通话声母的语音特征的方法．本文做了以过零点间时间间隔作为ＨＭＭ的输入符号，对送气塞音类声母Ｐ、Ｔ、Ｋ，不送气塞擦音Ｚ、ＺＨ和喉擦音Ｈ等六个声母进行辨认实验．在连机的环境下，我们取得７８％的声母正确辨认率．以过零点间时间间隔作为语音特征的优点是计算简单，易于实现．此外，它可以不经转换直接作为离散ＨＭＭ的输入符号．本文介绍过零点间时间间隔的计算方法和使用ＨＭＭ对上述六个声母进行识别的实验过程．相似文献

18.

防毒面具语言清晰度试验研究

下载免费PDF全文

丁松涛刘辉仁李小银袁晓华朱贤森《应用声学》2000,19(6):4-8

在低背景噪声的野外环境中,采用小闭集汉语（声母）清晰度测试方法,试验比较了四种防毒面具的清晰度水平。测试结果证实：与不佩戴面具相比,佩戴面具后语言清晰度得分严重降低,并随通话距离的增加而进一步恶化;以７５％清晰度得分作为通话性能的可接受限度,那么,不佩戴面具及佩戴四种面具的有效通话距离分别为６３．６、１５．７、１８．６、２５．０和２６．９ｍ。此外,结合对四种面具传声特性测定结果,本文还分析了清晰度测试方法及其结果的合理性。相似文献

19.

原子吸收法测定人精子中锌和铜含量的研究 总被引：1，自引：0，他引：1

徐德选等曹瑞芬《光谱学与光谱分析》1996,16(6):87-90

本文采用石墨炉原子吸收法，以ＮＨ４ＮＯ３和Ｍｇ（ＮＯ３）２混合剂作基体改进剂，测定了人精子中微量元素铜和锌。基方法的特征质量分别为１０．００ｐｇＣｕ／０．００４４Ａ．Ｓ．，９．８０ＰｇＺ／０．００４Ａ．Ｓ；平均加收率为９７．４２％，锌为１０１．９１％，铜和锌的精密度分别是４．１％和４．０３％。相似文献

20.

脉冲噪声暴露后豚鼠畸变产物可声发射（DPO）和耳蜗振电压（CM）的变化

李兴启罗维民孙建和李晖王传《声学学报》1995,(3)

脉冲声暴露前及暴露后即刻（１小时之内）、４８小时、一周同时测试了豚鼠耳蜗畸变产物耳声发射（ＤＰＯ）和振电压（ＣＭ），结果表明，暴露前豚鼠耳蜗出现最佳ＤＰＯ的最适频比（ｆ２／ｆ１）为１．１９－１．２５，最适强度差（Ｉｆ１－Ｉｆ２）为０．４５—２．００ｄＢ，８和４ｋＨｚ时ＤＰＯ出现率为１００％，２ｋＨｚ为９５％，１ｋＨｚ时为７９％。暴露后不同阶段ＤＰＯ和ＣＭ恢复的速率和变化程度不同，前者在各个阶段上损失的程度比后者重。震后一周ＤＰＯ除在８ｋＨｚ时恢复至接近震前水平外，其余频率只恢复至震前的１／４左右或稍多．与之对比，各个频率的ＣＭ在一周时均完全恢复至震前水平，似说明ＤＰＯ较ＣＭ敏感。ＤＰＯ和ＣＭ相关分析结果提示，二者同源于外毛细胞（ＯＨＣ）．相似文献