普通话三合元音音节最小时间感知阈及其声学特
普通话三合元音音节最小时间感知阈及其声学特性祖漪清(中国社会科学院语言研究所北京)1992年12月31日收到本研究的实验材料取自中国社会科学院语言研究所语音数据库.库中存有15个男音的语音材料,共有15×15;225个三合元音音节.本研究的主要目的是从普通话三合元音入手,在对15个说话人的语音材料统计的基础上,通过对最小时间感知阈Tlim的测量与研究,从声学和感知的角度,给出三合元音必不可少的信息,指出多余信息.‘实验结果表明,Tlim内的共振峰变化情况可分为两类.一是动态特性,它的表现是:(a)AFl>90%,AF2约50%;(6)Tlim内至少包括F1,F3两个拐点中的一个;(f)Tlim内包括F2变化最剧烈的部分.这四点对四个三合元音是一致的.第二类是边界条件,Tlim受到位置和大小两方面的限制,证明其边界共振峰频率十分重要.一己I古、√1日过去对于复合元音的研究,无论其出发点应用声学是从声学、生理、感知哪一个角度,所得出的结论都是:复合元音是有动程的元音,需要用目标值和过渡两方面的参数描述.早在六十年代,Lehiste等Ⅲ、Holbrook等脚和Gaybl对美国英语的二合元音作了实验分析,将它们分为起始段、过渡段、和收尾段,并认为反映动态变化的参数最为重要.PeetersHl用合成的方法对荷兰语、英语、德语的几个二合元音改变起始段、过渡段、收尾段的时间结构,并进行听辩,给出了这几种语言的二合元音的动态模式.汉语普通话复合元音的研究开展得也很早,吴宗济[5--6]在声学元音图上给出了复合元音的变化过程.杨顺安、曹剑芬阴对普通话九个二合元音的动态特性进行了归类,他们的研究结果直接为语音合成系统提供了依据,并得到了满意的合成语音音质.贺宁基嘲从语音感知的角度着手,在普通话二合元音的滑动段位置上进行切分、听辩,测量了最小时间感知阈,其结果表明:二合元音的最小时间感知阈因不同元音而不同,并与共振峰变化率存在着补偿关系.任宏谟[91在对普通话若干二合元音和三合元音研究的基础上,以第二共振峰F:为参数,提出了复合元音的截断模型,该模型可统一地描述二合元音和三合元音F:的动态变化.纵观国内外复合元音的研究状况,实验大多集中在二合元音方面,这是研究复合元音的基础.三合元音音节是汉语普通话中特有的音节,共有四个(不包括声调):/iou,iao,uei,uai/,对它们的动态特性进行研究是十分必要的.本研究利用中国社会科学院语言研究所语音参数库中的材料,目的是从普通话三合元音人手,在对15个说话人的语音材料统计的基础上,从声学和感知的角度寻找语音学的相对不变量,给出三合元音必不可少的信息,指出多余的信息.与此相关的另一个问题,是P—center(感知中心)的问题,P—center一词是由Morton提出的㈣,它反映了这样一个事实:在一个词中存在着一个位置,听者在这个位置上可感知到该词而不需听到该词的全部;Fowler n11认为P—center是和产生、感知两方面相关连的,它受到调音的控制.尽管P-center是从心理感知的角度提出的,我们认为可以通过它揭示其声学上的内涵,在时间域为语音的合成、识别提供参考.二、实验方法1.实验材料实验材料取自中国社会科学院语言研究所1991年建立的普通话单音节语音库,它们是(15个):忧,尤,有,又;妖;摇,咬,要;威,围,委,胃;歪,崴,外.语音库中存有15个男声的语音材料,因此本实验使用的材料包括15X15—225个三合元音音节.2.三合元音声学模式的测量使用语音库附带的三合元音语图(用Kay-7800语图仪制做),经辩认后画出它们的基频(F0)和振幅(彳)曲线及前三个共振峰的轨迹,捌使用数字化仪测量系统(用于测量语图上的基频和共振峰轨迹的装置,包括测量仪及软件),将这些参数输入计算机,以一定格式存盘.本实验进行的各种统计分析都是调用这些数据,进行编程处理的.3.三合元音最小时间感知闻及其位置的测量最小时间感知阈Tlim的测量分三步进行.为了简化问题,只对阴平声调的音节进行测量.第一步为粗实验,根据梁之安H21关于单元音,及贺宁基关于二合元音的研究,使用Kay-7800语图仪,采用80ms的窗口,对15个人的语音材料从头至尾,以20ms的步长进行切分,得到第一批刺激,我们称这种方法为扫描法.在听辩实验中,每个刺激重复三次,间隔为2s,成为一组,组与组之间再停顿2s,在这个时间间隔内,由受试者对该组刺激给定的书面拼音符号作出是与否的辨别(即强迫性实验).经过第一步实验,‘初步判断出这些三合元音的Tlim是大于80ms,还是小于80ms.第二步为细实验.根据粗分的结果,对15个人的阴平三合元音,任意抽取5人的材料,使用Kay一5500语图仪,对Tlim小于80ms的材料,窗长取40ms,50ms,60ms;对Tlim大于80ms的材料,窗长取90ms,100ms,110ms。120ms,甚至更大.仍使用扫描法制做刺激,听13卷2期辨结果即给出Tlim的值及其在音节中的位置.第三步为精细实验.上述步骤中的切音刺激未曾打乱,为了证实实验结果的可靠性,我们继续将两个说话人材料中‘球被定NNeJ'时间感知阈的那条曲线的切音刺激随机打乱(共8组),并使每个刺激在听辨中出现5次(即该组刺激数目增加了5倍),再进行听辨实验,每个刺激仍重复三次,由受试者做出强迫性选择.第一,二步实验的听辨受试者为7人,第三步实验的听辩受试者为10人,年龄在20一60岁之间,无听力疾病历史,均不了解实验目的.三、实验结果及讨论测得的15个人三合元音前三个共振峰模式见图1,该图较好地反映了四个三合元音的性质,为本研究提供了基本参考.由实验步骤2所得的结果可用立体图形表示(图2),z轴是归一化的时间轴,y轴为听辨,雾j雾:爹:‘爹兰三二:二萎毫≤二二蒌≤妄二二二。篓磊≤二围委耋量:≯‘j‘。蒺羹芒崴孛h图115个发音人的三合元音的共振峰模式●、”●表1五个说话人(爿,B,c,D,E)三合元音Tlim的长度及前(Tb)、后(Te)边界归一化值┏━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┳━━━━━━━━━━┓┃┃┃┃_┃┃┃┃10U。┃ iaO j。‘,┃Uel┃Ual┃┣━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━┫┃T1im.┃0.12l(40ms)┃0.11l(40ms)┃0.125(40ms)┃0.272(90ms)┃┃ATb┃0.194┃0.278┃O.186┃0.123┃┃Te┃0.397┃.0.389┃0.3ll。┃0.395┃┣━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━┫┃Tlim.┃0.256(90ms)┃0.139(50ms)┃0.1lo(40Ills)┃0.357(120ms、┃┃BTb┃0.169┃0.222┃0.163┃O.177┃┃Te┃0.425┃0.361┃0.273┃、0534┃┣━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━┫┃Tlim.┃0.162(50mS、┃0.19l(70ms)┃0.220(80ms)┃0.357(120ms)┃┃CTb┃0.192┃0.272┃0.275┃0.193┃┃Te┃0.420┃0.463┃0.550┃0.682┃┣━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━┫┃Tlim.┃0.23l(80mS)┃0.201(70ms)┃0.234(80m s)┃0·302(110ms)┃┃DTb┃0.172.┃0.229┃0.233┃0.163┃┃Te┃0.461┃0.486┃0.467┃0.52l┃┣━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━╋━━━━━━━━━━┫┃T1im.┃’0.150(40m s、┃0.154(50ms)┃0.169(60ms)┃0.315(120m s)┃┃ETb┃0.222┃0.308┃0.339┃0.156┃┃Te┃0.372┃0.462┃O.508┃0.47l┃┗━━━━━━┻━━━━━━━━━━┻━━━━━━━━━━┻━━━━━━━━━━┻━━━━━━━━━━┛应用声学蔓一鐾一蔓一连一图2 s个发音人材料的听辨实验结果 l//,轴:归一化的时间;Y轴:听辩正确率;#轴:感知窗口的大小.的正确率,g轴为时间窗口大小.由图2可直观地看出:最小时间感知阈Tlim的大小因不同三合元音而异,因人而异;其中心位置位于整个音节的前半部分:窗口越大,听辩的正确率越高,窗口增大到一定程度,听辩正确率达到稳定.‘为了提高实验的可靠性,我们采听辩正确率为85%时的窗长值为最小时间感知阅Tlim.图3给出5名发音人四类三合元音的共振峰轨迹,两条垂直线分别代表Tlim的前后边界,它们之间的距离大于或等于Tlim.表l是这5个发音人三合元音的Tlim归一化值(括号中为毫秒数)及前后边界的归一化值.图4为精细实验结果,横轴为音节的归一}%化时间轴,纵轴为听辨正确率.图中实线为次序打乱后的结果,虚线为次序未打乱的结果.显然,将刺激位于音节中的时间次序打乱对听辩是有影响的,使听辩正确率约下降10%--15%,但从整个曲线的形状来看,变化不大,因此可以证实由第二步实验得出的、关于最小时间感知阈的结果基本可靠.三合元音的理想结构是:前稳段+过渡1+中间准稳段+过渡2+后稳段.从15个人的语音材料来看,前稳和后稳段的长度是不等的,但听起来它们在音色上无差异,这说明三合元音的中间部分才是最重要的.最小时间感知阈Tlim肯定包括了位于中间的主要元音及其向两边的过度,否则无法感知到三合元音的色13卷2期 tI、、I{【 j一7I一、~一.一,一·+,.一一~…rt·,一一一一一一:-一·‘…}一,,。、~L一、L,卜 r7一一卜一—★f f f{,一i一一,’』一…rj{一’一“……一t一‘rI。…’…’F‘÷‘一‘…一’一爿…。‘!}、卜【071’/。1,十一·r-l:二_‘P‘十~一…。‘一·,}‘‘f r‘。‘。‘o’+。‘。f1’一。’一#一+一~一一斗一r~~一一十~;一. r一~7~一..^~~一一一、一一———-——·————————一。…一一-一一L—…一图35个发音人最小感知阈的大小及其位置(各音节长度已进行了归一化)彩.通过对Tlim这一时间轴上现象的研究,可以给出哪些是三合元音必不可少的信息.1.TUm的长度表2给出5个说话人的Tlim,均值及标准偏差,F检验的结果表明:四个三合元音的Tiim之间存在着差异(F(3,23)一12.870,P
上一篇:现代维吾尔语元音/i/的实验分析
下一篇:没有了