KAY3700 语音工作站
KAY Multi-Speech 3700
Multi-Speech 3700是KAYPENTAX公司开发的语音信号分析和处理套装软件,九十年代后期以来,在嗓音病理学和声学语音学领域,这套软件享有盛誉。虽然近年来这套软件的版本没有更新,但是在语音信号分析和处理中,尤其是在多维嗓音信号分析和喉头仪信号分析中,这套软件仍有不可替代的独特应用价值。
Multi-Speech 3700几乎可以完成任何语音信号的分析处理任务,包括:(1)声音信号的录制、编辑、播放;(2)声音信号的时域和频域分析,如:线性预测编码(LPC)分析、快速傅里叶变换(FFT)、倒谱(Cepstrum)分析、共振峰(FMT)分析等;(3)语音标注IPA转写。此外,该软件有多个功能选件,可以进行多维嗓音分析,喉头仪信号分析,呼吸、发声和韵律模拟,言语发音的肌肉运动模拟。该软件可以编写宏代码,让程序自动完成各种处理任务。
该软件还包括语音数据库和动态腭位数据库,目前我们实验室已经拥有三四十种世界各语言的语音数据库,下图是语音数据库功能窗口。
下图是一段语音信号的波形、频谱、共振峰和LPC。
Multi-Dimensional Voice Program选件窗口
上图,主窗口是多维嗓音分析功能界面,各子窗口,A窗口中是后低元音持续发音信号波形,B窗口中是基频和振幅,C窗口中是长时平均频率谱,D窗口中是基频和振幅的调制成分,E窗口中是基频条形图,F窗口中是振幅条形图,G窗口中是多维嗓音径向图,内圆是初值,外圆是常模,实际参数值分布在从内向外的矢径上,如果低于常模用橄榄色填充,高于常模用红色填充。这些参数反映了基频抖动(Jitter)、振幅抖动(Shimmer)等信息。
我们还可以应用这套软件里的Real-Time EGG Analysis选件,分析喉头仪采集的信号,研究声带振动规律。下图显示了EGG信号波形,运用Rothenberg提出的尺度法,做出了标记。两条纵向红线标示出一个EGG信号周期,中间的横向蓝线表示EGG信号中声门接触商的分子,绿线表示EGG信号中声门接触商的分母。
语音分析软件:主要可进行语音分析和声学参数的提取,包括:三维语图、功率谱、线性预测分析、共振峰提取、倒谱分析、基频检测、能量分析等。