电话会议语音处理技术与音质的关系
与传统电话会议桥相比,通过IP网络承载语音时控制回声和延迟是Voip的技术关键。IP电话呼叫的媒体路径可用图6-1来表示,其中不包括PSTN或ISDN终端。当一个ISDN电话通过网关交互工作时,情况就要稍微复制一些,如图6-2所示。当网关接口连接一个模拟网络时,用户到网络的接口多数情况下只需两条线(输入和输出信号共用一对线),这时就需要四线/二线混合电路,如图6-3所示。在VOIP系统中,造成语音质量下降的因素是:
(1)IP网络的包丢失、延迟和抖动。会造成电话会议音质下降
(2)抖动缓冲所造成的端到端延迟和帧丢失。会造成电话会议延迟大。
(3)声音接口造成的声学回声。回声也是电话会议系统的重要考核指标。
电话网络对语音质量控制技术的有关内容在ITU建议中有完整的描述,这里主要讨论语音质量中影响终端用户感觉的不分,大多数情况在传统电路交换电话和当前IP电话中多是相同的。但是,IP电话网有一些特殊的因素,如长延迟、抖动和丢失,因此需要一个新的框架来评定语音质量。这一工作正在ESTI TIPHON(第5工作组)中进行研究。
1、电话网络中的回声
2、电话网络中最主要的回声是发话回声——它是发话方所通道的被延迟了的自己的语音。种种回声由受话方的电气回声或声学回声引起。如果发话方的回声被反射2词,他还会影响受话方。这是受话方会听到两次发话者的声音——先是一个大信号,然后是一个被长时间延迟的弱信号。这就是受话回声。
(1)混合回声
混合电路用于二/四线转换,在模拟电话会议桥中也很常见,如图6-4所示。其中,Zref用来匹配电话会议线路的特征阻抗,以便抑制发话回声,使发话方正在其受话器中几乎听不到自己的声音。
事实上,永远无法与二线线路的特征阻抗完全匹配,因此一部分输入信号就会回馈到输出信号上。这种寄生信号就是混合回声。一方面,它会造成信号在两个放大器中间循环,如果一路延迟在20ms左右,就会造成“教堂效果”。为了避免网络的不稳定性,造四线路径是哪个信号至少要降低6dB。另一方面,Zref 不匹配的电话会议将网络上所有的输入信号都反馈回去,那么线路另一方的发话者就会在一个往返时间之后听到她自己的声音。
在许多国家,传输网络完全由四线线路构成。二线与四线的变换只发生在本地交换机链接模拟电话的地方。因为交换机返回到电话的回声没有延迟,所以不会有影响。另一方面,有电话一端产生的回声通过网络返回到另一端电话就会立刻被注意到,其往返时间大约为50ms。
(2)声学回声
声学回声指的是设别的一部分声音信号回馈到同一身边的受话器中。常见的“免提电话”就是一种带有声学回声消除的扩音电话,而“会议电话”则是一种没有声学回声消除的扩音电话。常见的会议电话有宝利通的扩展型,标准型,soundstation2,八爪鱼会议话机,Meeteasy,Konftel、音络等多个品牌。
典型的声学回声相对于用麦克风讲话的人来说或者使用电话会议耦合器设备,是一种大约10-15dB以下的寄生信号,与混合回声类似。这种几倍的声学回声,如果它的延迟在29ms以下就不会引起人的注意;如果为40ms,那么线路另一端的的会议室听起来就像对方在井里讲话一样;如果往返时间超过40ms,情况则会更糟。
抑制声学噪音的一种简单方法是使用头戴耳机,但是如果使用适当的设备,即使是用免提电话也能将寄生回声的能量控制在发话方信号的45dB以下。ITU建议G.168中针对典型回声路径测试给出了一些建议指标。
回声消除器通常不可能同时消除声学回声和电气回声,因为声学回声的路径变化多端,因此对于合成的回声很难找出一种动态的适应方式。对于ITU的特殊回声消除器来说,G.168的性能可能就不够了。新词有一个新的建议G.168已经生效,而且有些已经被一些厂家实现。这个建议包括一些有用的内容,比如当检测到高速Modem的相位反转音时能够停止回声消除的能力。当前电话会议设备中的声学回声的典型衰减值是:扬声器电话为10-15dB;免提电话或有高质量听筒的电话为35-40dB。电话会议耦合器,音频处理器可以很好的消除电话会议的回声和啸叫,确保电话会议的语音质量清晰。系统稳定。