作者:武亭、徐德帥
在日常生活中,聲音是人們進行信息傳遞的重要媒介,為了保證信息的順利傳遞,突破距離的限制,往往需要對聲音信號進行放大,擴音系統(tǒng)應運而生。
擴音系統(tǒng)是指把聲音信號進行實時放大的系統(tǒng),主要由麥克風、放大器以及揚聲器組成,在演奏廳,大教室,會議室等大空間場所得到了廣泛應用。但是,擴音系統(tǒng)自使用以來,常常伴隨著嘯叫問題,極大地影響了用戶的使用體驗感。嘯叫現(xiàn)象是指音頻信號通過揚聲器播放后,經(jīng)過一定的傳播路徑,再次被麥克風拾取,經(jīng)過放大器的處理后,最后經(jīng)由揚聲器播放,倘若在 “揚聲器-麥克風-揚聲器”的閉環(huán)電路中,存在某種正反饋導致某些音頻頻率發(fā)生自激振蕩,就會產(chǎn)生嘯叫現(xiàn)象。
嘯叫的產(chǎn)生會掩蓋正常語音,給人的聽感也不好,而且嘯叫頻點能量很高,嚴重時甚至能破壞會議中的擴聲設備,因此我們需要對嘯叫進行抑制。
我們以單通道擴聲系統(tǒng)為例說明嘯叫產(chǎn)生原理,系統(tǒng)模型如下所示:
該擴聲系統(tǒng)由麥克風、功率放大器和揚聲器組成,其中G是功率放大器,F(xiàn)是聲傳播路徑,v(t)和x(t)分別為聲源信號和反饋信號,y(t)是麥克風的輸入信號,u(t)是經(jīng)過功率放大器處理后的聲信號。
根據(jù)奈奎斯特穩(wěn)定準則,當閉環(huán)系統(tǒng)的某個角頻率w的回路響應的幅度和相位同時滿足以下兩個條件時,就會引起系統(tǒng)的不穩(wěn)定,從而引起嘯叫。
其中G(w)為放大器的頻率響應,F(xiàn)(w)為聲傳播路徑的頻率響應。總的來說,產(chǎn)生嘯叫必須同時滿足振幅條件:反饋增益大于1。相位條件:聲源信號的相位和反饋信號的相位是相同的。因此嘯叫抑制技術實際上就是破壞嘯叫產(chǎn)生的幅度要求或者相位要求。
研究人員針對嘯叫抑制主要提出了兩大類方法,被動抑制的方法和主動控制的方法。
被動抑制嘯叫的原理是減少直達和反射聲,我們可以根據(jù)聲場特性,從聲場布局、聲場調(diào)整、擴音系統(tǒng)設計、擴音設備選型等方向抑制嘯叫。主要包括:
(1)從室內(nèi)建筑聲學、如室內(nèi)的裝修,裝修材料的選擇等方向來抑制嘯叫,具體的方法諸如:擺放更多的桌椅,安裝天花石膏吊頂,選擇吸聲材料作為裝修材料等等。
(2)合理地擺放麥克風和揚聲器:將麥克風和揚聲器置于不同的聲場顯然是最好的方法,可以破壞正反饋,避免嘯叫,但這種方法難以實現(xiàn)。因此我們可通過選擇合適的麥克風和揚聲器的擺放位置來抑制嘯叫,如讓麥克風盡量不要正對揚聲器。
(3)選擇合適的擴聲設備,如盡量選用低敏感度、高指向性的麥克風。
但是,這種方法只是被動地抑制嘯叫,造價和施工難度太大,不具有普遍推廣意義。
相較于被動抑制嘯叫的方法,主動控制嘯叫的方法利用數(shù)字設備進行實現(xiàn),造價低,可復制,能夠普遍推廣。傳統(tǒng)且主流的主動控制方法有三種,分別為相位調(diào)制法、增益控制法和自適應反饋抵消法。
相位調(diào)制法
相位調(diào)制法,簡單來說就是移頻法和移相法,移頻法和移相法進行嘯叫抑制的原理是把輸入信號的頻率分量往前或者往后移動,使得輸入信號與聲反饋信號頻率之間的疊加現(xiàn)象消失,或者使聲反饋相位和輸入信號的相位產(chǎn)生偏差,破壞了嘯叫形成的相位條件,從而達到抑制嘯叫的目的。該方法算法簡單,且對擴聲系統(tǒng)增益有明顯提升,可以快速實現(xiàn)嘯叫抑制,但是對輸入信號進行移頻或者移相的操作,對信號的音質(zhì)損失很大,會導致聲信號的音質(zhì)效果變差。
增益控制法
增益控制法通過降低正反饋環(huán)路中的增益,破壞了嘯叫形成的幅值條件,達到嘯叫抑制的效果。根據(jù)需要增益值降低的頻帶寬度的范圍,增益控制法分為三類,自動增益控制法(AGC),自動均衡法(AEQ)和基于陷波濾波器的嘯叫抑制法(NHS)。當需要將系統(tǒng)增益降低時,AGC會在信號的整個頻帶范圍內(nèi)降低增益,有些沒產(chǎn)生嘯叫的頻點幅值也會被降低。AEQ會把聲音信號分為幾個頻段,將嘯叫頻點對應的頻段進行增益衰減,整體受影響不大。而NHS是在特定的頻率點進行增益控制,采用陷波濾波器的嘯叫抑制法只對自激振蕩的頻率點附近進行增益控制,在嘯叫頻率點檢測準確的情況下,對附近頻率的幅值影響比其它兩種方法小,并且計算復雜度低。
自適應反饋抵消法
自適應反饋抵消法(AFC)根據(jù)輸入信號,對聲傳播路徑進行建模識別,從而估計得到聲反饋信號,最后在麥克風的輸入信號中減去估計出的聲反饋信號,從而實現(xiàn)嘯叫抑制。目前AFC的關鍵在于自適應算法的選擇,應用較為普遍的是最小均方誤差算法(LMS)。理論上如果可以精確地估計出聲傳播路徑,AFC可以完全地消除嘯叫。但是揚聲器信號和麥克風信號一般具有一定的相關性,會造成一些估計誤差,利用噪聲信號法、非線性處理法等去相關技術可降低兩種信號的相關性,但是去相關技術會導致一定的聲信號失真,因此需要根據(jù)實際使用場景在去相關和音質(zhì)之間做一個權衡。
近年來隨著深度學習的發(fā)展,研究人員提出了基于深度學習的嘯叫抑制解決方案,這類算法包含三個部分,特征提取,學習模型和訓練目標。通過把嘯叫信號和純凈語音信號混合得到的聲信號作為訓練樣本,最終訓練出能夠抑制嘯叫的網(wǎng)絡模型。利用深度學習進行嘯叫抑制的處理步驟通常是首先獲得摻雜嘯叫信號的混合聲信號作為輸入數(shù)據(jù),再對混合聲信號提取語音特征,根據(jù)期望聲信號的不同提取不同的特征,常用的特征有時頻特征、頻譜、梅爾倒譜(MFCC)、Gamma倒譜(GFCC)等特征,之后建立網(wǎng)絡模型,網(wǎng)絡模型通常是RNN系列的模型及其變種,例如LSTM、GRU等。最后對網(wǎng)絡模型進行訓練得到一個可以將混合聲信號映射為純凈語音信號的網(wǎng)絡模型。目前,利用深度學習進行嘯叫抑制的技術正在快速發(fā)展,希望在抑制嘯叫方面能夠達到更好的效果。
總的來說,傳統(tǒng)方法和基于深度學習的嘯叫抑制方法各有優(yōu)缺點,我們需要根據(jù)實際應用場景來選擇最合適的方法。