你的位置:首頁 > 測試測量 > 正文

降低移動電話非穩(wěn)態(tài)噪聲的九個方法

發(fā)布時間:2012-11-15 責(zé)任編輯:rexliu

【導(dǎo)讀】語音質(zhì)量對于移動電話用戶來說很重要,影響語音質(zhì)量的一個主要因素是環(huán)境噪聲,因此任何抑制噪聲的方法對于手機(jī)制造商來說都是一個實(shí)現(xiàn)差異化的機(jī)會。

移動運(yùn)營商明白語音質(zhì)量對于用戶來說很重要,影響語音質(zhì)量的一個主要因素是環(huán)境噪聲,因此任何抑制噪聲的方法對于手機(jī)制造商來說都是一個實(shí)現(xiàn)差異化的機(jī)會。不過,噪聲抑制技術(shù)還只專注于降低緩慢變化的穩(wěn)態(tài)噪聲源,而很多非穩(wěn)態(tài)噪聲源為快速變化的,因此不能被抑制。

抑制非穩(wěn)態(tài)噪聲對用戶和運(yùn)營商都有很大的好處:用戶可以在任何時候和任何地點(diǎn)自由清楚地通話,可以在嘈雜的環(huán)境中低聲說話以保護(hù)其隱私,不會被要求離開重要的電話會議。運(yùn)營商會看到丟失用戶的數(shù)量降低,增加通話時間,而且更有效地使用網(wǎng)絡(luò)帶寬,并大大地節(jié)省投資和運(yùn)營成本。
在采用瞬時非穩(wěn)態(tài)噪聲抑制技術(shù)前后的時域波形
圖1. 在采用瞬時非穩(wěn)態(tài)噪聲抑制技術(shù)前后的時域波形

1.理解穩(wěn)態(tài)和非穩(wěn)態(tài)噪聲之間的差異

由于其相對穩(wěn)定的特性—例如嘈雜的鼓風(fēng)機(jī)環(huán)境中,穩(wěn)態(tài)噪聲可以很容易地被識別,能用傳統(tǒng)的新好處理方法輕易地去除。相反,非穩(wěn)態(tài)噪聲具有快速或隨即的變化,例如一個人的說話聲、背景音樂或按鍵音。當(dāng)非穩(wěn)態(tài)噪聲被作為噪聲識別的時候,這些噪聲實(shí)際上已經(jīng)通過,因此需要更成熟的噪聲抑制方法。

2.使用兩個麥克風(fēng)來改善對聽覺現(xiàn)場的理解

下一代噪聲抑制技術(shù),例如聽覺場分析(ASA)、波束成形(BF)和盲源隔離(BSS)使用幾個麥克風(fēng)來更準(zhǔn)確地識別、定位以及噪聲源分組,準(zhǔn)確性比單個麥克風(fēng)更高。當(dāng)今的手機(jī)制造商已經(jīng)意識到這種趨勢,在手機(jī)的架構(gòu)中引入了第二個麥克風(fēng)。

3. 利用分組原理來分隔聲音點(diǎn)

分組方法簡化了噪聲抑制,同時還能確定非穩(wěn)態(tài)噪聲源。例如聽覺場分析(ASA)使用人的聽覺通道作為一個模型,按照人實(shí)際對某個聲音的聽覺來處理噪聲。通過多聲學(xué)能量進(jìn)行分組來重新產(chǎn)生原來的聲音,ASA實(shí)現(xiàn)了來自多個源的準(zhǔn)確分組,同時避免任何聽覺上應(yīng)該分開的聲音被混合在一起。分組原理可以被大致描述為連續(xù)的(在一段時間內(nèi)發(fā)生的)和同時的(在一段頻率內(nèi))。

4.使用多個線索來分組,否則難以正確地對聲音進(jìn)行分組

每一個分組線索都有局限性。使用多個線索能對難以分析的聲音進(jìn)行正確的分組。某些重要的線索包括:

· 聲音的特性:一個音源產(chǎn)生的諧波可以形成清楚的頻率圖,這個頻率圖可以用來對兩個聲音進(jìn)行區(qū)分。聲音特性是區(qū)分男人和女人的一個主要線索。

· 空間信息:由距離和方向判斷出來的距離可以用來對聲音分組,因而可以對感興趣的聲音進(jìn)行分辨。

· 發(fā)出時間:如果兩個聲音能量和他們對應(yīng)的諧波在時間上一致,他們很可能來自同一個音源。

5.減少收斂時間以消除更多的瞬間噪聲


傳統(tǒng)的噪聲抑制方法必須在他們消除噪聲之前收斂,因而他們在抑制非穩(wěn)態(tài)噪聲源上效率較低。通過利用快速響應(yīng)的線索來對聲音進(jìn)行描述,像打響指這樣的瞬間時間都可以被識別并消除。

6.采用對數(shù)與線性頻率比例(FCT vs. FFT)


熟悉的快速傅立葉變換(FFT)對頻率分量按線性比例進(jìn)行分解,這樣限制了在低頻處的頻譜分辨率,而且使用很定的幀大小和獨(dú)立于頻率的帶寬。相反的,快速耳蝸?zhàn)儞Q(FCT)基于人耳蝸的原理,按對數(shù)頻率比例變化。這樣一來,它不會限制頻譜分辨率。通過不斷的處理,而不是按幀進(jìn)行處理,F(xiàn)CT還降低了處理延遲,因此它適合于識別非穩(wěn)態(tài)的噪聲源。此外,F(xiàn)CT工作的帶寬是與頻率相關(guān)的,在人耳聽覺范圍內(nèi)能更準(zhǔn)確地匹配時域-頻域折衷。

7.使用全向麥克風(fēng)來降低成本

像波束成形這類方法需要一種專門的心型曲線式(cardioid,單向)麥克風(fēng)。這種麥克風(fēng)的成本比全向麥克風(fēng)成本更高,具有更低的噪聲容限,必須進(jìn)行單獨(dú)的校準(zhǔn)和匹配,誤差要低于1dB,帶來對間隔的限制,由于對風(fēng)聲和呼吸聲很敏感,因此會增加+12dB的噪聲。波束成形技術(shù)也有其局限性,對所關(guān)注的波束的任何錯誤選擇都會被錯誤地傳遞。對一個系統(tǒng)所需要的麥克風(fēng)的數(shù)量的管理也很重要。例如,盲源分離(Blind Source Separation)使用一種簡單的線性非混合方法,在麥克風(fēng)的數(shù)量與音源的數(shù)量一樣多的條件下,這種方法效果非常理想。

8.將回聲作為獨(dú)立的音源來處理


一直以來,人們利用回波消除方法來消除回聲。這種方法的運(yùn)算量非常大,因?yàn)楸仨氂?jì)算回波反射,在噪聲源變化很快的時候,其性能很差。分組線索使我們能將會波作為另外一種噪聲源。由于回波既不需要進(jìn)行計(jì)算,而且不會改變路徑,因此可以進(jìn)行瞬間抑制,能實(shí)現(xiàn)高達(dá)46dB的回波噪聲抑制性能。

9.采用新的測試標(biāo)準(zhǔn)

移動通信行業(yè)不斷地推進(jìn)測試標(biāo)準(zhǔn)來表現(xiàn)出通過在噪聲抑制技術(shù)上的創(chuàng)新實(shí)現(xiàn)更高的語音質(zhì)量等級。為了保證他們的產(chǎn)品獲得最佳的質(zhì)量,該行業(yè)最近修正了ITU P.835規(guī)范來提供一致的測試方法,對采用了噪聲抑制技術(shù)的語音質(zhì)量進(jìn)行測試并產(chǎn)生測試報告。
要采購麥克風(fēng)么,點(diǎn)這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉