你的位置:首頁 > 傳感技術(shù) > 正文

低功耗語音識別技術(shù)應(yīng)該如何增加到電視遙控器中?

發(fā)布時間:2020-09-01 來源:Scott Haylock,QuickLogic的產(chǎn)品營銷總監(jiān) 責(zé)任編輯:lina

【導(dǎo)讀】虛擬助理被集成到家中更多的設(shè)備中,亞馬遜最近宣布,它將為Alexa推出包括耳塞、眼鏡和戒指在內(nèi)的多種新型設(shè)備,為消費者提供更多獲取信息的途徑。
 
虛擬助理被集成到家中更多的設(shè)備中,亞馬遜最近宣布,它將為Alexa推出包括耳塞、眼鏡和戒指在內(nèi)的多種新型設(shè)備,為消費者提供更多獲取信息的途徑。
 
在這些新的語音產(chǎn)品中反復(fù)出現(xiàn)的主題是無線和免提的,可輕松地連接到手機(jī)或其他主機(jī)上,并聆聽指令。其內(nèi)部技術(shù)是一個支持無線連接的藍(lán)牙射頻芯片組和運行喚醒字引擎(WWE)的專用嵌入式處理器來識別語音命令。
 
這種趨勢的另一個例子是,每一臺新的平板電視、機(jī)頂盒和媒體播放器都配備了遙控器,他們也將很快完全無線和免提。當(dāng)然,當(dāng)你想要語音控制的時候,很多人仍然會使用舊的紅外視線遙控模式或者按鍵對話,但這些都很快就過時了。用戶需要一個能無縫響應(yīng)命令的設(shè)備,而不是像對講機(jī)那樣必須按住通話鍵的設(shè)備。與最近亞馬遜的電子產(chǎn)品浪潮類似,下一代電視遙控器將是無線和免提的。
 
然而,遙控設(shè)計也帶來了一些獨特的挑戰(zhàn)。例如,遙控器通常不可充電;它們通常使用標(biāo)準(zhǔn)的AA電池。遙控器不僅需要在嘈雜的環(huán)境中表現(xiàn)良好,而且需要在距離你身體3到9英尺的地方,還可以將信息以無線方式即時傳輸?shù)街鳈C(jī)設(shè)備上(如電視)。
 
此外,消費者更喜歡使用不需要頻換更換的耐用電池,從本質(zhì)上講,遙控器的性能必須像亞馬遜Echo Dot一樣,但同時功耗還要比入耳式耳機(jī)更少。
 
設(shè)計功能強(qiáng)大、高效節(jié)能的遙控器是一個挑戰(zhàn),需要創(chuàng)新的藍(lán)牙解決方案和音頻處理解決方案,因為其中每一個改進(jìn)都會延長電池壽命。
 
使用藍(lán)牙5.0/LE解決了傳統(tǒng)紅外的幾個問題。首先,藍(lán)牙是一個符合標(biāo)準(zhǔn)的解決方案,因此設(shè)備很容易與現(xiàn)有的藍(lán)牙設(shè)備進(jìn)行通信。此外,藍(lán)牙5.0/LE提供了與WiFi設(shè)備相當(dāng)?shù)膫鬏敺秶?,這非常適合語音遙控器。傳統(tǒng)的藍(lán)牙解決方案已經(jīng)針對手機(jī)和筆記本電腦進(jìn)行了優(yōu)化,這些手機(jī)和筆記本電腦的電池容量更大,而且藍(lán)牙的功耗也沒有那么大。
 
Atmosic公司的創(chuàng)新解決方案,可以顯著降低5倍功耗,與競爭解決方案相比,電池壽命可延長3至5倍。
 
 
低功耗語音識別技術(shù)應(yīng)該如何增加到電視遙控器中?
 
除了極低功耗的藍(lán)牙設(shè)計外,還可以使用一個二次喚醒接收器,該接收器功耗可以更低(比標(biāo)準(zhǔn)接收器低20到50倍),使整個藍(lán)牙SoC進(jìn)入深度睡眠狀態(tài);該設(shè)備可以通過另一臺主機(jī)的特殊模式喚醒。我們不會在這里詳細(xì)介紹這項技術(shù),因為它只適用于少量的專用遙控器。
 
第三種低功耗技術(shù)是利用能量收集來獲取射頻無線能量以延長電池壽命。許多家庭和建筑物都有大量的射頻能量(通常在ISM波段),當(dāng)遙控器放在桌子上時,可以采集這些能量。根據(jù)能量水平,一個裝置可以獲得幾十微瓦的能量。最終目標(biāo)是在可能的情況下替代電池電源,將電池的壽命延長到幾年,而目前遙控器的壽命只有6到9個月。對于工業(yè)和特殊用途的遙控器,還可以使用其他能源技術(shù),如太陽能、熱能和運動能量收集。
 
如前所述,要實現(xiàn)真正的免提操作,遙控器必須同時像智能揚聲器一樣工作,但也要像入耳式耳機(jī)一樣節(jié)能。像QuickLogic這樣的公司已經(jīng)開發(fā)出高度優(yōu)化、超低功耗的配套器件來配合藍(lán)牙芯片組來應(yīng)對這一挑戰(zhàn)。
 
藍(lán)牙連接的語音遙控器基本上有三種模式:待機(jī)模式、喚醒詞檢測模式和數(shù)據(jù)傳輸模式,功耗也是逐步增加。
 
在待機(jī)狀態(tài)下,藍(lán)牙和伴生芯片處于休眠狀態(tài),等待周圍環(huán)境中的一些喚醒詞。實現(xiàn)這一點最節(jié)能的方法之一是使用Vesper的麥克風(fēng)喚醒聲音功能,該功能僅消耗10µA,等待環(huán)境聲超過預(yù)先配置的閾值。在一個典型的起居室用例中,系統(tǒng)在80%的時間內(nèi)處于這種模式。
 
一旦達(dá)到閾值水平,就會從麥克風(fēng)觸發(fā)一個中斷,并喚醒伴隨芯片;此時進(jìn)入喚醒字檢測模式。伴隨芯片的MCU可以啟動并運行WWE一段時間,以檢測關(guān)鍵字是否被說出。第三方解決方案(如Retune DSP的VoiceSpot WWE)可以在Cortex-M4上運行,只需使用一個麥克風(fēng),無需使用多麥克風(fēng)自適應(yīng)波束形成的計算密集型解決方案,而多麥克風(fēng)自適應(yīng)波束形成通常是中場(3到9英尺)語音識別所需的。
 
除了明顯的節(jié)省處理器資源外,從系統(tǒng)中減少每一個麥克風(fēng)還可節(jié)省400至650µA(有功功率)。如果檢測到喚醒字,它會中斷并喚醒藍(lán)牙芯片進(jìn)入數(shù)據(jù)傳輸模式。這是必要的,因為在喚醒字之后的用戶字需要以脈沖編碼調(diào)制(PCM)或壓縮數(shù)據(jù)的形式傳送到主機(jī)(如電視)。
 
如果沒有檢測到喚醒字,系統(tǒng)將恢復(fù)到初始待機(jī)模式。一些配套芯片,如QuickLogic的芯片,有專用的低功耗聲音檢測(LPSD)硬件,以降低喚醒字檢測模式中使用的平均系統(tǒng)功率。例如,有些風(fēng)扇聲音有一個高分貝聲壓,但顯然不是講話。LPSD硬件有足夠的智能來感知這一點,并忽略聲音,以避免不必要地運行WWE額外功耗。
 
藍(lán)牙5.0/LE非常適合數(shù)據(jù)傳輸模式,因為它可以在低功耗的按需數(shù)據(jù)包中傳輸數(shù)據(jù)。一個理想的伴侶應(yīng)該有足夠的存儲空間和處理能力,以便在將語音數(shù)據(jù)發(fā)送到藍(lán)牙設(shè)備之前對其進(jìn)行壓縮,一個典型的例子是運行Opus音頻編碼器。
 
作者:
Scott Haylock:QuickLogic的產(chǎn)品營銷總監(jiān)。他擁有超過20年的片上系統(tǒng)經(jīng)驗,并擁有密歇根州立大學(xué)的學(xué)士學(xué)位。
 
Srinivas Pattamatta:Atmosic Technologies業(yè)務(wù)開發(fā)的副總裁。他在無線和其他通信技術(shù)方面也有超過20年的經(jīng)驗。獲得俄勒岡州立大學(xué)電氣工程碩士學(xué)位和圣克拉拉大學(xué)工商管理碩士學(xué)位。
 
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請電話或者郵箱聯(lián)系小編進(jìn)行侵刪。
 
 
推薦閱讀:
2021寧波國際照明展覽會
ADI教你如何把PLL鎖定時間從4.5 ms 縮短到 360 μs?
如何使用重定時器和轉(zhuǎn)接驅(qū)動器保持以太網(wǎng)信號完整性?
Frontline推出InShop 先進(jìn)的工業(yè)4.0軟件解決方案,有效提升整個車間的制造品質(zhì)與產(chǎn)能 
致工程師系列之五:優(yōu)化寬禁帶材料器件的半橋和門驅(qū)動器設(shè)計
要采購麥克風(fēng)么,點這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉