你的位置:首頁 > 互連技術 > 正文

炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵

發(fā)布時間:2023-11-29 責任編輯:lina

【導讀】聲音是人與人交戶的重要手段,在AI興起的現今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。


著名作家海倫·凱勒曾說過這樣一句話,“盲隔絕了人與物,聾隔絕了人與人。”可見聽力的重要性,由此可以看出,人的一生耳朵是最忙的感知系統(tǒng)之一。


聲音是人與人交戶的重要手段,在AI興起的現今,也是人與機器相互溝通的手段之一。從模擬階段的留聲機開始到現在,人類對于高清化、高保真的追求一刻沒有停歇過,也逐漸擺脫了線束的約束。對音頻來說,芯片至關重要,它既要擁有足夠的算力,也要擁有足夠低的功耗。


據SIG預測,到2027年藍牙音頻傳輸設備年出貨量將達18.4億臺,2023年~2027年的年復合增長率為6%,藍牙數據傳輸設備年度出貨量將達到18.7億臺,2023年~2027年的復合年增長率為11%。


ICCAD 2023上,炬芯科技股份有限公司董事長兼CEO周正宇博士博士分享了炬芯在AI大背景下,如何為音頻芯片提供更多創(chuàng)新。


20多年專注音頻領域


“炬芯的前身就是原來的炬力集成,我們在行業(yè)中做了20多年音頻,2005年炬力集成基于便攜式音頻在美國上市,2021年炬芯基于藍牙音頻在科創(chuàng)板上市。”周正宇博士這樣介紹道。


炬芯2023年半年報和官網顯示,其核心產品包括藍牙音頻SoC芯片、端側AI處理器芯片、便攜式音視頻SoC芯片三類。


藍牙音頻 SoC 芯片系列主要應用于藍牙音箱(含TWS音箱、智能藍牙音箱)、Soundbar、智能手表、藍牙耳機(含TWS耳機、開放式OWS耳機)、無線電競耳機等。


炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵


端側AI處理器芯片系列是基于端側的帶有人工智能加速器的 系統(tǒng)級音頻處理器,致力于提供智能物聯(lián)網AIoT端側低功耗算力的芯片平臺,也是炬芯主營的音頻產品和人工智能技術的重要結合點,可滿足市場未來日新月異的低功耗端側設備的人工智能應用需求。


炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵


便攜式音視頻SoC芯片系列是炬芯最早耕耘的、最成熟的產品線,全球市場占有率長期較高,搭載了公司長期積累的、較先進的低功耗音視頻處理技術。該系列芯片主要針對便攜式高品質音視頻編解碼類產品的應用。


炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵


具體從市場來看,炬芯在中高端品牌藍牙音箱市場份額明顯增長,下一步會通過產品持續(xù)迭代升級和優(yōu)化產品組合繼續(xù)提升在中高端品牌的滲透率;低延遲高音質市場從有線連接向無線連接轉換的趨勢,帶來了存量市場轉化和新增需求兩個機會,炬芯正在持續(xù)加大研發(fā)投入保持技術領先優(yōu)勢并與各大品牌廠商繼續(xù)保持緊密合作以把握這一波市場轉型機會;此外,在智能手表市場,炬芯對中國、歐美和印度市場做了均衡的布局和節(jié)奏把握,智能手表作為貼合人體重要的健康數據監(jiān)測產品,將持續(xù)深耕。


用存內計算創(chuàng)造更大算力和更低功耗


周正宇博士表示,過去以來,炬芯的芯片架構一般都是“CPU+DSP”的雙核架構,未來,AI時代,炬芯會在CPU和DSP的基礎上,從高端音頻芯片入手,整合低功耗 AI 加速引擎,逐步全面升級為 CPU+DSP+NPU(based MMSCIM)三核異構的AI SoC架構,為便攜式產品提供更大的算力。,最新一代基于MMSCIM的高端AI音頻芯片ATS286X,將會在明年將會Sample。


“算力和功耗是一對矛盾統(tǒng)一體?!敝苷畈┦空J為,如何在同樣的制程、同樣的架構、同樣的設計下,創(chuàng)造更大算力和更低功耗是AI時代的關鍵。


比如說,TWS耳機電池容量通常在35m~40mAh,典型平均工作電流約在5mA左右,也就是說,留給芯片的功耗預算只有20mA左右。再比如,智能手表典型電池容量在280~300mAh,典型工作電流在3mA上下,也就是說在4.3V鋰電池中,只有15mA左右的功耗,還包括ADC、DAC等器件,也就是說留給藍牙音頻芯片功耗只有10mW。


與之相悖的是,AI驅動下,未來算力需求越來越大,也就是說,對藍牙音頻芯片商來說,要在10mW的功耗預算下,打造200~500GOPS算力是很大難題。


AI主要以復雜矩陣運算來形成,而復雜的矩陣運算最主要的算力功耗都來自于乘累加運算,過去芯片普遍采用DSP處理音頻,突破的關鍵就在于突破馮諾范式的存儲墻和功耗墻,即存內計算,通俗解釋就是把計算和存儲放在一個房間里去,讓它們零距離溝通。


存內計算擁有許多不同介質,到底哪一種介質適合做存內計算?周正宇博士認為各個介質均有其特點,不論哪種路徑,最主要的問題就是寫入次數,假若AI需要做自適應或模型不斷更新,那么它在寫入多次之后就會報廢,所以這種介質不適合做自適應應用,類似于Transformer這一類擁有自學能力的模型。


對比來看,SRAM讀寫速度快,擁有無限次讀寫能力,不僅采用標準工藝制造,還可以集成在SoC內,但它的弱點是存儲密度低。不過,雖然如此,SRAM依舊是低功耗AI算力的首選。一方面,音頻只需要200~500GOPS的算力,而非幾十TOPS,密度低的缺陷因此而被規(guī)避,另一方面,標準的CMOS工藝不僅可以現在就能大規(guī)模量產,還可以集成在單芯片上跟隨制程工藝演進到2nm。加之無限次寫入,可以支持自適應計算,長遠來看,RL(強化學習)和ML(機器學習)可能也會為它帶來更多驚喜。


存內計算也擁有模擬和數?;旌蟽蓚€技術路徑,它們最大的差異主要在于運算用ADC+模擬電路實現的,還是基于數字電路實現。


炬芯科技選擇的是模數混合的存內計算,暫時命名為“Mixed-Mode SRAM based CIM”,簡稱MMSCIM,其優(yōu)勢是精度無限,可靠性和量產的一致性非常高,容易在制程上升級,容易提升速度或PPA。


目前,該芯片雖然還沒有進入量產階段,但進展非???。它在全矩陣運算情況下,未來22nm就有望達到每瓦7.8TOPS的能效比。值得一提的是,在12nm情況下,它就已經接近50TOPS,足以挑戰(zhàn)在10mW范圍內釋放200~500GOPS算力。


炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵


邊緣與AI融合,挑戰(zhàn)與機遇并存


在周正宇博士看來,未來端側也會實現像ChatGPT、Tranformoer或類似的功能,或許是手機,或者是手表,未來這些能力都能被人所觸及。就比如說,早年軟盤只有1.44MB的存儲空間,而現在TWS耳機中的存儲空間都超過了幾十兆。


端側是AI非常好的載體,以手表為例,它是唯一一個長時間佩戴且緊貼皮膚的裝置,因此,非常方便成為健康監(jiān)測裝置,隨著傳感器發(fā)展,心率、血壓信息都成為了可測量的數據。而最終,它會成為一個能夠隨時監(jiān)測健康狀態(tài)的能手。


把幾億人的信息全部送到云端處理顯然不現實,而當邊緣端擁有AI,把專業(yè)的醫(yī)學知識灌注給它,它就會像一個移動醫(yī)生一樣,隨時判斷心率、血氧變化是否健康。這就是邊緣AI的重要意義,這樣的例子在邊緣AI中不勝枚舉。


炬芯科技周正宇博士:存內計算是突破AI芯片算力和功耗矛盾的關鍵


當然,挑戰(zhàn)與機遇并存。對國產來說,在端側做AI挑戰(zhàn)有兩方面,一方面如何以更好的能效比、PPA來實現人工智能,另一方面則是在于芯片制造,如何利用主流制程做到先進制程的產品性能,這是國產芯片設計公司必須面對的挑戰(zhàn)。


自從ChatGPT問世,最大的變化是自學習和自適應,而在其中隱私是很大問題,未來端側也必然也要面對這樣的挑戰(zhàn)。


”我認為現在AI最缺乏的是生態(tài)?!笔聦嵣?,芯片行業(yè)大多情況都會把重點放在硬件設計,但實際上,一個行業(yè)必須擁有自己的生態(tài),國內更需要自己的生態(tài)。就比如說,TensorFlow與算力之前其實中間還間隔了很多層,或者說工具,如果能做好這一層,就能建設好更好的國產生態(tài)。炬芯也會持續(xù)深耕,為國產芯片與生態(tài)建設添磚加瓦。


免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。


推薦閱讀:

以工藝窗口建模探索路徑:使用虛擬制造評估先進DRAM電容器圖形化的工藝窗口

如何設計電池充電速度快4倍的安全可穿戴設備

電池冷卻系統(tǒng)對電動汽車如何重要?

如何為ADAS 域控制器構建多攝像頭視覺感知系統(tǒng)?

漫談QLC其二:扛起NAND家族重任,老四QLC




特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索
?

關閉

?

關閉