高效能運算當道 低功耗設計為虎添翼

圖一 : 低功耗設計往往都是能否降低發熱量的重要關鍵。
圖一 : 低功耗設計往往都是能否降低發熱量的重要關鍵。

【作者: 王岫晨】

無論行動裝置或者工業生產設備,一致的發展趨勢都是高效能運算。

但高效能運算能否再往更高的目標發展,取決於能否有效降低功耗。

功耗增加會影響散熱成本與電池續航力,嚴重更將影響使用者經驗。

從隨身行動裝置到工業生產設備,高效能的運算技術已經普遍應用於生活中的各個層面。而在追求高效能運算的背後,低功耗設計往往卻是能否降低發熱量的重要關鍵。目前無論是隨身行動裝置、工業生產設備,或者任何介於兩者之間的裝置,其一致的發展趨勢都是『高效能運算』,亦即數據吞吐量更大、運算更快、判斷越來越正確、反應更即時等。但同時,高效能運算也代表更高的功耗。因此高效能運算能否再往更高的目標發展,在5G時代實現AI Everywhere的願景,取決於能否有效而顯著的降低功耗。

事實上,高效能運算的應用在不同裝置與應用場景上,不外乎以電池供應電源或者接市電,因此對功耗增加的忍受度不同。功耗增加對工業應用帶來的是電費及散熱成本增加,對行動裝置來說其衝擊則表現在電池使用的時限上,電池續航力不足,將影響使用者經驗,例如智慧手機就是一個最好的例子。

低功耗設計的重要性

由於人工智慧物聯網等高效能運算技術,得益於神經網路技術的進步,機器學習不再侷限於超級電腦的世界了。如今智慧型手機應用處理器可以執行AI推論,用於實現影像處理和其他複雜的功能。這些邊緣運算裝置有許多是採用電池供電,因此對於系統的功耗有很高的要求,用來延長系統的工作時間。

對現今許多設計而言,功耗是選擇元件最重要的標準,因為可攜式產品的電池壽命越長,對消費者越有吸引力。在基礎設備應用中,低功耗也是一項重要規格,因為較低功耗代表晶片將產生較少熱量,過高的熱量可能會限制系統產品的通道密度,或使得設計團隊無法增加新的功能。此外,有些較著重電源成本的設計,例如以通用序列匯流排(USB)供電的產品,或由汽車電瓶供電的汽車修配零件產品等,其電力預算亦相對有限。

以恩智浦半導體(NXP)為例,其在打造更低功耗的運算解決方案時,除了在晶片設計上有許多創新,電源管理軟體的精密度亦大幅提升外,晶片製程方面也採用更先進製程生產。目標是讓系統設計人員不用於設計系統時為任一項功能遷就妥協。然而,沒有裝置十全十美,設計人員必須仔細考量系統需求,檢視目前不斷推出的低功耗處理器,以了解哪一項產品最符合應用需求。

低功耗運算關鍵需求

Arm主任應用工程師張維良指出,降低功耗的方式除了透過半導體製程之外,也可以透過IP本身設計達到降低平均功耗的效果。若以Arm的Cortex-M系列處理器為例,原本就針對嵌入式系統設計一系列低功耗運算技術,包括Multiple Power Domain支援架構級的Sleep Mode、Wake-up中斷控制器、架構級Power Gating技術。此外Cortex-M0+額外優化減少了程序存取,來保持系統層級的低功耗。

除了過往Cortex-M處理器針對低功耗技術來設計,Arm在新款的Cortex-M55處理器上,也針對高效能低功耗運算打造了一個ML引擎,這個名為Helium的向量運算引擎(MVE)可以有效率的降低運算與功耗比,意即Helium能在單位時間內處理約15倍以往Cortex-M系列的ML運算能力,但是功耗方面只略微增加幾成。透過Cortex-M55搭配Helium技術能更符合IoT裝置搭載AI運算的需求。

運算效能與低功耗的平衡點

對現今許多設計而言,功耗是選擇元件最重要的標準,因為可攜式產品的電池壽命越長,對消費者越有吸引力。

在半導體業界中,經常會提到PPA(power、performance、area),三者互為影響。高運算效能(Performance)通常代表需要的面積(Area)要增加,面積增加相較之下其功耗(Power)也會增加,通常面積與功耗都會以正比的比例來增加或減少,這三個元素很難面面俱到。因此需要透過架構設計來解決這些挑戰,如此就可以不必在追求高效能的同時,還必須對於面積與功耗方面妥協。在實際的設計上,可以參考下列的一些案例。

優化每單位面積的效能:

在面積高度受限的前提下,就該思考如何增加每單位面積的效能密度。例如在M55上引進的Helium向量處理器即是透過架構上的改變,用增加不到一單位功耗的單位,來換取十多倍的效能提升。

搭配NPU大幅提升運算效能:

以ML在IoT的運算方面,Arm研發了另一個利器,即用來搭配Cortex-M的類神經網路處理器(NPU)Ethos-U55。類神經網路處理器是一款專用於ML運算的加速器,Ehtos-U55的面積與Cortex-M55相近,但是提供的是相較於Cortex-M55有32倍ML效能上的提升,透過這類架構上的變革帶給AIoT應用更多的可能性。

電源控制設計:

以多重電壓域設計(Multiple Power Domain),設定不同指令啟動不同的功能框(Functional Block),例如P-Channel控制Core的電源,以Q-Channel 控制Cluster的電源,或者以非同步設計與FMA,調配頂層與核心的用電,以節省電力的消耗。

圖二 : 要降低整體發熱,異質運算多核心處理器以及記憶體等的配置也至關重要。
圖二 : 要降低整體發熱,異質運算多核心處理器以及記憶體等的配置也至關重要。

至於恩智浦,很早就預見到運用最新應用處理器架構和設計理念來製造高效能跨界處理器需求。2017年推出i.MX RT系列跨界處理器,兼顧功耗與性能。如今,不只推出i.MX RT1170突破GHz主頻限制,為更多應用開啟邊緣運算的大門。

恩智浦在近期也發表eIQ機器學習(ML)軟體對Glow神經網路(Neural Network;NN)編譯器的支援功能,針對恩智浦的i.MX RT跨界處理器,實現佔用較低記憶體並更高效能的神經網路編譯器應用。Glow編譯器由Facebook開發,能整合特定目標的最佳化,恩智浦利用這種能力,使用適用於Arm Cortex-M核心和Cadence Tensilica HiFi 4 DSP的神經網路運算元庫(NN operator libraries),最大化提升處理器的推論效能。

低功耗設計考量

以Cortex-M55為例,Arm的架構設計還考量了以下幾個因素:

‧ Designed for efficient compute:以最優功耗效率為設計前提;

‧ Increased DSP/ML performance:提升數位訊號處理器(DSP)及機器學習的表現;

‧ Incremental scalar performance:增進純量效能;

‧ Advanced power management:更先進的電源管理方式;

‧ Robust security with TrustZone:以TrustZone架構的安全防護;

‧ Additional features for advanced debug: 更先進的偵錯工具。

要降低整體晶片發熱,除了晶片的低功耗設計之外,異質運算多核心處理器以及記憶體等的配置至關重要。

2020年9月(第347期)晶片熱掰掰!
2020年9月(第347期)晶片熱掰掰!

【欲閱讀更豐富的內容,請參閱CTIMES雜誌 2020 年第 347 期9 月號】

**刊頭圖(source:pxhere.com)

相關新聞

高效能運算當道 低功耗設計為虎添翼

導熱大作戰! 說起來簡單,做起來卻不容易。 一方面要透過物理散熱機制, 盡可能把晶片廢熱往外排出; 一方面要透過低功耗電路設計, 讓晶片盡可能減少熱的生成。 在追求更高運算效能的AI年代, 功耗增加會影響散熱成本與電池續航力, 嚴重更將影響使用者經驗。 因此,導熱作戰, 只能成功,不許失敗!

以人為本的智慧空間開發

導熱大作戰! 說起來簡單,做起來卻不容易。 一方面要透過物理散熱機制, 盡可能把晶片廢熱往外排出; 一方面要透過低功耗電路設計, 讓晶片盡可能減少熱的生成。 在追求更高運算效能的AI年代, 功耗增加會影響散熱成本與電池續航力, 嚴重更將影響使用者經驗。 因此,導熱作戰, 只能成功,不許失敗!

熱門新聞

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。