Analog Devices

【應用筆記】瞬態對 AI 加速卡供電的影響

摘要

圖形處理單元(GPU)、張量處理單元(TPU)以及其他類型的特殊應用積體電路(ASIC)透過並行處理能力提供高效能運算,以加速人工智慧(AI)訓練與推論工作負載。

 

AI 需要大量的運算能力,特別是在學習與推論過程中,這不斷推動電源供應網路的需求達到前所未見的水準。隨著高密度工作負載的日益複雜,其瞬態電流需求亦大幅提升,使得整個電源分配網路必須發揮最大效能。AI 加速卡的嚴苛電源需求已對系統效能產生影響。在本文章中,我們將探討 AI 加速卡的電源分配網路需求,剖析瞬態對其影響,並介紹 Analog Devices 的多相供電解決方案如何滿足這些需求。

前言

AI 正在革新運算架構,以模擬人類大腦的神經網路。雖然 AI 似乎已無所不在,但實際上推動 AI 發展的技術仍在不斷進步。專為 AI 計算設計的處理加速 IC 包括圖形處理單元(GPU)、現場可程式邏輯閘陣列(FPGA)、張量處理單元(TPU)及其他類型的特殊應用積體電路(ASIC)。在本文章中,我們將統稱這些元件為 xPU。

 

隨著 AI 技術的應用不斷擴展,資料中心將持續大量採購 AI 加速卡。根據 Gartner 的數據,AI 晶片市場在 2021 年的總營收已超過 340 億美元,預計在 2026 年將成長至 860 億美元¹。相較於傳統的中央處理器(CPU),xPU 透過大規模並行運算架構提供 AI 計算的巨大效能提升。由於其擁有大量小型運算核心,xPU 特別適用於 AI 工作負載,能夠有效支援神經網路訓練與 AI 推論。然而,xPU 在 AI 計算與數據傳輸過程中通常需要相當高的功耗。簡單來說,xPU 是極度耗電的 IC,其嚴苛的電源需求正在對 AI 加速卡提出新的挑戰,進而影響整體系統效能。

 

在本文章中,我們將探討 AI 加速卡的電源供應網路需求,並介紹 ADI(Analog Devices)的多相供電解決方案,如何滿足這些嚴苛的電源要求。

AI 帶來的電源供應挑戰

AI 擁有許多優勢,但「節能高效」並非其中之一。當 AI 運行時,尤其是在處理深度學習與推論等 AI 工作負載時,需要極高的計算能力。在系統層級,AI 加速器在提供近乎即時的運算結果方面扮演關鍵角色,使其成為不可或缺的技術。

 

所有 xPU 都具備多個高效能核心,由數十億個電晶體構成,並消耗數百安培的電流。此外,這些 xPU 的核心電壓(VCORE)已降低至 1.0V 以下的水平。圖 1 顯示了一個 AI 加速卡的通用框圖。本文章將重點探討適用於此類系統的多相控制器及其對應的電源級 IC 解決方案。

圖 1:通用 AI 加速卡的方塊圖

AI 加速卡所承受的峰值電流密度已超過一般主機板的負載能力。由於 AI 工作負載高度動態變化,且瞬時電流變化極為劇烈,導致 di/dt 值極高,並產生持續數微秒的電壓尖峰,這些變化不僅會造成系統干擾,甚至可能損害 xPU。

 

在 AI 工作負載持續運行期間,去耦電容無法長時間提供足夠的能量來滿足瞬時需求。因此,下一節將介紹 ADI 的多相負載點(PoL)供電解決方案,如何有效消除 AI 加速卡瞬態電流對電源分配網路造成的壓力。然而,在此之前,我們將先探討 AI 帶來的電源設計挑戰。

AI 帶來全新的電源設計挑戰

AI 的電源需求目前遠遠超過傳統電源供應網路的負載能力。xPU 的電壓調節器(VR)需求與標準的負載點(PoL)調節器截然不同。業界已出現某些應用場景,需要在低於 1V 的電壓下提供超過 1000A 的電流給 xPU。

 

確保電源供應穩定、低噪聲,並完全消除電壓瞬變至關重要,因為電壓瞬變可能導致 xPU 內部錯誤觸發。在設計高效能 AI 加速卡的 VR PoL 時,必須滿足極端電流需求並符合多項關鍵要求。

電壓尖峰與瞬態管理

AI 加速卡的一項關鍵需求是確保 VR(電壓調節器)架構能夠提供卓越的瞬態電壓管理。對任何系統來說,穩定提供數千瓦的功率都是一大挑戰。VR 的輸出電壓必須符合容差範圍,並確保紋波與負載瞬態的電壓變動維持在 xPU 的最低電壓之上,以避免系統當機,同時也不能超過 xPU 的最高電壓,以防止元件損壞。

 

AI 加速卡的瞬時功率尖峰可能超過最大熱功率目標的兩倍甚至更多,因此 PoL(負載點)電源回路的頻寬必須足夠靈活,以應對快速變化的瞬態電流。頻寬越高,回應速度越快,電壓偏移也越小。

 

提升瞬態響應速度最直接的方法之一是選擇具備高速瞬態性能的電壓調節器。ADI 的 AI VCORE 系列 IC 具備極低頻率輸出噪聲、快速瞬態響應與高效率,並支援負載線調節(Load Line Support),能有效幫助電源設計工程師管理 AI 工作負載帶來的瞬態電壓與功率尖峰。

長距離電源路徑的 I²R 損耗與散熱管理

隨著 AI xPU 處理器的電流需求持續攀升,PoL(負載點)供電方案的電力密度已成為關鍵因素。要可靠地將電力供應至 xPU 的每個部分,必須考量熱能散佈對晶片可靠性的影響,否則可能導致熱失控(Thermal Runaway)。換言之,散熱管理已成為設計高功率供應系統時面臨的重大挑戰之一。

 

傳統的電源供應方式通常將電壓調節器(VR)設置在 xPU 側邊,並透過 PCB(印刷電路板)上的電源路徑將電力橫向傳輸至處理器。然而,即使是極小的線路阻抗,都可能導致不可接受的電壓降(I²R 損耗)。隨著 xPU 的電流增加,PCB 電源層的電壓降也會相應提升。在 VR 與 BGA(球柵陣列)封裝接腳之間,短短幾公分的 PCB 電源走線便可能產生顯著的能量損耗。這類 PCB 銅箔電源層的損耗,已成為決定電壓調節器設計效率與性能的主要因素之一。

 

透過使用單片式(Monolithic)功率級 IC,將電流與溫度感測電路整合於單一晶片中,可大幅減少 PCB 上高電流走線的需求,進而取代傳統的三晶片(離散式)電源供應方案,提升整體效率與熱管理效能。

ADI 價值主張:MAX16602 + MAX20790 + 耦合電感器

AI 電壓調節器的精確度要求已變得更加嚴格,效率和體積成為設計的主要優先考量。性能和功率損耗也受到密切監控。如前所述,解決 AI 加速卡 VR 設計問題已成為一項艱鉅的任務。設計師深知,當電流需求大幅波動時,若不處理不必要的瞬態效應,是無法滿足需求的。解決這些瞬態效應也需要某種高精度動態電壓定位或負載線方案。

 

ADI 在 AI 市場的投入相當深厚,並提供一整套解決方案,涵蓋 48V 和 12V 系統。本節將介紹 ADI 的 AI 多相電源晶片組,包括 MAX16602 多相控制器和 MAX20790 電源階段,並搭配我們的專利耦合電感器(CL)技術,協助解決 AI PoL 設計挑戰。圖 2 顯示了 MAX16602、MAX20790 和 CL 的高層方塊圖,該設計為 8 相 MAX16602CL8_EV 設計。這個相對簡潔的設計實現了每相約 88 安培的高電流輸送能力。內部補償、先進的控制算法,以及集成於電源階段和耦合電感器中的電流感測電路,使得此方案成為一個體積小巧、效率領先的解決方案。

圖 2:利用 ADI 高集成度電源晶片組設計的 8 相 VR,促成高密度設計並減少外部連接

單片式智慧電源階段 IC 具有更高集成度

MAX20790 是一款功能豐富的智慧電源階段 IC,專為與 MAX16602(以及其他一些 ADI 控制器)搭配使用,以實現高密度多相電壓調節器。這是一種單片集成,幾乎消除了在傳統離散設計中,FET 與驅動器之間的寄生電阻和電感,能夠實現比傳統實現方案顯著更低的功率損耗和更高的開關速度。當檢測到開關節點(VX)故障時,電源階段會立即關閉並將故障 ID 通知給控制器。此智慧電源階段 IC 還內建了電流感測器。這個電流感測電路模塊遠優於使用電感直流電阻(DCR)進行感測的方法,因為 DCR 感測已知不準確,並且需要溫度補償才能信賴電流測量。

控制器 IC

MAX16602 是一款專為 xPU VCORE VR 設計的多相控制器。該晶片提供了高密度、靈活且可擴展的解決方案來為 AI xPU 提供電力。該裝置支持脈寬調製(PWM)並行控制最多達 16 相。該晶片的架構簡化了設計,減少了元件數量,實現了先進的電源管理和遙測功能,並在整個負載範圍內提高了能效。自動相位削減功能被實現以保持高效率,無論負載範圍如何。完整的晶片組是一款高效的多相降壓轉換器,具有廣泛的狀態和參數測量功能。保護和關閉的參數通過串行 PMBus® 接口設置和監控,包括來自電源階段 IC 收集的故障。

 

以下是 ADI 控制器在任何 AI 電源交付實現中非常重要的一些其他關鍵特徵:

先進的調製方案

MAX16602 包含先進的調製方案(AMS),提供改進的瞬態響應。該調製方案允許以最小延遲開關相位。根據負載需求,當負載增加時,能夠同時開啟多個相位,或者當負載釋放時,立即關閉相位。啟用 AMS 後,系統閉環帶寬可以在不犧牲相位邊際的情況下進行擴展。這使得 PoL 更能應對 AI VR 所經歷的即時和動態電流需求。

負載線控制

負載線使 VCORE 可以根據輸出電流在最小值和最大值之間變化。基本上,這使得 VCORE 在輕載時偏高,而在重載時偏低。主要原因是為了讓控制迴路能夠處理較高的負載電流(這是確保系統運行良好的必要條件)。ADI 控制器提供了對整個輸出電流範圍內準確的輸出負載線控制。輸出電壓定位是通過來自電源階段 IC 的無損電流感測信號進行的,這些信號被反饋給控制器。負載線通過數位編程電壓控制迴路誤差放大器的直流增益在控制器中設置。控制器的 EC 表格和數據手冊中的表 6 中提供了範圍廣泛的直流負載線配置,從 0.105 mΩ 到 0.979 mΩ。圖 3 顯示了 16 相 PoL 設計的瞬態圖,負載步進從 40 A 到 360 A,升降速率為 800 A/µs,結果顯示最小的過衝。

 

總結來說,ADI 的多相電源轉換和 PoL 產品提供了高效率和高功率密度。圖 5 顯示了我們 16 相 MAX16602 + MAX20790 + CLH1110-4 評估板的效率圖,包括偏壓和電感損耗。ADI 提供了各種 AI 加速器應用的電壓調節器和其他電源轉換解決方案。我們的多相控制器和集成電源階段解決方案幫助 ADI 客戶解決當前 AI 應用中最嚴苛的動態 xPU 電源需求和設計挑戰。

圖 3. 16 相 VR 的瞬態圖,負載步進從 40 A 到 360 A,升降速率為 800 A/µs

在設計中加入主動電壓定位,可以減輕負載瞬態響應的要求,並更好地利用 xPU 容忍範圍。負載線控制有助於在給定的步進負載下,降低輸出電壓的峰-峰值偏差,同時使得能夠減少輸出電壓軌道上的總體電容。這樣總電壓波動降低,從而降低了 xPU 崩潰或損壞的風險。值得注意的是,MAX16602 中的負載線電路模塊可以被禁用。

耦合電感的優勢

ADI 已經在其專利的耦合電感(CL)技術上投入了超過十年的時間。這項技術使得更高密度、更大的帶寬、更快的瞬態解決方案成為可能,相比於離散實現,能提供 50% 更高的效率和 1.82 倍更小的磁性元件。CL 在穩態下有效作為大電感,在瞬態時作為小電感,這不僅能節省 COUT,還能縮小電感的尺寸。圖 4 顯示了 ADI 在其多相 VR 設計中常用的一系列耦合電感。

圖 4. ADI 多相 VR 設計中常用的一系列耦合電感

根據設計規格和優先級,耦合電感的電流波紋取消效益可以在更小的尺寸或更高的效率之間進行權衡。ADI 的競爭優勢在於,AI PoL 設計師可以使用耦合電感(CL)來幫助他們輕鬆實現一個小尺寸的 VR 解決方案。多家知名且受歡迎的磁性元件供應商獲得了來自 ADI 的免費 CL 許可,並能為我們提供所需零件的多個來源。

頂部散熱封裝

頂部散熱提供了表面安裝封裝的另一種散熱路徑。MAX16602 和 MAX20790 都是翻芯四方扁平無引腳(FCQFN)封裝,具有暴露的頂部熱墊。FCQFN 是一種先進的封裝技術,提供了業界領先的熱性能,設計師會對此感到欣賞。這種無引腳封裝不僅減少了寄生電感,還允許熱量直接從器件的接合處散發到周圍環境中。MAX20790 的接合到外殼的頂部熱阻(θJC-TOP)為 0.25°C/W。利用頂部散熱配置,AI 電源設計的系統熱性能和設計靈活性可以得到提升。

圖 5. 16相AI VR 評估板設計的效率圖

垂直電源

隨著 xPU 處理複雜 AI 功能的興起,業界見證了功率消耗的顯著增長。具備高達 650 A 連續電流和超過 1000 A 峰值電流輸送能力的電壓調節器(VR)已經成為普遍需求。為 AI 處理器提供電力的挑戰在於如何保持效率。傳統的電力架構無法跟上這些需求量大的 AI xPU 的功率需求。VR 集成電路製造商和設計師正在根本上尋找不同的電力交付方法。業界所討論的一個新趨勢是垂直電力,也稱為背面電力交付。

 

為了實現高電流的電力交付,VR 必須盡可能靠近負載輸入 xPU 的電源引腳。傳統的水平電力交付方法無法達到這一要求。垂直電力交付將電源調節器直接移動到處理器下方,消除了 PCB 上的所有損失。這個結構將電源轉換器、功率階段、電容器和磁性元件放置在 PCB 的背面,並通過通孔將電力垂直交付到 xPU。換句話說,電流交付是從 xPU BGA 陣列的下方垂直進行。這是一條減少長度的垂直路徑,顯著降低了阻抗並消除了損失。圖 6 顯示了垂直電力模組架構,安裝在 PCB 的另一側,位於 xPU 下方(僅供說明用途)。ADI 擁有一系列 AI xPU VCORE 解決方案,可以解決當前的這些問題。我們的電源解決方案提供業界領先的效率,並且在最小的外型中實現最佳性能。所提議的多相控制器 MAX16602 和智能單晶片功率階段 MAX20790 的組合,提供業界最高的電力轉換效率、最快的瞬態響應和最準確的遙測報告。欲了解有關這些功率集成電路的詳細信息,或購買 MAX16602CL8 評估套件,可直接聯繫安馳科技👉tech.anstek@macnica.com

圖 6. 垂直電力模組架構(僅供說明用途)

建立垂直電力解決方案的挑戰在於如何解決模組重量和安裝問題。在 PCB 的另一側,位於 xPU 下方的位置,也是高頻解耦電容器的主要安裝區域,這些電容器需要儲存能量以滿足瞬時的能量需求。垂直電力交付與 ADI 的 CL 技術相結合,實現了更高的電流密度、功率密度和更快的瞬態性能。垂直電力為像 ADI 這樣的 PoL 製造商提供了新的創新機會,並以他們自己的方式支持摩爾定律的進步。

結論

通過機器學習和深度學習,加速卡將 AI 從理論推向主流,通過啟用並行處理能力,進而加速訓練和推斷工作負載的處理。為高性能 AI 加速卡設計 VR PoL 是一項複雜的任務,特別是隨著當前先進 xPU 對電流水平和電壓精度的需求不斷增加。

 

本文展示了 xPU VR 的需求與標準 PoL 調節器有顯著區別。xPU 鐵軌有極快的負載變化,需要動態電壓定位或負載線,並且必須小型化。

參考文獻

1 “Forecast: AI Semiconductors, Worldwide, 2021-2027.” Gartner, April 2023.

2 “Utilizing the Benefits of Coupled Inductors.” Analog Devices, Inc.

作者介紹

Hamed M. Sanogo

Hamed M. Sanogo 是亞德諾半導體(Analog Devices, ADI)全球應用團隊中的雲端與通訊領域專家。Hamed 擁有密西根大學迪爾本分校(University of Michigan-Dearborn)的電子工程碩士學位,並在達拉斯大學(University of Dallas)取得了工商管理碩士學位。畢業後,Hamed 曾在通用汽車(General Motors)擔任高級設計工程師,並在摩托羅拉解決方案(Motorola Solutions)擔任高級電氣工程師及 Node B 和 RRH 基帶卡設計師,之後加入亞德諾半導體。Hamed 已經在不同角色上工作了 18 年,包括技術應用工程師(FAE)/FAE 經理、產品線經理,目前擔任雲端與通訊領域的專家。

聯繫我們

聯繫我們 ADI所有產品請洽【 安馳科技 】 

安馳科技|ADI亞德諾半導體網站:https://anstekadi.com

安馳科技 LINE 官方帳號:https://lin.ee/5gcKNi7

安馳科技 Facebook 官方帳號:https://www.facebook.com/ANStek3528

申請樣品與技術支援:https://www.surveycake.com/s/dQ3Y2

與我聯絡:marketing.anstek@macnica.com