產業追蹤/強化安全…資料中心必修課

經濟日報 陳奕伶
各種變數挑戰資料中心的風險因應能力。(網路照片)

近年來資料中心數量大增,一故障就引發網路服務中斷的連鎖效應。其中電力中斷是常見的非計畫性停機因素,儘管營運商選址時盡可能避免地震、氣候等風險,然而氣候變遷導致天氣更熱、極端氣候加劇,運算系統功率密度提高等變數,挑戰資料中心的風險因應能力。

近期資料中心的新挑戰是AI運算需求帶來更高電力功率。資料中心需要使用更高功率運算設備以因應AI服務需求,預期資料中心內的機架功率密度將持續提高,營運商需要提高基礎設施安全性,確保更高功率、發熱更強的IT設備,在運轉下的系統穩定性,並確保AI運算設備安全,以因應電力中斷或非預期災難下的準備。

雲端資料中心因應AI算力需求增加,陸續在機房配置更多高效運算設備。隨著AI伺服器功耗密度提升,運轉時產生的熱功耗更高,資料中心冷卻系統須從空氣冷卻轉換到液體冷卻系統,才能因應更高的散熱需求。商業營運資料中心使用液體冷卻設備近年才起步,其中先進技術的浸沒式液冷設備能節省電力使用之外,伺服器浸泡充滿電子絕緣油的冷卻槽裡,取代傳統風扇及水冷板,以絕緣油做為熱傳導介質,有助拉長冷卻系統停電中斷後的伺服器升溫問題,以降低資料中心IT設備走火產生的火災風險。

AI應用成為雲端服務重要發展項目,新一代高密度服務器和高速網路傳輸設備將提高資料中心的電力負載,也挑戰資料中心的電源管理能力。當前資料中心每個機櫃的電源需求約15kW,隨著運算效能需求提升,電源需求提升到25kW甚至更高,NVIDIA推出H200 GPU功耗為700W,預期下一代推出的B100功耗將達1,000W。且電力需求會依據工作負載的高峰及離峰需求而產生波動,讓強化整體電源設備需求與日俱增,以提供運算系統功率更高且穩定的電源。

資料中心在配置更高效能伺服器的同時,更要考慮設備對既有電源設施的衝擊,如機架上電源分配器(PDU)、電源供應器(SU)等,國際電源大廠、資料中心基礎設備商推出多種高耐受性電源設備,協助資料中心營運商強化電力設備部署。如PDU是資料中心機櫃上電力分配的重要設備,設備採用時需要考慮供電的電壓、是否耐高溫和插座數量等,還需具備電弧閃光保護功能,避免機房出現電氣爆炸事故等。

資料運算市場除要建設更多資料中心提供客戶完善的資料備援系統外,面對AI運算需求的崛起,新一代資料中心將不只是存放一般伺服器,會配置更多高階AI伺服器成為AI資料中心,伺服器運算效能提升,配套的資料中心基礎設施也必須升級,以因應更高功耗的GPU。

資料中心備援及據點分散趨勢可帶動更多設備投資需求。如日韓政府祭出優惠補貼政策,引導企業到新據點進行投資。隨著多個新據點陸續開發,將帶動資料中心設備需求,鄰近菲律賓及馬來西亞、泰國等資料中心商機也持續湧現,伺服器設備、基礎設施中的電源、散熱系統市場需求都將成長。

(作者是資策會MIC產業分析師)

AI 伺服器

延伸閱讀

留言