人工智慧(AI)資料中心耗電量驚人,其中一大原因是必須為處理器降溫。微軟(Microsoft)正在嘗試一種可能的解方:讓冷卻液直接流經晶片蝕刻出的微小管道。
微軟系統技術主管Husam Alissa表示,這項名為「微流體」(microfluidics)的技術,已在該公司內部的原型系統中做測試,應用於支援Office雲端應用的伺服器晶片,以及處理人工智慧運算工作的圖形處理器(GPU)。
由於冷卻液直接用於晶片,即使在有些高達攝氏70度的情況下仍能有效發揮作用。微軟上周展示顯微鏡下的這項技術,並表示目前測試結果顯示,效能明顯優於傳統冷卻方式。這種冷卻方式還可能讓微軟開發出更強大的晶片,透過堆疊方式來提升效能。
此消息一出,讓專門製造資料中心冷卻系統的Vertiv 周二股價收盤應聲大跌6.2%。Eaton和Modine Manufacturing也分別下跌2.6%和3.4%。
彭博行業研究分析師Mustafa Okur認為,微軟的創新不至阻礙對Vertiv和Eaton等公司電力產品的需求。他寫道:「這項技術可望讓伺服器密度更高、晶片功率更大,整體散熱需求反而會增加,因為伺服器機櫃內的熱量仍需排除,就像散熱方式從空氣冷卻轉向液體冷卻的過程一樣。」
這項技術是微軟為自家資料中心客製化硬體的一環。過去一年,微軟已新增超過2百萬瓩(GW)的運算容量。
這項新型冷卻技術也能讓微軟刻意使晶片過熱,以換取更佳效能。這種做法稱為「超頻」(overclocking),對於應付短暫的需求高峰特別有用。例如,微軟的Teams會議軟體經常在整點和半點使用量暴增,因為大多數會議都在這些時間開始。
微軟技術院士Jim Kleewein指出,微軟不必額外增加晶片數量,只需讓現有晶片超頻幾分鐘即可滿足需求。他和硬體團隊合作,專門處理Office軟體產品的運算需求。
此外,微軟也更廣泛地部署「空心光纖」(hollow-core fiber)來加快數據傳輸速度。這種方式以空氣取代傳統玻璃柱來傳輸資料。
微軟雲端網路工程師 Jamie Gaudette表示,在實驗室裡,一小段僅數英吋長的材料就能被拉伸,連接數公里距離。微軟已和康寧(Corning)及賀利氏科萬特(Heraeus Covantics)合作,以擴大這種材料的產能。
微軟Azure資料中心硬體系統暨基礎設施副總裁芭卡爾(Rani Borkar)表示,微軟也打算開發記憶體晶片相關硬體,但尚未公布具體計畫。
她說:「記憶體領域確實有些進展,但還不到可以對外討論的程度。記憶體是我無法忽視的一環。」
目前產業關注的焦點是高頻寬記憶體(HBM),這是人工智慧運算不可或缺的元件,由美光(Micron )在內業者生產。芭卡爾指出,微軟由她主導的Maia AI晶片,目前仍依賴市面上可取得的HBM。
她說:「現階段,HBM幾乎就是一切。接下來會怎麼發展?我們都在關注。」