工控網(wǎng)首頁
>

新聞中心

>

業(yè)界動(dòng)態(tài)

>

液冷技術(shù)新趨勢-AI服務(wù)器微通道水冷板(MLCP)質(zhì)量保證

液冷技術(shù)新趨勢-AI服務(wù)器微通道水冷板(MLCP)質(zhì)量保證

640 (55).jpg

 

點(diǎn)擊獲取蔡司電子行業(yè)質(zhì)量解決方案

【點(diǎn)擊跳轉(zhuǎn):】


生成式 AI 的高速發(fā)展推動(dòng)算力需求持續(xù)攀升,進(jìn)而帶動(dòng)芯片功耗顯著上漲。英偉達(dá)下一代 Rubin/Rubin Ultra 芯片的功耗預(yù)計(jì)將大幅提升,從當(dāng)前 GB300 芯片的 1400W 突破至 2000W 以上。然而,當(dāng)前主流的單相冷板方案存在明顯瓶頸,其散熱能力上限約為 1500W,已難以滿足 Rubin 系列算力芯片的散熱需求。這一供需差推動(dòng)液冷技術(shù)加速迭代,具備更強(qiáng)散熱能力的兩相式冷板與微通道水冷板Micro-Channel Liquid Cooling Plate(MLCP)為解決超高功耗芯片散熱問題而指定的技術(shù)路徑,正成為更具潛力的解決方案。


(來源WCCFTECH NVIDIA Might Switch Up Cooling Solutions With Next-Gen Rubin Ultra as It Battles Thermal Constraints)


當(dāng)前液冷與MLCP液冷技術(shù)趨勢


當(dāng)前算力芯片主流液冷方案為單相冷板,其核心原理是使用高沸點(diǎn)水基冷卻液,在換熱過程中不發(fā)生相變。在材質(zhì)與結(jié)構(gòu)設(shè)計(jì)上,冷板基材以高導(dǎo)熱性的銅為主和部分鋁制,整體由熱源對(duì)接面、內(nèi)部流道及進(jìn)出液結(jié)構(gòu)構(gòu)成;內(nèi)部流道寬度通常在 0.1 毫米至數(shù)毫米之間,且設(shè)計(jì)翅片結(jié)構(gòu)以提升散熱效率。


但傳統(tǒng)單相冷板方案存在三大明顯局限:

1.熱阻較高,多層熱界面材料疊加會(huì)導(dǎo)致熱阻累積,影響熱量傳導(dǎo)效率;

2.流道為毫米級(jí)尺寸,冷卻液流速相對(duì)較慢,進(jìn)而拉低整體換熱效率;

3.難以實(shí)現(xiàn)芯片表面溫度均勻分布,局部易出現(xiàn)高溫點(diǎn)。


因此,盡管傳統(tǒng)冷板方案的散熱效率較風(fēng)冷有顯著提升,但面對(duì) 1500-2000W 乃至更高的散熱需求時(shí),其效率已顯不足,無法完全滿足高功耗芯片的散熱要求。


(來源:數(shù)據(jù)中心液冷技術(shù)的應(yīng)用研究進(jìn)展)


與傳統(tǒng)冷板相比,MLCP 通過精密蝕刻技術(shù)加工出微米級(jí)(10-1000 微米)的狹窄水道,而傳統(tǒng)冷板的流道寬度通常在 1-3 毫米。MLCP的設(shè)計(jì)極大拓展散熱面積,使冷卻液與熱源的接觸面積較傳統(tǒng)方案提升 10 倍以上,為高效散熱奠定基礎(chǔ)。


同時(shí),微通道內(nèi)冷卻液的流動(dòng)狀態(tài)也發(fā)生了根本性改變。在微米級(jí)空間中,流體呈層流狀態(tài)分布,熱邊界層厚度大幅減薄,熱交換效率隨之顯著提高,其換熱系數(shù)可達(dá)傳統(tǒng)液冷方案的 2-3 倍,能更快帶走芯片產(chǎn)生的高熱量。


MLCP還有個(gè)核心優(yōu)勢是高度集成。傳統(tǒng)散熱要經(jīng)過芯片、導(dǎo)熱材料(TIM)、金屬蓋(IHS)、另一層導(dǎo)熱材料(TIM),最后才到水冷板,一層一層的界面會(huì)讓熱阻堆起來。但 MLCP 技術(shù)把芯片金屬蓋(IHS)和水冷板做成了一個(gè)整體,中間的界面和導(dǎo)熱材料都省掉了。這樣一來,冷卻液能更靠近芯片表面,熱傳遞的路徑短了一半還多,整體熱阻也大大降低。


(來源:液冷產(chǎn)業(yè)鏈:微通道水冷版(MLCP)方案介紹)


但液冷板量產(chǎn)仍面臨顯著工藝挑戰(zhàn)。微米級(jí)水道的加工精度要求極高,實(shí)際生產(chǎn)中,微米級(jí)水道的加工難度、液體滲透率的精準(zhǔn)控制以及規(guī)?;a(chǎn)的良率提升,都是需要突破的關(guān)鍵環(huán)節(jié)。若任一工藝環(huán)節(jié)出現(xiàn)偏差,都可能引發(fā)漏液、散熱不均等問題,直接影響產(chǎn)品性能與可靠性。


盡管 MLCP 技術(shù)前景廣闊,但目前仍處于 “測試驗(yàn)證期”,距離量產(chǎn)至少需要 3-4 個(gè)季度,核心瓶頸在于液體滲透與泄露:一次失誤即 “百萬損失”。因?yàn)镸LCP 的冷卻液直接接觸芯片,一旦密封件老化或微通道破損,泄漏的液體可能瞬間摧毀價(jià)值數(shù)十萬至數(shù)百萬美元的服務(wù)器。在服務(wù)器 5-8 年的使用壽命中,如何保證密封材料的完整性、避免長期使用后的滲透風(fēng)險(xiǎn),是生產(chǎn)商需突破的首要難題。


質(zhì)量挑戰(zhàn)1 翅片彎折

MLCP 微通道制造過程(如蝕刻、沖壓、焊接)中的工藝控制不當(dāng),或組裝時(shí)的外力沖擊。內(nèi)部翅片彎折會(huì)直接導(dǎo)致以下影響:

1.破壞微通道流道的均勻性,造成冷卻液局部流速異常,降低換熱效率,甚至引發(fā)芯片局部過熱;

2.嚴(yán)重彎折可能堵塞部分流道,進(jìn)一步加劇散熱瓶頸,同時(shí)增加冷卻液循環(huán)系統(tǒng)的壓降,影響整體運(yùn)行穩(wěn)定性。

3.ZEISS METROTOM蔡司高分辨率無損掃描技術(shù),精準(zhǔn)識(shí)別內(nèi)部翅片的彎折位置與程度,避免常規(guī)檢測遺漏的隱患。

 

640 (38).png

▲圖示為翅片彎折


質(zhì)量挑戰(zhàn)2 微通道堵塞

MLCP 的微通道寬度僅 50-150μm(約為傳統(tǒng)流道的 1/10),直接承擔(dān)芯片熱量交換功能,堵塞會(huì)從散熱性能、系統(tǒng)可靠性到成本控制形成連鎖,形成以下負(fù)面影響:

1.散熱效率驟降,觸發(fā)芯片故障堵塞會(huì)壓縮冷卻液流通截面,導(dǎo)致局部流速異常、換熱面積銳減,直接打破MLCP低至 0.03℃?cm2/W的低阻散熱優(yōu)勢。堵塞區(qū)域的熱量無法及時(shí)傳遞,會(huì)引發(fā)芯片局部過熱,輕則觸發(fā)降頻、性能衰減,重則導(dǎo)致芯片燒毀;

2.系統(tǒng)壓力失衡,加劇設(shè)備損耗微通道堵塞會(huì)導(dǎo)致冷卻液循環(huán)阻力激增,迫使水泵負(fù)載升高以維持流量,不僅增加能耗,還會(huì)加速泵體老化;

3.長期可靠性存隱憂即使是微小堵塞,也可能成為雜質(zhì)堆積的 “核心”,在長期運(yùn)行中逐漸擴(kuò)大堵塞范圍;同時(shí),堵塞區(qū)域的局部高溫會(huì)加速材料老化,增加通道腐蝕、開裂風(fēng)險(xiǎn),縮短 MLCP 5-8 年的設(shè)計(jì)使用壽命。

ZEISS METROTOM蔡司高分辨率無損掃描技術(shù),具備較大的行程,同等尺寸的工件可以實(shí)現(xiàn)更大的放大倍率,獲取更高分辨的圖像,即使是微小的堵塞也不會(huì)放過,精確定位堵塞區(qū)域。

  

640 (39).png

640 (40).png

▲圖示為放大倍率逐漸增加,微通道堵塞

 

640 (41).png


蔡司擁有豐富的產(chǎn)品線包含顯微鏡,藍(lán)光掃描儀,三坐標(biāo),工業(yè)CT,助力全面解決電子客戶面臨質(zhì)量挑戰(zhàn)與痛點(diǎn)。

    

640 (56).jpg

640 (57).jpg

640 (58).jpg

640 (59).jpg


點(diǎn)擊下載電子手冊和數(shù)據(jù)中心手冊

 

640 (2).gif

【跳轉(zhuǎn)鏈接:】

 

640 (3).gif

【跳轉(zhuǎn)鏈接:】


審核編輯(
李娜
)

提交

查看更多評(píng)論
其他資訊

查看更多

ZEISS CALYPSO 2025 全新升級(jí),測量效率再提升

AI賦能PCB品質(zhì)革新!蔡司邀您共赴電子電路年度盛會(huì)

【操作指南】第二期:工件特殊/趕時(shí)間?蔡司不貼點(diǎn)掃描教程,快速出結(jié)果!

電子行業(yè)應(yīng)用解讀 | 手機(jī)均熱板的顯微分析應(yīng)用

制造業(yè)實(shí)驗(yàn)室升級(jí):從 "人工檢測" 到 "智慧中樞",蔡司如何破解質(zhì)量管控難題?