工控網(wǎng)首頁
>

新聞中心

>

業(yè)界動態(tài)

>

“聯(lián)通星羅”先進算力調(diào)度平臺2.0,以智能融合重塑智算產(chǎn)業(yè)新格局

“聯(lián)通星羅”先進算力調(diào)度平臺2.0,以智能融合重塑智算產(chǎn)業(yè)新格局

2025/10/16 15:14:02

在數(shù)字經(jīng)濟加速滲透的當下,算力已成為驅(qū)動產(chǎn)業(yè)變革的核心生產(chǎn)力,而智算作為算力領(lǐng)域的關(guān)鍵賽道,正迎來爆發(fā)式增長。聯(lián)通數(shù)科作為中國聯(lián)通布局智算產(chǎn)業(yè)的核心力量,其自主研發(fā)的“聯(lián)通星羅”先進算力調(diào)度平臺,憑借對全域算力的智能調(diào)度能力,成為聯(lián)通云“智能融合”戰(zhàn)略落地的重要載體。


近日,中國聯(lián)通云計算首席專家鐘忻深度解讀了星羅先進算力調(diào)度平臺2.0的技術(shù)突破與產(chǎn)業(yè)價值,揭開聯(lián)通云在智算領(lǐng)域的核心競爭力。


1.jpeg


從“通算”到“智算”,“四位一體”體系破解行業(yè)痛點


“聯(lián)通星羅”先進算力調(diào)度平臺2.0通過“國芯、國模、國算、國盾”四位一體產(chǎn)品體系,完成了“資源聚合-智能分配-高效執(zhí)行-安全護航”技術(shù)閉環(huán),從硬件到軟件、從調(diào)度到安全都全棧自主可控。


隨著AI大模型、自動駕駛、智慧醫(yī)療等場景的深入發(fā)展,行業(yè)對算力的需求已從傳統(tǒng)通用計算轉(zhuǎn)向高密集、異構(gòu)化的智能計算。星羅算力調(diào)度平臺的迭代,正是源于對行業(yè)痛點的深刻洞察。一方面,國產(chǎn)化算力適配分散、模型生態(tài)兼容性不足,導致企業(yè)難以高效利用多元硬件資源;另一方面,傳統(tǒng)調(diào)度模式下資源錯配、閑置浪費問題突出,無法滿足大模型訓練對“萬卡級”算力的規(guī)模化需求。


“星羅2.0并非簡單的版本升級,而是從‘通算思維’到‘智算思維’的全面轉(zhuǎn)型?!辩娦脧娬{(diào),平臺以“國芯、國模、國算、國盾”四大體系為核心架構(gòu),構(gòu)建起全棧國產(chǎn)化智算能力底座。


在“國芯”層面,星羅2.0已完成對昇騰、昆侖芯、平頭哥、壁仞科技等企業(yè)的十幾款國產(chǎn)化芯片適配,通過統(tǒng)一的云原生K8s管理體系,實現(xiàn)異構(gòu)算力的“一盤棋”納管;“國?!杯h(huán)節(jié)則聚焦大模型生態(tài)建設(shè),第一時間將DeepSeek、千問、Kimi等主流國產(chǎn)化大模型接入平臺,解決開源模型在國產(chǎn)芯片上的算子適配、性能優(yōu)化難題,讓用戶無需二次開發(fā)即可快速調(diào)用模型能力。


當“國芯”與“國模”的能力疊加,便形成了“國算”平臺的核心價值。鐘忻解釋道,星羅2.0借助云原生的彈性伸縮、任務(wù)優(yōu)先級調(diào)度技術(shù),將GPU顯存、計算核心等資源按“細粒度”拆分,例如針對小體量推理任務(wù),可靈活分配部分顯存資源,而非占用整卡算力,資源利用率較傳統(tǒng)模式大大提升。同時,平臺覆蓋“數(shù)據(jù)處理-模型訓練-推理部署”全流程,支持從千億參數(shù)大模型訓練到輕量化推理的一體化需求,適配AI下半場從“訓練”向“推理”轉(zhuǎn)型的行業(yè)趨勢。


在安全層面,“國盾”體系為智算服務(wù)筑牢防線。依托中國聯(lián)通作為“安全產(chǎn)業(yè)鏈鏈長”的優(yōu)勢,星羅2.0在大模型訓練、數(shù)據(jù)傳輸環(huán)節(jié)加入多維度安全防護,例如支持數(shù)據(jù)本地化存儲、訓練中間數(shù)據(jù)加密隔離,滿足政務(wù)、央國企等行業(yè)對數(shù)據(jù)安全的嚴苛要求。鐘忻舉例,某醫(yī)療企業(yè)通過星羅平臺進行病理分析模型訓練時,數(shù)據(jù)全程存儲在企業(yè)私有機房,僅通過聯(lián)通專線將算力需求傳輸至平臺,實現(xiàn)“數(shù)據(jù)不動算力動”,既保障了患者隱私,又提升了訓練效率。


打破算力“孤島”,實現(xiàn)全域智能調(diào)度


“‘全域’與‘智能’是星羅2.0的兩大關(guān)鍵詞,也是破解傳統(tǒng)調(diào)度痛點的核心武器。”鐘忻表示,傳統(tǒng)算力調(diào)度往往局限于單一數(shù)據(jù)中心、單一硬件類型,導致“有算力的用不上,要用的沒算力”。而星羅2.0通過“全域資源整合+智能算法調(diào)度”,將分散在不同地域、不同類型的算力資源串聯(lián)成“虛擬超級集群”,實現(xiàn)算力的高效流轉(zhuǎn)與最優(yōu)配置。


在“全域”能力的實現(xiàn)上,星羅2.0依托中國聯(lián)通覆蓋全國的網(wǎng)絡(luò)優(yōu)勢,不斷做深訓練場景下“算力聚合”以及“就近推理”能力。通過低延時專線將不同省份的云池算力打通,創(chuàng)造性地提出“數(shù)據(jù)并行+跨域并行”的調(diào)度方案。鐘忻以千億級大模型訓練為例,若某企業(yè)需要3千卡算力,但單個云池僅能提供1000卡空閑資源,為此結(jié)合跨域混訓技術(shù),將訓練任務(wù)分別分配至北京、上海、廣州等10個云池的1000卡集群,通過分布式參數(shù)服務(wù)器方案,實現(xiàn)在不損失訓練性能的前提下,完成跨地域的規(guī)?;懔φ{(diào)度。同時訓練后三地天然保存完整模型,避免訓練后全量模型跨域同步,輕松實現(xiàn)就近推理?!澳壳拔覀円雅c上海浦江實驗室完成技術(shù)驗證,這一突破讓‘算力隨需而取’成為現(xiàn)實。未來可以很容易的擴展到萬卡及更大規(guī)模的聚合訓練?!?/p>


而“智能”調(diào)度則體現(xiàn)在對資源的動態(tài)優(yōu)化與故障自愈能力上。鐘忻介紹,星羅2.0針對智算硬件故障率較高的問題,創(chuàng)新采用“熱備冗余+分鐘級斷點續(xù)訓”機制——例如用戶租用1000臺服務(wù)器時,平臺會額外部署50%~10%左右熱備服務(wù)器,一旦某臺設(shè)備出現(xiàn)故障,熱備服務(wù)器可在10秒內(nèi)無縫接管任務(wù);同時,平臺通過AI原生存儲的Checkpoint異步存儲、近客戶端讀加速等能力,快速實時保存訓練進度,即使任務(wù)中斷,也能從最近斷點快速重啟,避免算力浪費。


此外,星羅2.0還引入“閑時/忙時”智能調(diào)度策略,將夜間空閑的推理算力開放給科研機構(gòu)、中小企業(yè),以低價或免費模式降低使用門檻。目前已計劃在部分高校的AI實驗課程中試點。


在存儲與算力的協(xié)同上,星羅2.0突破“存儲孤立”瓶頸,通過數(shù)據(jù)預加載、本地化緩存技術(shù),減少算力等待時間。鐘忻舉例,某政務(wù)部門在進行人口大數(shù)據(jù)模型訓練時,平臺提前將分散的非結(jié)構(gòu)化數(shù)據(jù)加載至AI原生存儲,訓練過程中數(shù)據(jù)讀取時延從毫秒級降至微秒級。同時,針對敏感數(shù)據(jù)場景,平臺支持“算力在聯(lián)通、數(shù)據(jù)在用戶”的混合云模式,通過專線實現(xiàn)數(shù)據(jù)“即用即回”,既保障數(shù)據(jù)安全,又不影響算力調(diào)度效率。


賦能千行百業(yè),國產(chǎn)化智算走向“好用”


當被問及星羅2.0的核心競爭力,鐘忻明確表示:“不是單一的調(diào)度能力,而是‘算力-存儲-網(wǎng)絡(luò)-模型-工具鏈’的全棧智能融合。這種融合不是簡單的組件疊加,而是通過技術(shù)創(chuàng)新,讓各環(huán)節(jié)形成‘1+1>2’的協(xié)同效應(yīng)?!?/p>


在國產(chǎn)化適配領(lǐng)域,這種融合體現(xiàn)得尤為明顯——星羅2.0實現(xiàn)昇騰芯片、自研CUOS、國產(chǎn)大模型的深度協(xié)同,例如在鄭州人工智能計算中心項目中,平臺通過底層硬件優(yōu)化、中間件適配,同時兼容CUDA生態(tài)應(yīng)用,讓企業(yè)無需重構(gòu)代碼即可遷移現(xiàn)有模型。


目前,星羅2.0已在政務(wù)、醫(yī)療、教育、央國企等領(lǐng)域形成規(guī)?;涞?。在政務(wù)場景,某地級市通過星羅平臺搭建“政務(wù)算力中臺”,將公安、民政、社保等部門的分散算力整合,支持智能政務(wù)問答、電子證照審核等應(yīng)用,政務(wù)辦理效率得以提升;教育行業(yè),鄭州大學借助星羅平臺納管校內(nèi)A800、4090、3090等異構(gòu)GPU資源,構(gòu)建統(tǒng)一的AI智慧中臺,通過集成異構(gòu)算力、模型開發(fā)訓練、AI資產(chǎn)管理和統(tǒng)一運營運維功能,促進科研創(chuàng)新和學科發(fā)展,培養(yǎng)AI技術(shù)人才,推動人工智能技術(shù)在教育和科研領(lǐng)域的應(yīng)用。


對于智算產(chǎn)業(yè)的未來發(fā)展,鐘忻認為,“智能融合”將成為下一代智算平臺的核心競爭點。聯(lián)通云計劃以星羅2.0為基礎(chǔ),推動兩項關(guān)鍵工作:一是聯(lián)合芯片廠商、模型公司、行業(yè)客戶制定智算調(diào)度標準,解決異構(gòu)算力適配、模型性能評測等行業(yè)共性問題;二是通過“算力券補貼”“普惠算力服務(wù)”等模式,降低中小企業(yè)、科研機構(gòu)的智算使用門檻,培育良性產(chǎn)業(yè)生態(tài)。


星羅2.0的核心價值,是讓國產(chǎn)化智算從“可用”走向“好用”。作為聯(lián)通云智算戰(zhàn)略的核心載體,星羅平臺不僅是技術(shù)產(chǎn)品,更是推動產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型的“基礎(chǔ)設(shè)施”——它讓政務(wù)部門的算力調(diào)度更高效、醫(yī)療企業(yè)的模型開發(fā)更便捷、高校的科研創(chuàng)新更普惠,最終以全棧智能融合能力,為數(shù)字經(jīng)濟發(fā)展注入“智算動力”。(作者:梅雅鑫)


審核編輯(
李娜
)

提交

查看更多評論
其他資訊

查看更多

DDS技術(shù)實現(xiàn)量子計算中的微波離子控制

?華翱控股品牌煥新, 以"潔凈所能"重塑潔凈產(chǎn)業(yè)新未來

美的威靈汽車部件亮相海外新能源汽車熱管理系統(tǒng)會議

德承工控機:全面搭載Intel14代處理器

維薩拉推出全新服務(wù),實現(xiàn)探頭校準和循環(huán)使用,有效減少停機時間并提高可持續(xù)性