摩爾線程舉辦MUSA開發(fā)者大會(huì):"花港"新架構(gòu)與萬卡集群讓AI得心應(yīng)手
白貓 / 2025-12-20 21:5836463想要打造性能出色的GPU并不是一件容易的時(shí)期,首先企業(yè)要在眾多專利壁壘中打造一條屬于自己的圖形思路,此外你還要構(gòu)建屬于自己的生態(tài)系統(tǒng)并且為行業(yè)所接受,因此一直以來玩得轉(zhuǎn)GPU的廠商寥寥無幾,更不用說基于自研GPU打造成熟的生態(tài)系統(tǒng)。不過這幾年國內(nèi)還是涌現(xiàn)了一批自研GPU企業(yè),例如摩爾線程。
摩爾線程在今天舉辦首屆MUSA開發(fā)者大會(huì),公布了國產(chǎn)GPU生態(tài)發(fā)展的關(guān)鍵進(jìn)展與未來藍(lán)圖。此外摩爾線程還展示了全新的GPU架構(gòu)“花港”以及未來芯片路線“華山”、“廬山”芯片與夸娥萬卡智算集群,面向下一代超大規(guī)模智算中心的MTT C256超節(jié)點(diǎn)架構(gòu)規(guī)劃以及面向開發(fā)者的MTT AIBOOK等產(chǎn)品。


作為GPU的核心,架構(gòu)的好壞將會(huì)決定GPU是否能夠高效地運(yùn)行各種各樣的任務(wù),摩爾線程在今天推出了全功能GPU架構(gòu)“花港”,該架構(gòu)讓GPU在計(jì)算密度、能效、精度支持、互聯(lián)能力及圖形技術(shù)等方面實(shí)現(xiàn)全面突破。根據(jù)摩爾線程官方的介紹,“花港”采用了新一代的指令集,算力密度提升50%,并且也能大幅優(yōu)化能效,同時(shí)考慮到AI計(jì)算需要不同的精度,因此“花港”GPU將會(huì)實(shí)現(xiàn)從FP4到FP64的全精度計(jì)算,同時(shí)包括MTFP6/MTFP4等混合低精度計(jì)算也將被“花港”GPU所支持,從而讓AI開發(fā)者開發(fā)更加順利。并且“花港”還支持MTLink高速互聯(lián)技術(shù),從而讓十萬卡以上規(guī)模智算集群擴(kuò)展成為可能。


摩爾線程今天還公布了兩款基于“花港”架構(gòu)打造的兩款芯片路線,包括“華山”以及“廬山”,其中“華山”主打AI訓(xùn)推一體與超大規(guī)模智能計(jì)算,其浮點(diǎn)算力,訪問帶寬、訪存容量以及高速互聯(lián)帶寬均達(dá)到了行業(yè)領(lǐng)先的水準(zhǔn),至于“廬山”專注于圖形渲染,相比較初代架構(gòu),其幾何處理性能能夠提升16倍,光線追蹤性能提升50倍,AI性能提升64倍,最終讓3A游戲性能提升15倍,并且廬山GPU還可以讓紋理填充率更高,集成AI生成式渲染、UniTE統(tǒng)一渲染架構(gòu)及全新硬件光追引擎,未來可以為3A大作以及高端圖形創(chuàng)作提供堅(jiān)實(shí)的算力支持。



針對(duì)AI訓(xùn)練所需要的超大模型,摩爾線程也推出了夸娥萬卡集群,其浮點(diǎn)算力最高可以達(dá)到10Exa-Flops,并且借助高效的架構(gòu),讓訓(xùn)練算力利用率、訓(xùn)練有效時(shí)間等關(guān)鍵指標(biāo)不斷提升,同時(shí)也可以兼容國際主流生態(tài),從而更好地應(yīng)用于國內(nèi)外的大模型訓(xùn)練與推理。


摩爾線程還與硅基流動(dòng)合作,通過系統(tǒng)級(jí)的優(yōu)化,實(shí)現(xiàn)了MTT S5000單卡4000 Tokens/s的壯舉,此外Decode吞吐突破1000 tokens/s,這個(gè)成績遠(yuǎn)超同行的計(jì)算卡,可以說創(chuàng)下了國產(chǎn)推理的新標(biāo)桿。

對(duì)于游戲玩家來說,摩爾線程旗下的游戲顯卡能夠支持更多的游戲才最為實(shí)際,對(duì)此摩爾線程也對(duì)游戲顯卡進(jìn)行了展望,稱如今的摩爾線程顯卡已經(jīng)支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計(jì)算API,預(yù)計(jì)在2026年將支持DirectX 12 Ultimate,同時(shí)基于“花港”架構(gòu)的硬件光線追蹤加速引擎可以支持DXR API,從而讓游戲更加真實(shí),此外摩爾線程也推出了全自研MTAGR 1.0,為下一代數(shù)字創(chuàng)作構(gòu)建國產(chǎn)技術(shù)基座。


摩爾線程也在現(xiàn)場公布了“長江”智能SoC芯片,這顆芯片采用了8個(gè)全大核,主頻最高擁有2.65GHz,同時(shí)還搭載高性能3D渲染,支持LLM端側(cè)推理,此外還支持VPU、DPU以及DSP等多種解碼單元,會(huì)后我們也看到了基于“長江”智能SoC打造的MTT E300 AI模組,擁有最高50TOPS的異構(gòu)AI算力,可以有效地應(yīng)用于工業(yè)、能源、教育等行業(yè)。



并且摩爾線程還積極布局下一代技術(shù),包括MT Lambda具身智能仿真訓(xùn)練平臺(tái),融合物理、渲染與AI三大引擎,能夠?yàn)榫呱碇悄軒砣珬Yx能,此外MUSA架構(gòu)也在量子科技、AI for 6G等前沿交叉領(lǐng)域展開探索工作,不斷拓展技術(shù)邊界。此外摩爾線程還推出了MTT AICube以及MTT AIBOOK,能夠?yàn)殚_發(fā)者提供快速且高效的開發(fā)環(huán)境,賦能開發(fā)者在AI時(shí)代成為“超級(jí)個(gè)體”。

首屆MUSA開發(fā)者大會(huì)上,摩爾線程全面展示了目前已有的技術(shù),還展示了摩爾線程對(duì)于未來AI和圖形技術(shù)的提前布局,推出了全新的架構(gòu)以及GPU,還包括眾多的終端產(chǎn)品,可以說目前爆發(fā)的AI行業(yè)給了摩爾線程更多的展示機(jī)會(huì),此外行業(yè)朝著自主化前進(jìn)也讓摩爾線程的GPU生態(tài)建設(shè)有了更多的伙伴支持,為今后打造成熟且自主的生態(tài)系統(tǒng)奠定了基礎(chǔ)。
摩爾線程舉辦MUSA開發(fā)者大會(huì):"花港"新架構(gòu)與萬卡集群讓AI得心應(yīng)手














滬公網(wǎng)安備 31010702005758號(hào)
發(fā)表評(píng)論注冊(cè)|登錄