直指GPU利用率痛點,是德科技發布KAI解決方案
供稿 / 2025-07-17 14:353791近日,NVIDIA將向中國市場銷售H20芯片的新聞引發關注。在AI時代,GPU等算力核心器件無疑是企業創新發展的命脈所在,如果說模型是AI的大腦,那么數據中心就如同心臟一般輸送著算力血液。但數據中心耗費不菲,其高效可持續發展議題吸引人們關注。6月26日,在是德科技Keysight World Tech Day 2025上,是德科技揭曉了算力中心面臨的瓶頸,以及其用于大規模AI數據中心的系列解決方案。
AI大模型時代,算力中心面臨挑戰
是德科技大中華區高速數字市場部經理李堅介紹,早期人工智能的應用基本呈現單向性,主要聚焦于識別功能,基于的算力、參數和數據規模相對較小。如今,人工智能不僅限于簡單的識別,其模式基于大模型,參數規模上升至萬億量級,算力集群也從千卡集群向萬卡、十萬卡集群演進。大模型需要大算力、大數據和大帶寬支持,算力中心規模龐大,建設投入高達數百億元人民幣。
在這些投入中,GPU的成本無疑占據很大比重。然而,數據顯示,GPU并非時刻都在“工作”,在進行模型訓練時,GPU的等待時間超過了50%,真正處于工作狀態的時間大概只有38%。投入幾百億元建設的數據中心,核心部件GPU利用率卻不高,投資回報率顯得很低。這背后的原因是網絡在進行數據交換時遇到阻礙,數據沒有及時給到GPU。就像早上上班路上堵車,上班就會遲到,自然也就沒辦法按時開始工作。

另一個值得關注的狀況是數據中心中故障頻發。大模型訓練一次就能順利完成任務的概率大概只有57%。這是因為在訓練過程中,會出現各種各樣的硬件或軟件故障,尤其是硬件故障。如今速率提升得非常快,很多器件已經接近其物理極限,在高溫、高速且24小時不間斷的工作環境下,很多器件不堪重負甚至崩潰。網絡可靠性問題頻發,只要其中任何一個器件出現故障,整個系統可能都無法正常運行。
當下算力中心建設正如火如荼地推進,然而不少算力中心其實是“帶病上線”,存在諸多問題。投入了巨額資金,但這些資金的投資回報率能否達到期望,還有沒有優化的空間?李堅的回答是“有很多空間”。
是德科技深耕測試測量領域八十余載,一直密切關注產業發展,希望與產業界攜手合作,共同提升數據中心基層硬件和軟件的指標,及時察覺網絡中可能潛藏的各種問題,疏通網絡流量,讓網絡運行更加有效。
Keysight AI解決方案,助力數據中心優化
基于對算力中心挑戰的認知,是德科技與眾多AI產業客戶開展了大量工作,逐步梳理了產品線,針對人工智能市場重新定義了產品矩陣,推出用于大規模AI數據中心的系列解決方案,統一命名為“Keysight AI”,簡稱“KAI”。產品矩陣分四大板塊:

· KAI高速計算:涵蓋算力板卡相關的所有測試手段,助力打造更穩定可靠的算力。主要包括電子設計自動化套件、誤碼儀、示波器和任意波形發生器。
· KAI互連:驗證光學和電氣通道,面向連接板塊的電纜、光模塊、光連接等。這些在高速率下工作的器件數量眾多,必須保證質量。該板塊主要包括采樣示波器、光子功率計和網絡測試儀。
· KAI網絡:對AI網絡性能進行基準測試,檢測瓶頸,優化AI工作負載分配。主要包括AI工作負載仿真器、分布式網絡流量生成器和網絡流量仿真器。
· KAI能效:“數據中心的盡頭是電站。”一個十萬板卡的算力中心,其耗電量堪比甚至超過一座百萬人口城市的耗電量。KAI能效解決方案助力優化數據中心組件的電源效率和能源管理。主要包括示波器、電源軌探頭和電子設計自動化套件。
人工智能引發廣泛關注,源于其背后的巨大機會。是德科技高級副總裁兼通信解決方案事業部總裁Kailash Narayanan強調,AI已從概念走向現實,大量投資涌入該領域。是德科技展現出前瞻性的戰略眼光與強大的技術實力,為人工智能提供全棧、全生命周期的解決方案,為人工智能產業的蓬勃發展注入強勁動力。
直指GPU利用率痛點,是德科技發布KAI解決方案











![華為[七夕節禮物]手環 8 NFC版華為智能手環快充長續航 支持NFC功能 電子門禁 公交地鐵 櫻語粉 女生](https://img14.360buyimg.com/pop/jfs/t1/113047/38/29960/65734/643d2516F2a376e3b/99dc3730bbf4c6df.png)


滬公網安備 31010702005758號
發表評論注冊|登錄