隨著5G、生成式AI等新興應用迅速發展,對資料的傳輸量與傳輸速度要求也愈加提高,為了滿足高速低延遲的資料傳輸需求,運用共同封裝模組技術(Co-packaged optics; CPO)整合光電元件,使得晶片開發者獲得更多通訊頻寬,不僅能實現高速低延遲的資料傳輸,而且讓傳輸資料時所消耗的電力也大幅減少,符合當今全球低碳節能的要求,也正因為擁有上述之優勢的CPO,將成為下一代高速網通晶片的關鍵技術之一。
今年在上海舉行的世界人工智慧大會(WAIC)上,華為昇騰三八四(CloudMatrix 384)超節點真機首次亮相,該系統由三八四顆昇騰NPU,與一九二顆鯤鵬CPU晶片構建,採用全互連拓墣架構以實現晶片間的資料傳輸,其算力表現十分突出,能提供高達300 PFLOPs的密集BF16算力,接近輝達GB200 NVL72系統的兩倍。此外,CloudMatrix 384在記憶體容量和頻寬方面也具有顯著優勢,其總記憶體容量是輝達方案的三.六倍,記憶體帶寬則達到二.一倍,為大規模AI訓練和推理提供了更高效的硬體支持。
華為重磅產品登場
儘管單顆昇騰晶片的性能僅為輝達Blackwell架構GPU的三分之一,華為透過大量配置昇騰晶片來實現算力突破,在超大規模模型訓練和即時推理等應用中展現了強大的競爭力。按照中國本土法人的分析指出,華為的CloudMatrix 384解決方案已領先輝達和AMD目前市場上的產品一個世代,並認為中國在AI基礎設施上的突破將對全球AI產業格局產生深遠影響。
輝達執行長黃仁勳也曾公開表示,從技術參數來看,華為的CloudMatrix 384超節點性能甚至超越輝達,比輝達的尖端技術更具優勢。黃仁勳強調輝達必須高度重視華為這家實力雄厚的公司,並全力應對挑戰。黃仁勳認為,華為已明確表態要融合5G與AI技術,這種前瞻性的佈局被視為是完全正確的戰略方向,而輝達也在推進類似計畫,但必須加快進度。
此外,半導體研究和諮詢機構SemiAnalysis指出,華為的工程優勢不僅體現在晶片層面,更展現在系統級的創新,包括網路架構、光學互聯以及軟體優化,這些技術使得CloudMatrix 384能充分發揮集群算力,滿足超大規模AI計算的需求,進一步鞏固其在全球AI產業中的領先地位。
根據Yole預估,全球矽光子市場規模到二○二七年將超過五○億美元,年複合成長率達三○%,其中在全球光訊號互連市場規模將從二二年的○.三八億美元,成長至二八年的一.三七億美元,年複合成長率達二四%,而從二八年以後,由AI、機器學習(ML)需求所驅動的CPO與Optical I/O為主的產品進一步放量,將迎來新一波成長動能,到了三三年市場規模將再成長至二六億美元,年複合成長率達八○%。
近期摩根士丹利證券(Morgan Stanley)也發布了CPO產業的研究報告,看好CPO市場規模將在二○二三∼三○年間以一七二%的年複合成長率擴張,預計三○年達到九三億美元,並且在樂觀的情境下,年複合增長率可高達二一○%,市場規模將突破二三○億美元。
博通、輝達扮演產業領頭羊
網通晶片大廠博通(Broadcom)在二二年八月推出Tomahawk 4的交換器晶片Humboldt,功耗、成本皆較上一代交換器晶片節省五成,緊接著在二三年三月正式發表 Tomahawk 5交換器晶片Bailly,效能持續提升,並於去年開始量產。根據Broadcom提供的數據顯示,一台配備有Tomahawk 5的交換器將能替代四八台二○一四年推出的Tomahawk 1交換器,而目前八○○G模組的功耗為十三∼十五W,Tomahawk 5則可將功耗降至四.八W以下。今年六月,博通再發表新款Tomahawk 6晶片,由台積電三奈米製程生產,新款晶片的頻寬一○二.四Tbps,是上一代產品的兩倍,並延續採用CPO技術,將收發器功能直接整合到交換器當中,有助減少硬體成本並降低功耗。【本文未完,全文詳情及圖表請見《先探投資週刊》2366期;訂閱先探投資週刊電子版】