在人工智能數(shù)據(jù)中心投資持續(xù)飆升的背景下,高速互聯(lián)正成為產(chǎn)業(yè)競爭的關(guān)鍵。摩根士丹利在《Mapping AI’s Circularity》報告中指出,人工智能正處于大規(guī)模投資早期階段,預計到2028年全球相關(guān)支出將接近3萬億美元。而這波支出僅是多年度AI資本擴張的開端。
從2024財年開始,英偉達在財報中將數(shù)據(jù)中心業(yè)務拆分為Compute(計算)和Networking(網(wǎng)絡互聯(lián))兩部分。其中,Networking包含NVLink/NVSwitch、InfiniBand、Spectrum-X以太網(wǎng)、BlueField DPU、收發(fā)器/線纜等互聯(lián)相關(guān)產(chǎn)品。根據(jù)英偉達近年來的財報數(shù)據(jù),該公司網(wǎng)絡互聯(lián)業(yè)務約占比15%-20%,推算其市場規(guī)模達數(shù)百億美元。
AI網(wǎng)絡對光模塊、DSP、Retimer等高速互聯(lián)器件的需求是傳統(tǒng)數(shù)據(jù)中心的數(shù)倍。電力消耗與能效瓶頸,使得低功耗互聯(lián)技術(shù)成為競爭焦點。最近,全球高速互聯(lián)技術(shù)公司Credo Technology(以下簡稱Credo)在深圳舉行的媒體交流會上,展示了其最新的戰(zhàn)略與產(chǎn)品布局,并正式發(fā)布基于3nm工藝的Bluebird 1.6T光DSP。
算力之外,更要關(guān)注“運力”
人工智能時代的數(shù)據(jù)中心架構(gòu)正迎來深刻轉(zhuǎn)變。Credo光產(chǎn)品銷售與市場副總裁Chris Collins介紹說,過去,網(wǎng)絡擴展主要依賴Scale out(橫向擴展),通過增加更多服務器節(jié)點來提升整體算力。但隨著大模型訓練規(guī)模的急劇膨脹,單純的橫向擴展已難以滿足需求,行業(yè)正邁向Scale out + Scale up(橫向擴展 + 縱向擴展)的雙重模式,即在擴大節(jié)點數(shù)量的同時,也要提升單節(jié)點的性能與互聯(lián)能力。
他強調(diào),算力固然是AI發(fā)展的核心驅(qū)動力,但真正決定AI集群效率的,并不僅僅是GPU的數(shù)量,而是GPU與GPU之間的高速互聯(lián)能力,即所謂的“運力”。在智算網(wǎng)絡中,算力和運力必須協(xié)同提升,才能釋放整體效能。如果缺乏足夠的運力支撐,再強大的算力也會因通信瓶頸而大打折扣。
所謂“運力”,不僅局限于單一層面的互聯(lián),而是覆蓋從芯片內(nèi)部的die-to-die互聯(lián),到板級的chip-to-chip、chip-to-module,再到機架之間、數(shù)據(jù)中心之間的全鏈路高速互聯(lián)。正是這些層層互聯(lián)構(gòu)成了AI網(wǎng)絡的“神經(jīng)系統(tǒng)”,決定了整個集群的效率和穩(wěn)定性。在當前GPU供應受限的背景下,如何通過更高效的互聯(lián)來構(gòu)建“集群超節(jié)點”,成為數(shù)據(jù)中心建設(shè)的關(guān)鍵課題。
“在智算網(wǎng)絡中,不只是需要算力,還要關(guān)注運力。運力的基礎(chǔ)就是高速互聯(lián)。”Chris總結(jié)道。憑借在SerDes、AEC、Retimer、光DSP等領(lǐng)域的長期積累,Credo已經(jīng)形成了“三高三低”的差異化優(yōu)勢——高帶寬、高性能、高可靠性,以及低功耗、低延遲、低成本。公司希望通過這些創(chuàng)新產(chǎn)品和技術(shù),幫助客戶突破互聯(lián)瓶頸,提升運力效率,從而在全球AI網(wǎng)絡競爭中占據(jù)先機。
三高三低:Credo的差異化優(yōu)勢
Credo將自身的技術(shù)優(yōu)勢總結(jié)為“三高三低”。所謂“三高”,即高帶寬、高性能和高可靠性;“三低”,則是低功耗、低延遲和低成本。這一理念不僅是產(chǎn)品設(shè)計的指導原則,也是公司在高速互聯(lián)領(lǐng)域長期積累的成果。
在高帶寬方面,Credo始終走在行業(yè)前列。例如在單波50G時代,行業(yè)普遍做到53G已屬主流,而Credo已經(jīng)實現(xiàn)了56G、58G甚至64G的速率;在單波100G時代,公司同樣率先實現(xiàn)了112G和128G的突破。這些提升直接轉(zhuǎn)化為更強的“運力”,為AI集群和數(shù)據(jù)中心提供了更高效的互聯(lián)能力。
在客戶測試中,Credo的方案在延遲和可靠性上均優(yōu)于對標產(chǎn)品,可靠性甚至高出兩個數(shù)量級。隨著AI網(wǎng)絡規(guī)模的不斷擴大,延遲對整體計算效率的影響愈發(fā)明顯。Credo的低延遲設(shè)計,使得GPU之間的數(shù)據(jù)交換更加高效,顯著縮短了模型訓練時間。這一優(yōu)勢在智算網(wǎng)絡中尤為突出,成為客戶選擇Credo的關(guān)鍵理由。
除了性能和可靠性,Credo也注重功耗和成本的優(yōu)化。通過自研SerDes技術(shù)和定制化電路設(shè)計,公司在相同工藝節(jié)點下實現(xiàn)了比競爭對手低30%的功耗。在大規(guī)模數(shù)據(jù)中心場景中,這意味著可以節(jié)省數(shù)兆瓦的電力,相當于增加數(shù)千顆GPU的算力。同時,憑借靈活的供應鏈和快速交付能力,Credo在滿足客戶成本控制需求的同時,也確保了產(chǎn)品的長期競爭力。
五大產(chǎn)品線全面發(fā)力
在媒體交流會上,Credo系統(tǒng)性介紹了其五大產(chǎn)品線——AEC、PCIe Retimer、以太網(wǎng)Retimer/MACsec、光DSP產(chǎn)品線、Chiplet / IP授權(quán)。
AEC。AEC(Active Electrical Cable,有源電纜)是Credo最具代表性的原創(chuàng)產(chǎn)品之一。這類產(chǎn)品在七八年前由該公司首創(chuàng),現(xiàn)已成為AI數(shù)據(jù)中心的標配。AEC通過內(nèi)置自研的Retimer與Gearbox芯片,在更細的銅線上實現(xiàn)高速信號傳輸,取代了傳統(tǒng)的無源線纜和高功耗的光互聯(lián)。其最大支持7米互聯(lián),即便在長距離下也能保持優(yōu)異的信號完整性。憑借低功耗、低成本和高可靠性,AEC已廣泛應用于GPU與交換機之間的互聯(lián),成為客戶構(gòu)建大規(guī)模智算網(wǎng)絡的“紫色標志性產(chǎn)品”。
PCIe Retimer。在縱向擴展需求日益增長的背景下,Credo率先切入PCIe Gen6時代,推出新一代Retimer產(chǎn)品。隨著速率翻倍,信號衰減和互聯(lián)復雜度顯著增加,Retimer成為保障GPU、CPU、SSD等設(shè)備互聯(lián)穩(wěn)定性的關(guān)鍵。Credo的差異化優(yōu)勢在于自研SerDes技術(shù),能夠深入分析鏈路細節(jié),并通過配套的PILOT工具實現(xiàn)鏈路可視化和預測性分析。這不僅幫助客戶快速定位問題,還能提前預判鏈路安全狀態(tài),獲得國內(nèi)外大廠的積極反饋。
以太網(wǎng)Retimer/MACsec。在以太網(wǎng)互聯(lián)方面,Credo擁有完整的Retimer、Gearbox和MACsec產(chǎn)品線。從56G到112G,再到正在演進的224G,公司積累了豐富的應用經(jīng)驗。尤其是MACsec芯片,支持線速1.6T加密,并兼容國密SM4算法,滿足跨數(shù)據(jù)中心和運營商網(wǎng)絡的安全需求。通過硬件級加密,用戶無需擔心性能損耗,能夠在復雜場景下實現(xiàn)高效、安全的數(shù)據(jù)傳輸,這也是Credo在國內(nèi)市場的差異化優(yōu)勢之一。
光DSP產(chǎn)品線。光DSP是Credo的另一大核心板塊,覆蓋從單波50G到200G的全系列產(chǎn)品。Seagull系列(50G)因低功耗和低成本在中國市場廣受歡迎;Dove系列(100G第一代)和Lark系列(100G第二代)則在功耗和延遲上實現(xiàn)重大突破,其中Lark相比前代功耗下降35%,延遲顯著縮短,尤其適合AI應用。最新發(fā)布的Bluebird系列基于3nm工藝,單波速率達200G,總帶寬1.6T,具備超低功耗與延遲。值得一提的是,Credo創(chuàng)新的LRO(半DSP)模式在保持性能的同時,功耗降低35%,性能基本一致,為大規(guī)模AI集群提供了更優(yōu)的能效比,并已在Lark系列及其應用中得到了充分的驗證。
Chiplet / IP授權(quán)。在底層技術(shù)上,Credo擁有深厚的SerDes IP積累,并將其開放為Chiplet形式,支持客戶與自研ASIC集成。這種模式不僅幫助客戶縮短研發(fā)周期,還能在芯片層面直接提升互聯(lián)性能。通過IP授權(quán)與Chiplet合作,Credo不僅是產(chǎn)品供應商,更是合作伙伴,推動整個生態(tài)在AI時代的互聯(lián)創(chuàng)新。
AI數(shù)據(jù)中心的巨大市場
Chris介紹說,全球范圍內(nèi)至少有11家科技巨頭每年在AI數(shù)據(jù)中心投入超過50億美元,部分企業(yè)的投入甚至超過1,000億美元。若將這些資本支出相加,總額已超過5,000億美元。正如前文中所提及的,根據(jù)英偉達近年來的財報,網(wǎng)絡業(yè)務占公司總業(yè)務的比例已經(jīng)突破15%(約16%)。這意味著在這筆龐大的投資中,約有數(shù)百億美元直接流向高速互聯(lián)與網(wǎng)絡建設(shè)。Chris堅信,對于以太網(wǎng)和光互聯(lián)產(chǎn)業(yè)而言,這無疑是一個前所未有的市場機遇。
與此同時,他進一步解釋,AI網(wǎng)絡與傳統(tǒng)通用計算網(wǎng)絡的最大差異在于架構(gòu)。通用計算網(wǎng)絡主要面向用戶前端,而AI網(wǎng)絡則多出一個后端網(wǎng)絡,用于將成千上萬塊GPU連接在一起,協(xié)同完成大模型訓練。這種雙網(wǎng)絡架構(gòu)使得光收發(fā)器的需求量至少是通用網(wǎng)絡的兩倍,甚至可能達到十倍。正因如此,光互聯(lián)成為AI數(shù)據(jù)中心建設(shè)中增長最快的環(huán)節(jié),也成為Credo光DSP產(chǎn)品線的核心發(fā)力點。
中國市場與未來展望
針對中國市場,Credo特別推出了符合本地需求的Gearbox方案。在國內(nèi)網(wǎng)絡環(huán)境中,交換機與網(wǎng)卡、GPU的速率往往存在代際差異,Gearbox能夠在電口與光口之間實現(xiàn)速率轉(zhuǎn)換,成為兼容不同代際設(shè)備的理想選擇。
Credo的Dove 480等產(chǎn)品正是為這一場景量身定制,支持正向與反向Gearbox應用,幫助客戶在網(wǎng)絡升級過程中平滑過渡,降低整體成本和功耗。同時,公司也強調(diào)供應鏈安全與本地化策略,確保在需求波動和周期縮短的背景下,能夠為國內(nèi)客戶提供穩(wěn)定、快速的交付能力。
在產(chǎn)品演進方面,Credo認為400G/800G產(chǎn)品仍將擁有較長生命周期,在未來幾年繼續(xù)支撐大規(guī)模數(shù)據(jù)中心的建設(shè)。但公司已提前布局1.6T Bluebird DSP,這款基于3nm工藝的單波200G光DSP具備超低功耗和延遲,尤其適合AI網(wǎng)絡的高密度互聯(lián)需求。
該公司的管理層預計,到2028年,1.6T產(chǎn)品預計將超過800G產(chǎn)品的市場規(guī)模。“Credo不只是芯片供應商,而是AI網(wǎng)絡‘運力革命’的推動者。”憑借“三高三低”的技術(shù)優(yōu)勢和完整的產(chǎn)品組合,Credo正在成為全球智算網(wǎng)絡互聯(lián)的重要力量。