#分享 ECOC 2025總結報告:光通訊產業趨勢天使人妻股票板天使人妻25/10/1#分享 ECOC 2025 第二天:VCSEL vs. CPO,誰將勝出?今天是2025 ECOC的第二天,來自 Meta、NVIDIA、Oracle 等來自系統廠、模組商與晶片設計公司的 12 位專家,針對技術路線、可製造性、可靠性與經濟可行性,分享了深入觀點。然而,他們❝ 引用的文章之前寫過兩篇今年的ECOC 2025的文章,我來幫各位做個總結。 今年所呈現的光通訊產業趨勢,核心主題是 AI 投資如何驅動資料中心對高頻寬與能效的需求。 我的報告強調了五大重點議題,包括 AI 作為最大推動力、400G/Lane 與 448G 的技術門檻,以及 Pluggable、LPO 和 CPO 等多樣化的模組與封裝架構。 在市場方面,資料通訊(Datacom)是主要成長動力,預計到 2029 年市場規模將大幅擴張,同時🔺能效與可靠性🔺已成為評估技術(如 OCS 和相干 ZR 技術)的核心指標。 總體而言,產業正處於從傳統電交換向🔻混合光電架構🔻轉型的關鍵時期,以應對 AI 工作負載對極低功耗和延遲的要求。 🔵 AI 需求如何驅動光通訊技術與市場架構,以及預期的影響規模? 🟠 AI 投資與 GPU 集群需求是光通訊產業最大的推動力。 隨著生成式 AI 與大規模 GPU 集群的崛起,資料中心對於頻寬、能效(Energy Efficiency)與可靠性的要求全面提升。AI 將成為光模組市場的主要增長來源,其 CAPEX 規模達數千億美元。 以下將從技術與市場架構的驅動,以及預期的影響規模兩方面,詳細說明 AI 如何重塑光通訊產業: 一、 AI 對於 GPU 集群的需求極為敏感,特別是對於延遲(Latency)與誤碼率(BER),因為重傳會顯著拖慢訓練效率。 因此,光通訊不再只是追求速率,而是追求在功耗、延遲、可靠性與成本之間找到最佳平衡。 1. 核心技術與速率演進 • 關鍵門檻: 400G/lane 與 448G 的電氣介面是產業的關鍵門檻。 • 速率路徑: 400G/lane 是通往 1.6T / 3.2T 模組的必經路徑。元件必須面對 >100 GHz 的調製/接收頻寬挑戰。 • 能效 KPI: Hyperscaler (超大規模資料中心營運商) 設立了核心能效與密度指標:目標是 <4 pJ/bit(每位元功耗)與 >2 Tbps/mm 的 Shoreline 密度。 • 可靠性要求: 系統可靠性必須達到 ASIC 等級或更高,以避免光學成為瓶頸。 2. 模組與封裝架構的多樣化 為了滿足 AI 對於極致能效和密度的需求,模組與封裝架構呈現多路並存的局面: Pluggable: 仍是主流,部署與維護彈性最大。 主要用於 Scale-Out(跨機櫃)場景。 LPO (Linear Pluggable Optics): 能效優於 Retimed pluggable,800G 到 1.6T 已見節能幅度。可維護性較佳。而且比Retimed pluggable 省電約 20–30%。 CPO (Co-Packaged Optics): 能效與密度最佳,相較於 Pluggable 可省電約 65%,相較於 LPO 再省約 35%。 散熱、可靠性、維護是最大挑戰。102.4T CPO 系統需協同設計散熱與光纖走線。 未來格局: 將是 Pluggable + LPO + CPO 的混合共存。 CPO/NPO 預計在 2026–2027 年開始試點商用。 3. 網路架構的分化探索 (Scale-Up vs. Scale-Out) AI 網路將需求分為極短距高密度互連和中長距高頻寬傳輸兩大戰場: • Scale-Up(機櫃內 1–20 m): 集中於同櫃或同排 GPU-to-GPU 互連。 ◦ 需求: 極低延遲、高密度、高散熱能力。 ◦ 技術趨勢: 正從目前以銅纜為主的架構(reach 已縮至 1–2 m) 轉向光化(LPO/CPO/Chiplet Optics)。光化 Scale-Up 預計在 2026–2027 年由新一代 GPU Pod 推動。 • Scale-Out(跨機櫃/DCI): 範圍從數十米延伸至 DCI(10–120 km)。 ◦ 技術趨勢: 主力為 Pluggable 800G/1.6T 模組,以及 ZR/ZR+ 相干技術。 4. OCS 與相干技術的引入 • 光路交換 (OCS, Optical Circuit Switching): 針對 AI 網路中長時大流量(elephant flows)和高度同步的特性。 ◦ 優勢: 傳統電交換帶來的多層 O-E-O 轉換導致高功耗/高延遲。Google 實測 OCS 效益包含功耗節省 40%、成本降低 30%、吞吐量增加 30%。 • 相干技術 (ZR/ZR+): 解決傳統強度調變(IMDD)在速率提升時距離迅速縮短的瓶頸。 ◦ 應用: AI DCI 需求中,超過 95% 的資料中心間距在 ≤120 km。400ZR/800ZR/1600ZR 正好填補 10–120 km+ 的距離灰區。 ◦ 可靠性: 可插拔相干(Pluggable Coherent)具備 DSP/FEC 控誤碼功能,符合 AI workload 對高可靠性的需求。 二、 AI 驅動的預期影響規模與市場預測 AI 投資正推動 Datacom 市場爆炸性增長,成為光通訊產業的核心戰場。 1. Datacom(資料中心光模組) Datacom 市場的增長速度和規模遠超傳統通訊市場: • 市場金額: 2025 年預計約 $15B,到 2029 年預計成長至約 $24B。 • 營收占比: Datacom 營收在滾動年營收中,兩年內翻倍,從 $6B 增至 $12B。2025 Q1 營收佔比 63%,Q2 升至 65%。 • 出貨量: 高速模組出貨量預計從 2024 年的約 2,250 萬顆,成長到 2025 年的約 3,900 萬顆。 • 1.6T 模組: 1.6T 是當前爆點。2025 年上半年已出貨約 2 萬顆,全年預測約 50 萬顆。 • 3.2T 模組: 預計 2029 年才進入實質量產,接棒 1.6T 成為主流。 2. Scale-Up 與 Scale-Out 的市場差異 雖然 Scale-Out(傳統 Datacom 轉向 AI Fabric)仍是市場的主導者,但 Scale-Up(機櫃內互連)代表新興市場的擴展: • Scale-Out 規模: 2025 年 Datacom 模組規模約 ~$23B,預計 2030 年達 ~$30B,主要來自 Scale-Out。 • Scale-Up 增長: 雖然佔比逐步提升,但增長速度更快。Scale-Up 對頻寬的需求是傳統 CPU bus 的 100 倍。 3. 相干(Telecom / ZR)與 OCS 市場 相較於 Datacom 的爆炸性增長,相干與 OCS 市場規模較小但穩定增長,主要滿足 DCI 的能效需求: • 相干市場(含 ZR): 2025 年預計約 $5B,到 2029 年預計成長至約 $8B。核心驅動力來自 800ZR (2024–2026) 與 1600ZR (2027–2028)。 • OCS 市場(新增量): 預計到 2029 年達到約 $1.6B (保守估計),到 2030 年約達 $2B。OCS 的驅動點在於能效與拓撲簡化。 🔵 降低能效與提升可靠性,對於未來 AI 網路設計有哪些關鍵挑戰? 🟠 AI 投資正驅動光通訊技術從追求純粹的速率,轉向追求能效、可靠性、延遲與成本之間的最佳平衡。 在 AI 網路中,能效(Energy Efficiency, E.E.)與可靠性(Reliability, R)已成為超大規模資料中心營運商(Hyperscaler)設定的兩大核心 KPI。 針對這兩個核心目標,未來 AI 網路設計面臨以下關鍵挑戰: 一、 降低能效(E.E.)的關鍵挑戰 Hyperscaler 已經設定了嚴格的能效指標:目標是 <4 pJ/bit(每位元功耗)和 >2 Tbps/mm 的 Shoreline 密度。要實現此目標,主要的挑戰集中在封裝架構、熱管理與高功耗元件的優化: 1. 散熱與架構的協同設計 AI 網路的能耗佔比已上升至 GPU 可用功率的 20% 至 30%。新的光學架構雖然能節省大量電力,但卻帶來巨大的散熱壓力: • CPO/NPO 的散熱難題: CPO(共同封裝光學)相較於 Pluggable 可節省約 65% 的功耗,是能效最佳的方案。然而,CPO 封裝必須採用 液冷(Direct-to-Chip)或浸沒冷卻。設計一個 102.4T CPO 系統需要協同設計散熱與光纖走線,這對系統工程是巨大的挑戰。 • 熱管理瓶頸: 傳統的空冷方式正逼近極限。熱設計必須成為系統設計的「先行者」。 2. 關鍵高功耗元件的優化 光模組中的主要功耗來源難以削減,特別是在速率提升到 400G/lane 甚至更高時: • 冷卻系統與 DSP 功耗: TEC/冷卻器的功耗可佔整體模組的 25%–30%。同時,相干模組中的 DSP(數位訊號處理器)功耗高達 5–15 W。如何有效整合元件(例如 4-in-1 泵浦共用 TEC)以節省冷卻功耗,是技術層面的挑戰。 • 調製器/線性度的取捨: MRM(微環調製器)雖然尺寸小、功耗低,但存在 溫度敏感 的問題,需要加熱調諧,這增加了複雜性,也可能抵銷部分節能效果。此外,它需要突破溫控與線性化才能達到 400G/lane 的要求。 • 高階調變的功耗陷阱: 雖然高階 PAM(如 PAM6/8)能節省頻寬,但這會增加 FEC/DSP 的功耗和延遲。 二、 提升可靠性(R)的關鍵挑戰 AI 網路,特別是 GPU 集群,對網路品質的容忍度極低,可靠性必須達到 ASIC 等級或更高,以避免光學互連成為整個系統的瓶頸。 1. 延遲與 BER 的敏感性 AI 工作負載(workload)對網路的延遲(Latency)與誤碼率(BER)極為敏感。 • 重傳效應: 如果發生光學錯誤,重傳會顯著拖慢訓練效率,導致 AI 訓練集群的同步性受損。因此,光通訊系統的可靠性不再是「夠用就好」,而是影響核心業務效率的關鍵。 • 相干技術的可靠性: 可插拔相干模組(如 ZR/ZR+)雖然透過 DSP/FEC(前向糾錯)來控制誤碼,以符合 AI 對高可靠性的需求,但這也意味著更複雜的處理流程。 2. CPO/NPO 的維護與長期可靠性 CPO 雖然在能效上表現優異,但其架構本質上帶來了嚴峻的可靠性與維護挑戰: • 維護難度: CPO 將光學元件與 ASIC 共同封裝,使得維護彈性遠低於傳統的 Pluggable 模組,這在大規模部署中是系統營運商必須解決的難題。 • 壽命驗證: 儘管業界已累積了超過 1,500 萬小時的 CPO 壽命數據,但如何在極高的溫度和密度下確保其長期高溫壽命,特別是對於新材料如 1060 nm 單模 VCSEL,仍需進一步驗證和突破。 3. 網路架構的可靠性考量 在探索新的 AI 網路拓撲時,可靠性也成為核心挑戰: • OCS 的重構時間: 光路交換(OCS)雖然在功耗、成本和吞吐量上有顯著優勢(Google 實測功耗節省 40%),但目前的技術,如 Google 部署的 OCS,其重構時間是以小時/天計。對於需要動態調整連結或處理突發流量的 AI 網路而言,這是一個功能性可靠性的瓶頸。 • 互通性與標準化: 模組與封裝架構呈現 Pluggable + LPO + CPO 混合共存的局面。確保這些多元技術在互通性、標準化與協同性上達到高可靠度,是未來大規模落地的關鍵。理財投資台股股票股市
股票板天使人妻25/10/1#分享 ECOC 2025 第二天:VCSEL vs. CPO,誰將勝出?今天是2025 ECOC的第二天,來自 Meta、NVIDIA、Oracle 等來自系統廠、模組商與晶片設計公司的 12 位專家,針對技術路線、可製造性、可靠性與經濟可行性,分享了深入觀點。然而,他們❝ 引用的文章