光通信、映像伝送ビジネスの実務者向け専門情報サイト

光通信ビジネスの実務者向け専門誌 - オプトコム

有料会員様向けコンテンツ

AIインフラストラクチャ向けオープン仕様策定をめざす光ベースScale-Upのコンソーシアムが誕生。創設メンバーはAMD、Broadcom、Meta、Microsoft、NVIDIA、OpenAI

期間限定無料公開 有料

期間限定無料公開中

 OCI MSA(The Optical Compute Interconnect Multi-Source Agreement ) グループは3月12日(カリフォルニア州サンノゼ)、AMD、Broadcom、Meta、Microsoft、NVIDIA、OpenAIを創設メンバーとするコンソーシアムの設立を発表した。

 この業界コンソーシアムは、ハイパースケーラー主導のオープンエコシステムへの重要な転換点となり、光スケールアップインターコネクト向けマルチベンダ サプライチェーンの構築を可能にする。OCI MSAメンバーはオープン仕様の策定を通じて、堅牢な光エコシステムを推進し、AIインターコネクトの未来が、現代のAIインフラストラクチャの光インターコネクトニーズを満たす柔軟なマルチベンダ基盤の上に構築されることを保証する。

物理特性と電力効率の課題
 大規模言語モデル(LLM)が超知能へと進化するにつれ、従来の銅線ベースの接続方式は物理的な到達距離の限界に達しつつあり、AIクラスタのスケールアップ領域アーキテクチャに影響を与えている。OCIは、銅線ベースから光ベースのScale-Upアーキテクチャへの移行を可能にし、銅線インターコネクトのボトルネックを解消する。

 公開されているOCI仕様は、電力、レイテンシ、コストを最適化するように設計されている。NRZ変調とWDM光技術を組み合わせ、接続パラダイムをモジュール中心からシリコン中心へと転換する。光モジュールとコンピューティングおよびネットワーク用シリコンとの緊密な統合を可能にすることで、OCIは帯域幅密度とシステム拡張性を大幅に向上させると同時に、従来の銅線ベースの接続方式が要求する厳しい電力目標も達成する。

最先端のコンピューティングと最先端の光通信技術の融合
 OCI MSAは、相互運用可能な光インターフェースプロトコルを確立することで、「プラグアンドプレイ」のエコシステムを実現する。このオープンで相互運用可能な仕様により、ハイパースケーラーは、共通の光物理層(PHY)を介して、あらゆる最上位プロセッサユニット(XPU)エンジンと最上位Scale-Upスイッチを分離することが可能になり、最高クラスのコンピューティングと最先端の光通信技術の融合が保証される。

 標準化されたロードマップは、統合リスクを大幅に低減し、開発サイクルを短縮する。また、AIラック サプライチェーン全体に対し、複数世代・複数ベンダの光インターコネクト展開に向けた、明確でリスクの低い道筋を提供する。

統合技術ロードマップ
 OCI MSAは、AIラックサプライチェーン全体を対象とした拡張性の高いオープン仕様ロードマップを提供し、複数世代のハードウェアにわたるマルチベンダの光PHYおよびインターコネクトの導入を可能にする。

標準化された高密度インターフェース:OCI GEN1 4λ x 50Gbps NRZ(200Gbps/方向)およびOCI GEN2 400Gbps/方向双方向(BiDi)技術を推進し、ファイバあたり最大800Gbpsを実現する。

大規模な拡張性:波長数とデータレートを拡張し、ファイバあたり3.2Tbps以上を実現するロードマップ。GPU数とGPUあたりの帯域幅の両方を向上させることで、Scale-Up領域を実現する。

相互運用可能なフォームファクタ:プラグイン式、オンボード式、およびCo-Packaged Optics(CPO)をサポートする。

大規模化における効率性:これまで銅線接続でしか実現できなかった、厳しい性能、電力、コスト目標を達成する光ソリューションを実現すると同時に、伝送距離を大幅に延長する。

経営陣の見解
 AMDの技術・エンジニアリング担当SVPであるBrian Amick氏は「今世紀後半に大規模AIシステムを支える光Scale-Up インターコネクトへのニーズが高まることは明らかだ。AMDはOCI MSAの創設メンバーであり、強力な支持者として、業界向けのオープン仕様を確立し、堅牢なマルチベンダ光Scale-Up インターコネクト エコシステムの構築を支援している」とコメントを出している。

 Broadcomの光システム部門担当ヴァイスプレジデント 兼 ゼネラルマネージャーであるNear Margalit氏は「Broadcomは、当社の多世代CPOプラットフォームと業界パートナーシップを活用し、OCI仕様の推進に貢献できることを誇りに思っている。OCI-MSAは、既存の電気SerDesベースASICとのシームレスな統合を可能にすると同時に、ASICへの直接統合への明確な道筋を示し、エコシステムの柔軟性と高性能を維持する」とコメントを出している。

 Meta社のハードウェアシステム担当ヴァイスプレジデントであるDan Rabinovitsj氏は「AIクラスタ設計に影響を与える電力とコストの制約に対処する技術へのニーズは、現実的かつ差し迫ったものだ。高性能AIクラスタにおける電気バックプレーンの制約から、より大規模なScale-Upドメインの必要性を切り離すために、このOCIプロトコルの採用を推奨する」とコメントを出している。

 MicrosoftのAzureシステムおよびアーキテクチャ担当コーポレート ヴァイスプレジデントであるSaurabh Dighe氏は「Scale-Upに特化した光技術、プロトコル、およびスイッチアーキテクチャは、スケーラブルなマルチラック型高性能AIコンピューティングドメインを構築するための基盤となる。OCI MSAは、将来を見据えた物理層仕様によってこのビジョンを推進し、オープンスタンダード、差別化された実装、およびシステムアーキテクチャの革新への道を拓く」とコメントを出している。

 NVIDIAのネットワーク担当SVPであるGilad Shainer氏は「NVIDIAは、グローバルなAIインフラストラクチャ全体で共通の光通信規格を確立するための、OCI MSAの創設メンバーだ。最高クラスのコンピューティング能力に最先端の光通信技術を搭載することで、OCI MSAは次世代の超知能に必要な規模と性能を実現できる」とコメントを出している。

 OpenAIのハードウェア責任者であるRichard Ho氏は「人工知能の継続的な向上は、AIスーパーコンピュータのペタフロップス性能、メモリ帯域幅、そしてより広範な領域におけるネットワーク帯域幅の拡張に依存している。OCI MSAは、業界が汎用人工知能(AGI)の実現につながるAIシステムを構築する上で不可欠な存在となるだろう」とコメントを出している。

編集部備考

■AIデータセンターのネットワークは、大きく「Scale-Up」と「Scale-Out」という二つの領域に分けて考えられる。Scale-UpはGPU同士を低遅延で接続する内部ネットワーク、Scale-Outはラック間やクラスタ間を接続するデータセンタネットワークを指す。

 これまでScale-Up領域では、NVIDIAのNVLinkおよびNVSwitchが事実上の標準的存在となってきた。GPUとネットワークを垂直統合したアーキテクチャにより、極めて高い帯域と低遅延を実現しているためだ。
 こうした状況の中で設立されたOptical Scale-Upのコンソーシアムとなる今回のOCI MSAにより、イーサネットベースのオープン仕様によってAIクラスタのScale-Upネットワーク構築が推進されると期待できる。
 これは、AIインフラにおける新たな選択肢を提示する試みとなるが、コンソーシアムに参加しているNVIDIAの立場から見れば、ハイパースケーラー向けにはEthernetベースのオープン規格が適し、フラッグシップ性能を求める用途ではNVLink/NVSwitchが強みを持つと考えられる。このため両アプローチは競合というより、用途に応じて棲み分けられる関係にある可能性がある。

 OCI MSA設立の背景には、AIインフラの急速な拡大への対応という課題がある。数万規模のGPUを接続する大規模クラスタでは、ネットワーク機器のコストや供給体制がシステム全体の構築に大きな影響を与える。そのため、フラッグシップの学習向けの垂直統合型アーキテクチャだけでは、AIインフラがAI市場全体のボトルネックになってしまう懸念がある。そこで、推論サーバや中規模クラスタなど、必ずしも最先端の低遅延接続を必要としない領域では、オープンなエコシステムによるコスト効率と拡張性が重要になる。また、光技術の進展によりScale-UpとScale-Outの境界が曖昧になりつつある点も、この流れを後押ししている。これにより、AIソフトウェア企業は予算を最適に配分し、開発を継続できる。
 また、Broadcom の400G/lane DSPなどの高速光インターコネクト技術や次世代光デバイスの進展は、イーサネットベースのAIネットワークの性能を大きく引き上げる可能性がある。こうした技術を背景に、オープンなエコシステムによって高性能かつコスト効率の高いAIインフラを構築するという選択肢が現実的になった。
 
 こうしてOCI MSAの位置付けを整理すると、従来からのGPUとネットワークを垂直統合したアーキテクチャを補完し、AI市場全体の拡大を支える「共生関係」としての役割が見えてくる。一方で、実際の製品選定やシステム設計の現場では、性能、コスト、消費電力を巡って両アプローチが競合する場面も想定され、その競争が技術進歩を促す側面もあるだろう。こうした標準化の枠組みが整備されることで、3.2T世代に向けた高性能光デバイスや光モジュールも、MSA準拠という形で市場投入しやすくなる。結果として、AIインフラ全体で光インターコネクトの実装が最適化され、コスト低減と性能向上の両立が進むことが期待できる。