光通信、映像伝送ビジネスの実務者向け専門情報サイト

光通信ビジネスの実務者向け専門誌 - オプトコム

有料会員様向けコンテンツ

AIを活用したオンボーディングおよび認証プラットフォームであるHyperVergeが、Edgecoreの高帯域幅・低遅延データセンタ ソリューションで効率化

期間限定無料公開 有料

期間限定無料公開中

 Edgecore Networksは6月12日(台湾 新竹)、HyperVerge向けに、AIトレーニングおよびIPストレージワークロードを処理するための高容量オープンネットワークスイッチを展開すると発表した。

 Broadcom製ハードウェアとSONiC OSを採用したこのソリューションは、厳密なレイテンシ制御を実現し、HyperVergeがシステムを迅速に自己構成することを可能にする。これは、オープンネットワークのスピードと柔軟性を実証するものとなる。
 スイッチの設計が帯域幅と機能要件を満たしていることに加え、オープンネットワークと公開されている標準規格により、HyperVergeチームは独自に、かつ迅速に構成とパフォーマンス ダッシュボードを構築することができた。Edgecore Networksは「これは、オープンエコシステムのメリットを真に証明するものだ」としている。

 HyperVergeのIdentity AI責任者であるManideep Kolla氏は「AIトレーニングワークロードにおいて、ストレージの帯域幅とレイテンシは、コンピューティング能力と同様に重要だ。ボトルネックが発生すると、GPUの利用率が低下する。HyperVergeでは、すべてのNVMeストレージを単一のクラスタ型並列ファイルシステムに統合した。EdgecoreのSONiC搭載100G RoCEv2ロスレスRDMAファブリックにより、ネットワーク経由でGPUクラスタ全体にほぼローカルなNVMeレイテンシと帯域幅でストレージを提供することが可能になった。このインフラストラクチャは、本人確認、デジタルKYC、引受インテリジェンスで使用される顔認識、OCR、カスタムLLMモデルのトレーニングワークロードを支えている」とコメントを出している。

 Edgecore Networksの製品管理・企画担当ヴァイスプレジデントであるNanda Ravindran氏は「AIアプリケーションが企業で普及するにつれ、顧客の成功には効果的かつ効率的なソリューションが求められる」とし、「Edgecoreのハイスループット データセンタ設計とSONiCオープンネットワーキングNOSを組み合わせることで、チームはHyperVergeデータセンタ ストレージ クラスタ向けのソリューションを迅速に設計することができた。特に注目すべきは、オープンネットワーキングの公開コンテンツとすぐに使えるフレームワークを活用することで、チームが効率的かつ自律的に作業を進めたことだ」とコメントを出している。

 Edgecore Networksは「この協業は、当社がオープンネットワーキング技術の発展と、次世代企業向けのインパクトのあるネットワーキング ソリューションの提供に尽力していることを示すものだ」としている。

編集部備考

■本件の技術的意義は、「ネットワーク経由でGPUクラスタ全体に対して、ほぼローカルNVMeに匹敵するレイテンシと帯域でストレージを提供する」という点にあり、近年のAI・GPUデータセンタにおいては、こうしたアーキテクチャが急速に主流化しつつある。

 従来、最も高速なストレージアクセスは各サーバに内蔵されたローカルNVMe SSDによって実現されてきた。しかし、数千規模のGPUを束ねる現在のAIクラスタでは、この構成に限界がある。例えば、サーバごとにストレージ容量が分散することで「容量の偏り」が生じ、リソースの最適活用が難しい。また、大規模言語モデル(LLM)などの学習・推論では膨大なデータを継続的にGPUへ供給する必要があり、ストレージやネットワークの遅延は「GPUの待機時間」を生み、高価な計算資源の非効率を招く。

 こうした課題を解決するために、ストレージをネットワーク越しに共有しつつ、ローカル接続に近い性能を実現するアプローチが注目され、NVMe over Fabrics(NVMe-oF)をベースに、RoCEv2(RDMA over Converged Ethernet v2)を用いることでTCP/IPスタックをバイパスし、低レイテンシかつ高帯域なデータ転送を実現する方法が確立された。その有効性は、既にハイパースケーラーや専用ネットワーク技術を担ってきたプレイヤーが先行的に実証している。
 そして本ニュースは、こうしたフロンティア技術を、より汎用的かつコスト効率の良い構成で再実装するアプローチの技術であり、100GイーサネットとオープンソースのネットワークOSであるSONiCを組み合わせることで実装している。すなわち、先進的で有効性はあるものの構築と運用のハードルが非常に高いアーキテクチャを、「RoCEv2+SONiC+NVMe-oF」という現在のAIインフラにおける王道構成の一つを用い、オープンなネットワーク機器で現実解として提示した点に、本アプローチの価値がある。

■このコストパフォーマンスの改善は、オープンネットワーキングがもたらした最大の恩恵の一つといえる。SONiCのようなオープンなネットワークOSの普及により、企業は特定ベンダに依存せず、Edgecoreのようなホワイトボックススイッチを柔軟に選択できるようになった。もともとハイパースケーラーの大規模運用で鍛えられた技術スタックが、汎用的なイーサネット機器上で再現可能になったことで、従来は一部の巨大企業に限られていた高性能インフラが、より広いプレイヤーに開放されつつある。
 ここで重要なのは、コスト低減に留まらず、「技術・調達・プレイヤー」という三つの存在が同時に変化している点だ。専用ネットワーク技術に依存していた性能優位性はイーサネットで代替され、専用機器中心の調達構造はホワイトボックス化によって柔軟化し、結果としてインフラを構築できる主体もハイパースケーラーから一般企業へと広がっている。この構造変化こそが、AIインフラの普及を加速させる原動力となる。

 もっとも、こうした構成は容易に実現できるものではない。RoCEv2は輻輳制御やネットワーク設計に高度なチューニングを要し、安定運用には相応の知見が求められる。したがって、「低コスト化=容易化」と単純に捉えるべきではないが、それでもなお参入障壁が大きく低下していることは間違いない。

 この結果として期待されるのは、AIサービス全体の好循環だ。インフラコストの低減は、認証システムやLLMといったAIサービスの価格引き下げや性能向上に直結し、最終的にはエンドユーザへの価値還元につながる。さらに、医療、金融、製造、法務といった各業界に特化した高性能AIを、専門企業が自社で開発・運用できる環境が整うことで、AI活用の裾野は一層広がるだろう。

 この流れを纏めると、ハイパースケーラーや専用ネットワーク技術を担ってきたプレイヤーが先行的に確立した「フロンティア技術」を、オープンネットワーキングが「より広いプレイヤーに開放」するという二つの力が相互に作用することで、AIインフラの進化は加速している。一方のみでは成立せず、先端的な性能を追求する領域と、それをコモディティ化して普及させる領域、それによる次の最先端な性能という需要の創出、というサイクルこそが、現在のAI市場のダイナミズムを生み出していると言える。
 AIインフラは現在、性能競争だけでなくアーキテクチャ競争も広がりつつある。その競争力の源泉として、専用技術だけではなく、オープン技術をいかに組み合わせ最適化するかというアプローチも重要性を増している。本件は、その転換点を象徴する一例として位置付けられるだろう。

■ハイパースケーラーがフロンティア技術を開発し、それをオープン化する主なメリットも複数ある。自社だけで囲い込むよりも、オープンにして世界中のメーカーが量産した方が、「自分たちが将来構築するデータセンタのコストが安くなる」「サプライチェーンが柔軟化する」「自社アーキテクチャのデファクト標準化といった戦略」が期待できる。そしてオープン技術を活用する企業が増えていくことでAI利用のインフラが拡大し「ハイパースケーラーのクラウドサービス(ストレージ、データベース、運用ツールなど)全体の利用量が増え、結果として巨大な利益を生む仕組み」に繋がる。すなわち、ハイパースケーラーが限界に挑んで新技術を作る、それをオープン化して市場全体の裾野を広げる(コモディティ化)、それにより市場が拡大してハイパースケーラーがさらに儲かる・次の新技術の需要が生まれる、その利益でさらに次の次元のインフラ投資を行う、という好循環が形成される。今回のニュースは、この循環を確認するための事例の一つとも言える。

 そして次のオープン化として注目される動きも複数あり、例えば、数万台規模の超巨大クラスタになると限界が見えてくるパケットの順序制御などに対応するため、AI専用にゼロから設計し直した次世代オープンネットワーク規格「UEC」のような取り組みがある。また、「液冷技術」の高度化も自社で抱え込まず、仕様をオープン化して一般のデータセンタでもコストパフォーマンスを改善して液冷が導入できるようになりつつ流れもある。さらには、インフラ(ハード)だけでなく、GPUを効率よく動かすためのソフトウェア環境でも、オープンな開発環境によりコードを書き直さずに最速で動かせる環境が志向されている。

 こうした技術トレンドを「現在の現実性」と「将来のロードマップ」のサイクルとして構造的に把握することは、AIインフラに関わるすべてのプレイヤーにとって、向こう5〜10年の事業戦略の成否に関わる有効な指標になる。現在の“現実解”として採用される構成は、将来の“フロンティア技術”の候補を内包しており、その延長線上で次の標準が形成されていく傾向にあるからだ。また、特定技術が専用化・囲い込みへと回帰する可能性が出てきても、構造を把握しておけば趨勢がどちらに傾くかを予測しやすくなる。
 このダイナミックな「オープン化のサイクル」を定点観測しておくことは、変化の激しいAIインフラ市場において、「技術の流行に振り回される側」ではなく、「次に民主化される技術を先回りしておき、ビジネスを成長させる側」に回るための、最も重要な戦略的視点の一つとなるだろう。

(OPTCOM編集部)