This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AI大モデルの台頭 ネットワークデバイスの需要が爆発し、投資のホットスポットとなる
AI大モデル時代におけるネットワークの重要性
大規模モデルの時代において、光モジュールやスイッチなどのネットワーク機器の需要が爆発的に増加し、イテレーションが加速しています。本記事では、ネットワークがAI時代の重要な要素となる理由を探り、ネットワーク側の革新と投資機会について議論します。
ネットワーク需要の出所
大規模モデルの時代に入り、モデルのサイズと単一カードの上限の差が急速に広がっており、業界はトレーニング問題を解決するためにマルチサーバークラスターに移行しています。これはAI時代におけるネットワークの重要性が高まる基盤を形成しています。過去の単純なデータ転送と比較して、現在はネットワークが主にGPU間のモデルパラメーターを同期させるために使用されており、ネットワークの密度と容量に対する要求がより高くなっています。
日々巨大化するモデルのサイズがトレーニングにかかる時間の増加を引き起こしています。トレーニング時間を短縮するためには、計算効率を向上させる必要があり、"デバイス数"と"並列効率"の拡大が直接的に計算能力を決定します。
大規模モデルのトレーニングでは、各計算後に単一カード間での整合が必要であり、ネットワークの伝送と交換に対してより高い要求が課されます。
大規模モデルの訓練は通常数ヶ月続き、中断は巨大な損失をもたらす可能性があります。ネットワークのある部分の障害や遅延が大きすぎると、中断を引き起こすことがあります。現代のAIネットワークは、飛行機や空母に匹敵する複雑なシステム工学となっています。
ネットワーク革新の方向
計算能力への投資規模が数百億ドルに膨れ上がる中、コスト削減、オープン性、そして計算能力のスケールバランスがネットワーク革新の主要なテーマとなっています。
通信媒体の変更: 光モジュールはより高速な通信を追求する一方で、LPO、LRO、シリコンフォトニクスなどの方法でコストを削減しています。銅ケーブルはコストパフォーマンスなどの利点からラック内の接続を占めています。Chiplet、Wafer-scalingなどの新技術がシリコンベースの相互接続の限界を探る加速しています。
ネットワークプロトコルの競争: チップ間通信プロトコルとGPUの強い結びつき、例えばNVIDIAのNV-LINKやAMDのInfinity Fabricなど。IBとイーサネットの競争はノード間通信の主旋律です。
ネットワークアーキテクチャの変化:現在は一般的にリーフ・スパインアーキテクチャが採用されていますが、ノード数が増えるにつれて、その冗長性が超大規模クラスターに大きなネットワークコストをもたらします。ドラゴンフライアーキテクチャ、レール専用アーキテクチャなどが次世代の超大規模クラスター向けの進化方向として期待されています。
投資アドバイス
通信システムのコアリンク:Zhongji Innolight、Xin Yisheng、Tianfu Communication、Industrial Fortune Union、Invic、Shanghai Electric Co.、Ltd。
通信システムの革新:YOFC、Tetherlight、Yuanjie Technology、Centec Communications-U、Cambrian、Taclink。
リスク警告
AIの需要は期待に及ばず、スケーリング法則は無効になり、業界競争が激化しています。