CPUは、A.I.C.C.Uの中心に静かに戻ります

2026/06/04 02:00
🌐ja

GPU よりも CPU が速くなりましたが、AI の「ワークロード」が変更されました。

CPUは、A.I.C.C.Uの中心に静かに戻ります
元のタイトル:CPU、静かにAIの計算機の舞台の中心に戻る
Xuシャン、オプティマスパーク

最後の3年間、AIカルカルロスの物語はほぼGPUの周りにありました。

H100、H200、GB200、GB300、拡大された100,000カロリーのクラスターを取る雲の製造業者に-すべての企業の物語は1つの事を言う:数学のボトルネックはGPUですお問い合わせ CPU は、この物語では、GPU をフォローし、GPU がやりたくないジョブに対して責任を負う重要な「互換性のある」ロールです。

しかし、2026年に始まったこの物語には亀裂がありました。

6月1日、インテルは、クラウド、インテリジェントなAI、Web集中的な作業負荷に専念する北京のパワー6 +プロセッサを開始しました。 これは、Intel 18Aプログラムの最初のCPUデータセンターです。

インテル独自の説明、パワー6+はGPUの「コンパス」ではなく、AIインフラストラクチャを運ぶ私たちは、この底に到達する必要があります組織・流通・データフローの責任。

「AIの拡張は、コンポーネントのオーバーレイではなく、システムの調整された動作に過ぎません。 ケヴォルク・ケチアン、インテルコーポレーションの副社長兼データセンタービジネスのマネージング・ディレクターであるケヴォルク・ケチアンは、会議で発言した。「AIは、スマートの年齢、組織、およびデータフローの分布が新たな制約になったためです。

これは、CPUが現代のAIインフラストラクチャの制御面を維持しているコアの事実を強化します

インテルファミリーの判断だけではありません。 今年2月には、独立した半導体研究機関であるSemiAnalysisが、2026データセンターCPUマップの「CPUリターン」に関する報告書を発行しました。現時点では、AIのトレーニングと推論が大規模に広がると、最後の3年とは異なる方法でCPUが再必須となりますお問い合わせ。

CPUがリードしているのではなく、CPUが新しい位置で再定義されていることを確認するために開く必要があるのはちょうどこの「リターン」です。

I. GPUセントラルフラグメンテーション

CPUが「戻る」理由を理解するには、AIのワークロード自体で起こる変更に戻る必要があります。

過去2年間、AIの算術の主流の物語は訓練されており、毎年4〜10倍の規模を上げ、トレーニングは質量の大きさの並列計算を必要とします。 しかし、トレーニングはAIのワークロードのすべてではありません。

会議のINTELによると、全体的なAI計算機の負荷は3つのカテゴリに広く分けることができます:

最初の1つは..基礎仕事の負荷。ストレージ、データベース、Web、マイクロサービス、CDN、これらはAIではなく、AIはボトムラインを実行します。 この部分は、従来のCPUのメインの戦場のままです。

第二は..トレーニング。フロントラインの大型モデルのトレーニングは、GPUと専門アクセラレータに基づいてほぼ完全に行われます。 過去3年間、誰もが抱える戦いの一部です。

第三は..知能との分解。この部分は急速に成長していますトレーニングとは違いますお問い合わせ。

3番目のカテゴリの主な違いは、ロード自体のパターンです。 トレーニングは、何もないものから「計算」モデルのプロセスであり、非常に並列的であり、シングルポイントピークコンピューティングの必要性は非常に高いです。 しかし、推論と知性はそうではありません。既に訓練されたモデルになるでしょう実際のビジネスをお問い合わせ。

つまり、多くのことがカウントされていないということです社会招聘複数のモデルコラボレーション、コンテキスト管理、異なるエージェント間でのデータフローの調整、ユーザーからの同時リクエストの処理、遅延予測可能性の確保。

これらのことは、GPUはそれで良いものではありません。

「このシナリオでは、GPUレベルの加速を見ることができますが、その主題は従来のCPUに集中した作業負荷です。 Kevork Kechichianは会議で話しました。

この背後にあるより具体的な産業事実があります。 SemiAnalysis は、米国の米国がセットアップした OpenAI の「Fairwater」データセンターを構築した「CPU Return」のレポートで例を挙げました295 MW GPUクラスターをサポートする48 MW CPUおよびストレージビルお問い合わせ。

言い換えれば、その295 MW GPUクラスターが本当に実行するためには、GPUによって生成されたPBクラスのデータフローを処理するために数千のCPUを取り、タスクをスケジュールし、ストレージを管理します。

GPUの計算は、より高くなります「周辺」ニーズが高まるお問い合わせ そして、これらの周囲のCPU上で最終的に落ちる計算の必要性。

つまり、CPUの戻り値が「GPUよりもCPUが再び速くなる」というわけではありません。 AI計算機パターンが「大きなモデルのトレーニング」から「数千のインテリジェントな身体の実行」に通っているときです組織とデータの流れが更にボトルネックになりましたお問い合わせ GPUはこれを修正できません, CPUは可能です。

これは、無視された最後の3年間のAIの物語の反対側です。

- 何ですか? ロードウェイ

インテルの判断は、最大6以上の製品の定義に反映されます。

最も直感的な数字は、最大288コアすべてのエネルギー効率(Eコア)。

EコアとPコアは、過去数年間にCPU構造で作られたIntelの交差です。 Pコアは、CPUの設計目標、従来のサーバーを追求するパフォーマンスコアです。 Eコアは、より弱いモノヌクリアでエネルギー効率の高い原子力ですが、小型で低消費電力で、同じチップ領域の多くを埋めることができます。

6+ がこのフォークを極端に押し込むように強い。288 エネルギー効率が良い核兵器つまり、CPU上のINTELの賭けは「すべての核の速さ」ではなく、「何の核がCPUに収まるか」ということです。

この製品定義のロジックは:スマートボディ、AIのワークロードは、単一の原子力発電の高速化ではなく、同時に数千の光ジョブを実行することができますお問い合わせ 数百のデリゲートを整理するためにサーバーが必要である場合, 数千の推論リクエストを処理すると、数千の同時接続を維持, 飲み込むための288 Eコアの容量は、64 Pコアの単一核性能よりもはるかに重要です。

これは反主流プロダクト定義です。過去数十年にわたって、サーバーCPUの主流の物語は核機能を綴っています主周波数は高くなりますが、IPCはより強く、キャッシュは大きいです。 E-core ルートは、本質的に物語が終わる可能性があることを認識しています。

しかし、一緒に見なければならないことはいくつかあります。

まずは、E-core のルートは Intel に固有のものではありませんお問い合わせ AMDは、密度の最適化、AWSのGravitonシリーズ、AmpereのAmpereOneシリーズ、および「高密度コア+エネルギー効率優先度」の経路に基づいて2023年にベルガモを発売しました。 Ampereは、2024年に公開されたAmbereOne Aurora Road Mapで512のコア番号を達成しました。

インテルは既に存在している業界を追いかけていますインテルはリーダーではありません。 業界を舞台に活躍する選手ですお問い合わせ。

第2、インテル 18A プログラム CPU の 1 つのデータセンターは 6+ ほど強いので、インテル独自の言語で、原子力Eコアよりも重要である可能性があります。

インテル 18A は、過去数年間で最大のベットです。 単なるCPUではなく、Intel Fundry、Inteldeer、スタンドアップのことです。 インテルファウンデーションのストーリーは、18Aプログラムが市場をヒットさせないかどうかをオンにすることはできません。

18Aプログラムで作られた6+の強さに、288に押し込まれたエネルギー効率の数字、そして「性能密度の企業のリード」は一般に発表しましたこれは、市場へのIntelの応答の1つですお問い合わせ N2、Samsung 2nmの世代との競争で市場によって認識し、立つことができるかどうか別の質問です。

第三に、トップ6+の顧客リストには、6+のプライベートインテリジェンスAIインフラストラクチャを使用して、ドイツ通信フラグに基づく5Gコアネットワーク、Tシステムをテストする、トップ6+トップ6+の産業名が含まれている。 クライアントは、CPUデータセンターの伝統的な堅牢なサプライヤーです彼らの調達の選択は市場信号自体ですお問い合わせ。

私は何を話しているかわからないそれは賭ける方法です18Aプロセスによってエネルギー効率の利点が得られる、コア密度は288のEコアによって得られ、AIの推論および理性的なボディ シーンの「高密度、エネルギー効率、高いスループット」のような仕事の負荷。

パワーを取り戻すCPUの話ではありませんが、CPUのストーリーは新しい場所を見つけます。

3。 どちらがうまくいくか

INTEL は CPU のリターンについて教えていましたか? 業界におけるいくつかの他の変数を見る必要があります。

最初の変数はGPUメーカーの反応です。

グレースCPU+Hopper GPUのコンビネーションは、CPUを補完するだけでなく、過去2年間にYvetteによって行われます。 GPU プロデューサー自身が CPU+GPU 全体のプログラムを主流にしている場合、独立したプレイヤーとして CPU プロデューサーの位置が低下します。これは、AMDではなく「CPUは制御面」の物語のINTELの最大の相手です、それはYIN WIDA自身ですお問い合わせ。

2番目の変数は、クラウドメーカーの自己学習CPUです。

AWS Graviton は独自のデータセンターに導入され、AWS 内の一般的なコンピューティング負荷の重要な部分を占めています。 マイクロソフトはCobalt、GoogleはAxionを、Aliは信頼をしていますし、ほぼすべての主要なクラウドメーカーは、ARM アーキテクチャ サーバー、CPU の自己学習ですお問い合わせ。

これらの自己学習CPUは、「高密度、エネルギー効率優先度」のルートに従います - そして最大6+は製品定義で直接競争しています。

つまり、あなたが取たいトップ6+市場ですクラウドディーラーはそれ自体をやっていますお問い合わせ インテルは、クラウドメーカーのCPU以外に十分な市場があることを証明する必要があります。 たとえば、電気通信事業者、プライベートクラウド、および垂直産業データセンター。

第3変数は18Aプログラミング自体です。

インテル 18A の CPU データセンターは 6+ と同じくらい強いので、つまり、チップは製品自体よりもはるかに産業的意義に取り込まれていることを意味しますお問い合わせ 18Aプロセスが歩留まり、性能の安定性、顧客の証明に問題があれば、強い6+の市場の性能は押されます。 一方、18Aが安定している場合、6+はIntel Foundationに息を呑むような空間をもたらす可能性があります。

しかし、18Aは真空で動作しませんでした - N2プロセスは、電気を蓄積し、2026の後半に生産を開始し、Samsung 2nmは途中にあった。インテル 18A は "do it," よりも "do it and lead" を望んでいますそれはより高い標準です。

これらの3つの変数を組み合わせると、6+の最終色はそれ自体だけでなく、クラウドファクトリーチャンバーがCPU、Intel 18A、またはそれがステーションとサムスンと同じ世代と競争に立っているかどうかを勉強し続けるであろうと、CPUロールが若いワイダー自身によって食べられるかどうかにも依存します。

CPUが返した理由です業界レベルの観点から、インテルがリターン配当を自分で得ることができるかどうかはまだ知られていませんお問い合わせ。

3年間、AI CALCULUSステージのCPUのポジションが完成しました。

最後の3年間のスクリプトは「GPUは中心であり、CPUは中央です。」 このスクリプトは 2026 で緩み始めています。CPU は GPU よりも速くなりましたが、AI 独自のアルゴリズムは変更されます。 「モデルをトレイン」から「数千のインテリジェントボディを実行」にAIが拡張されたとき、組織化、コプティング、データフローは、系統的なボトルネックとなり、CPUはこの位置でかけがえのないようになりました。

インテルは、このインテルを6 +まで受けた応答です。 しかし、Intel は配当を自分で得ることができることは可能ですか最終的には、2027、2028のクライアントの部屋に答えます。AMD、ARM、CLOUDMAKER、CPU、YVETTE、CPUの各変数はスクリプトの経過を変更できます。

CPUの戻りは本当ですが、誰がそれでリードを取るつもりですか。

オリジナルリンク
QQlink

Tiada pintu belakang kripto, tiada kompromi. Platform sosial dan kewangan terdesentralisasi berasaskan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Pasukan R&D QQlink. Hak Cipta Terpelihara.