CPU lặng lẽ trở lại trung tâm sân khấu sức mạnh tính toán AI
Không phải CPU nhanh hơn GPU mà là “khối lượng công việc” của AI đã thay đổi.

Tiêu đề gốc: "CPU, lặng lẽ trở lại trung tâm của giai đoạn sức mạnh tính toán AI"
Tác giả gốc: Xu Shan, Geek Park
Trong ba năm qua, câu chuyện về sức mạnh tính toán AI hầu như chỉ xoay quanh GPU.
Từ H100 và H200 của NVIDIA đến GB200 và GB300, đến cụm 100.000 thẻ mà các nhà cung cấp đám mây đang gấp rút mở rộng - tất cả các câu chuyện trong ngành đều nói lên một điều: Nút thắt cổ chai của sức mạnh tính toán là GPU. Trong câu chuyện này, CPU từ lâu đã được coi là vai trò “hỗ trợ” kém quan trọng hơn. Nó tuân theo GPU và chịu trách nhiệm thực hiện một số nhiệm vụ mà GPU không muốn thực hiện.
Nhưng bắt đầu từ năm 2026, một số vết nứt đã xuất hiện trong câu chuyện này.
Vào ngày 1 tháng 6, Intel đã ra mắt bộ xử lý Xeon 6+ tại Bắc Kinh, được thiết kế dành cho nền tảng đám mây, AI thông minh và khối lượng công việc sử dụng nhiều mạng. Đây là CPU trung tâm dữ liệu đầu tiên dựa trên quy trình 18A của Intel.
Theo mô tả của riêng Intel, Xeon 6+ không chịu trách nhiệm về "sự hỗ trợ" của GPU mà là "mặt phẳng điều khiển" của cơ sở hạ tầng AI, chịu trách nhiệm điều phối, đồng thời và luồng dữ liệu.
"Con đường mở rộng AI không nằm ở sự chồng chất của các thành phần, mà nằm ở sự vận hành phối hợp của hệ thống." Kevork Kechichian, phó chủ tịch điều hành kiêm tổng giám đốc Bộ phận Trung tâm Dữ liệu của Intel, cho biết tại cuộc họp truyền thông: "Khi AI tiến tới kỷ nguyên của các tác nhân, việc điều phối, xử lý đồng thời và luồng dữ liệu đã trở thành những yếu tố hạn chế mới.
Điều này một lần nữa củng cố một thực tế cốt lõi: CPU vẫn là cốt lõi của AI hiện đại. Mặt phẳng điều khiển của cơ sở hạ tầng."
Đây không chỉ là nhận định của Intel. Vào tháng 2 năm nay, tổ chức nghiên cứu bán dẫn độc lập SemiAnalysis đã công bố báo cáo bố cục CPU trung tâm dữ liệu năm 2026 có tên "CPU Return" và nhận định được đưa ra cũng đơn giản không kém. Khi việc đào tạo và suy luận AI đang được triển khai trên quy mô lớn, CPU lại đang cần thiết theo một cách hoàn toàn khác so với ba năm qua.
Chỉ là sự "trở lại" này cần được mở ra để thấy rằng không phải CPU lại là nhân vật chính mà là CPU được xác định lại ở một vị trí mới.
1. Những vết nứt trong lý thuyết lấy GPU làm trung tâm
Để hiểu lý do tại sao CPU lại "quay trở lại", trước tiên chúng ta phải quay lại những thay đổi đang diễn ra trong chính khối lượng công việc AI.
Trong hai năm qua, câu chuyện chủ đạo về sức mạnh tính toán AI đã được đào tạo. Quy mô đào tạo mô hình quy mô lớn mỗi năm tăng từ 4 đến 10 lần. Việc đào tạo đòi hỏi tính toán song song lớn và GPU là nhân vật chính tuyệt đối trong vấn đề này. Nhưng đào tạo không phải là tất cả và kết thúc tất cả khối lượng công việc AI.
Theo đánh giá của Intel tại cuộc họp giao tiếp, toàn bộ khối lượng công việc điện toán AI có thể được chia đại khái thành ba loại:
Loại đầu tiên làkhối lượng công việc cơ bản. Bộ lưu trữ, cơ sở dữ liệu, Web, vi dịch vụ, CDN, đây không phải là AI mà là các dịch vụ cơ bản cần thiết để AI chạy. Phần này vẫn là chiến trường chính của các CPU truyền thống.
Loại thứ hai làđào tạo. Việc đào tạo các mô hình lớn tiên tiến gần như hoàn toàn dựa vào GPU và bộ tăng tốc chuyên dụng. Đây là phần mà mọi người đã đấu tranh trong suốt ba năm qua.
Loại thứ ba làcác tác nhân lý luận và thông minh. Phân khúc nàyđang phát triển nhanh chóngvà có sự khác biệt đáng kểvới đào tạo.
Sự khác biệt chính ở loại thứ ba là hình thức của khối lượng công việc. Đào tạo là quá trình "tính toán" một mô hình từ đầu, có tính song song cực cao và nhu cầu cực kỳ cao về sức mạnh tính toán đỉnh điểm đơn. Nhưng các tác nhân lý luận và thông minh thì không - nó cần triển khai mô hình đã được đào tạo để chạy trong kinh doanh thực tế.
Điều này có nghĩa là nhiều thứ không được "tính toán" mà là sự điều phối: lên lịch cộng tác nhiều mô hình, quản lý bối cảnh, điều phối luồng dữ liệu giữa các tác nhân khác nhau, xử lý các yêu cầu đồng thời của người dùng và đảm bảo độ trễ có thể dự đoán được.
GPU không giỏi làm những việc này.
“Trong kịch bản này, chúng ta có thể thấy sự kết hợp giữa khả năng tăng tốc ở cấp độ GPU, nhưng phần chính vẫn là khối lượng công việc với CPU truyền thống làm cốt lõi.” Kevork Kechichian phát biểu tại cuộc họp giao tiếp.
Có một thực tế công nghiệp cụ thể hơn đằng sau vấn đề này. SemiAnalysis trích dẫn một ví dụ trong báo cáo "CPU Return": Trong trung tâm dữ liệu "Fairwater" do Microsoft xây dựng cho OpenAI, CPU và tòa nhà lưu trữ 48 megawatt hỗ trợ cụm GPU 295 megawatt.
Nói cách khác, để cụm GPU 295 megawatt thực sự chạy, cần có hàng nghìn CPU để xử lý các luồng dữ liệu cấp PB do GPU tạo ra, lên lịch tác vụ và quản lý bộ nhớ.
Sức mạnh tính toán của GPU càng được đẩy cao thì "nhu cầu sức mạnh tính toán ngoại vi" mà nó tạo ra càng lớn. Nhu cầu về sức mạnh tính toán ngoại vi này cuối cùng sẽ thuộc về CPU.
Nói cách khác, sự trở lại của CPU không phải là "CPU lại nhanh hơn GPU". Nhưng khi hình thức sức mạnh tính toán AI mở rộng từ "đào tạo một mô hình lớn" sang "điều hành hàng nghìn tác nhân", việc điều phối và luồng dữ liệu lại trở thành điểm nghẽn. GPU không thể giải quyết vấn đề này, CPU thì có thể.
Đây là một khía cạnh khác đã bị bỏ qua trong câu chuyện về AI trong ba năm qua.
2. Xeon 6+ đang đặt cược vào con đường nào?
Quyết định đặt cược của Intel được phản ánh trong định nghĩa sản phẩm Xeon 6+.
Con số trực quan nhất là lên tới 288 lõi, tất cả đều là lõi tiết kiệm năng lượng (E-core).
E-core và P-core là những nhánh kiến trúc CPU của Intel trong vài năm qua. Lõi P là lõi hiệu suất theo đuổi hiệu suất lõi đơn tối ưu và là mục tiêu thiết kế của CPU máy chủ truyền thống. E-core là lõi tiết kiệm năng lượng. Hiệu suất lõi đơn của nó yếu hơn nhưng có diện tích nhỏ và mức tiêu thụ điện năng thấp. Nó có thể lắp nhiều lõi hơn vào cùng một khu vực chip.
Xeon 6+ phát huy tính năng này đến mức tối đa. 288 lõi tiết kiệm năng lượng, Điều này có nghĩa là điều Intel đang đặt cược vào CPU không phải là "tốc độ của mỗi lõi" mà là "có thể gói bao nhiêu lõi vào một CPU".
Logic của định nghĩa sản phẩm này là: Khối lượng công việc của tác nhân thông minh AI không phải là vấn đề lõi đơn có thể chạy nhanh đến mức nào mà là liệu nó có thể chạy hàng nghìn tác vụ nhẹ cùng lúc hay không. Khi máy chủ cần điều phối hàng trăm tác nhân cùng lúc, xử lý hàng nghìn yêu cầu suy luận và duy trì hàng chục nghìn kết nối đồng thời, khả năng thông lượng của 288 lõi E quan trọng hơn nhiều so với hiệu suất lõi đơn của 64 lõi P.
Đây là một định nghĩa không chính thống về sản phẩm. Trong vài thập kỷ qua, quan điểm chủ đạo về CPU máy chủ là cố gắng đạt được hiệu suất lõi đơn với tốc độ xung nhịp cao hơn, IPC mạnh hơn và bộ nhớ đệm lớn hơn. Về cơ bản, lộ trình E-core thừa nhận: câu chuyện đó có thể sắp kết thúc.
Nhưng có một số điều cần phải được xem xét.
Đầu tiên, Con đường E-core không phải chỉ có ở Intel. AMD ra mắt Bergamo vào năm 2023, dựa trên lõi Zen 4c được tối ưu hóa về mật độ. Dòng Graviton của AWS và dòng AmpereOne của Ampere từ lâu cũng đã đi theo lộ trình "lõi mật độ cao + ưu tiên tiết kiệm năng lượng". Trong lộ trình AmpereOne Aurora được Ampere công bố vào năm 2024, số lượng lõi đã lên tới 512.
Nói cách khác, Xeon 6+ là Intel đang theo đuổi một hướng đi hiện có trong ngành - Intel không phải là người dẫn đầu mà là một người chơi quay trở lại định hướng của ngành.
Thứ hai, Xeon 6+ là CPU trung tâm dữ liệu đầu tiên dựa trên quy trình 18A của Intel. Trong bối cảnh riêng của Intel, điều này có thể quan trọng hơn “Lõi E 288 lõi”.
Intel 18A là vụ đặt cược lớn nhất của Intel trong vài năm qua. Thứ mà họ chịu trách nhiệm không chỉ là CPU mà là liệu Intel Foundry, mảng kinh doanh đúc của Intel, có đứng vững được hay không. Nếu quy trình 18A không thể đưa được một sản phẩm khả thi ra thị trường, câu chuyện của Intel Foundry sẽ không thể tiếp tục.
Xeon 6+ được sản xuất bằng quy trình 18A, số lõi tiết kiệm năng lượng đã được đẩy lên 288 và được công bố là "dẫn đầu ngành về mật độ hiệu suất". Đây là một trong những câu trả lời của Intel cho thị trường. Liệu nó có được thị trường công nhận hay không và liệu nó có thể cạnh tranh với TSMC N2 và Samsung 2nm hay không lại là một câu hỏi khác.
Thứ ba, một số cái tên có ý nghĩa công nghiệp đã xuất hiện trong danh sách khách hàng Xeon 6+ - Ericsson đang thử nghiệm mạng lõi 5G với Xeon 6+ và T-Systems, một công ty con của Deutsche Telekom, đang sử dụng Xeon 6+ để xây dựng cơ sở hạ tầng AI thông minh riêng. Cả hai khách hàng đều là những người mua CPU trung tâm dữ liệu theo truyền thống vàbản thân các lựa chọn mua hàng của họ cũng là tín hiệu thị trường.
Khi xem xét ba điều này cùng nhau, Xeon 6+ đang đặt cược vào con đường này: sử dụng quy trình 18A để đạt được lợi thế về hiệu quả năng lượng, sử dụng 288 lõi E để đạt được mật độ lõi và đặt cược vào khối lượng công việc "mật độ cao, hiệu quả sử dụng năng lượng cao và thông lượng cao" trong các kịch bản tác nhân và suy luận AI.
Đây không phải là câu chuyện CPU quay trở lại giai đoạn chủ lực về sức mạnh tính toán mà là câu chuyện CPU tìm được vị thế mới.
3. Liệu điều này có đúng không?
Câu chuyện “sự trở lại của CPU” được Intel kể có phải là sự thật? Chúng ta cần xem xét một số biến số khác trong ngành.
Biến số đầu tiên là phản ứng của các nhà sản xuất GPU.
NVIDIA cũng đã làm những việc liên quan đến "dàn nhạc" trong hai năm qua. Sự kết hợp giữa Grace CPU + GPU Hopper chính là sự bổ sung của NVIDIA cho CPU. Nếu các nhà sản xuất GPU tự mình đưa giải pháp “CPU + GPU” tổng thể trở thành xu hướng chủ đạo thì vị thế của các nhà sản xuất CPU với vai trò độc lập sẽ bị thu hẹp. Đây là đối thủ lớn nhất của Intel trong câu chuyện “CPU là mặt phẳng điều khiển”. Đó không phải là AMD mà là chính Nvidia.
Biến thứ hai là CPU tự phát triển của nhà cung cấp đám mây.
AWS Graviton đã được triển khai trên quy mô lớn tại các trung tâm dữ liệu của AWS và đảm nhận một phần đáng kể khối lượng công việc điện toán chung nội bộ của AWS. Microsoft đang sản xuất Cobalt, Google đang sản xuất Axion và Alibaba đang sản xuất Etian. Hầu hết tất cả các nhà cung cấp đám mây lớn đều đang phát triển CPU máy chủ dựa trên ARM của riêng họ.
Những CPU tự phát triển này cũng đi theo lộ trình "đặt mật độ cao, tiết kiệm năng lượng lên hàng đầu" - và cạnh tranh trực tiếp với Xeon 6+ về định nghĩa sản phẩm.
Nói cách khác, các nhà cung cấp đám mây đang tự mình làm điều đó tại thị trường mà Xeon 6+ muốn giành chiến thắng. Intel cần chứng minh rằng vẫn còn một thị trường đủ lớn ngoài CPU do các nhà cung cấp đám mây tự phát triển. Ví dụ: các nhà khai thác viễn thông, đám mây riêng và trung tâm dữ liệu trong các ngành dọc.
Biến thứ ba là chính quy trình 18A.
Xeon 6+ là CPU trung tâm dữ liệu đầu tiên của Intel 18A. Bản thân điều này có nghĩa là con chip này có ý nghĩa công nghiệp vượt xa bản thân sản phẩm. Nếu quy trình 18A gặp vấn đề về năng suất sản xuất hàng loạt, độ ổn định hiệu suất và xác minh khách hàng, hiệu suất thị trường của Xeon 6+ sẽ bị kéo xuống. Đổi lại, nếu 18A hoạt động ổn định, Xeon 6+ có thể mang lại cho Intel Foundry một chút không gian để thở.
Nhưng 18A không chạy trong chân không - quy trình N2 của TSMC sẽ bắt đầu được sản xuất hàng loạt vào nửa cuối năm 2026 và quy trình 2nm của Samsung cũng đang được triển khai. Điều Intel 18A muốn đạt được không chỉ là “làm được” mà còn là “có thể dẫn đầu sau khi làm được”. Đây là một tiêu chuẩn cao hơn.
Đặt ba biến này lại với nhau, chất lượng cuối cùng của Xeon 6+ không chỉ phụ thuộc vào chính nó mà còn phụ thuộc vào việc Nvidia có đảm nhận vai trò CPU hay không, liệu các nhà cung cấp đám mây có tiếp tục phát triển CPU của riêng họ hay không và liệu Intel 18A có đứng vững trong cuộc cạnh tranh với TSMC và Samsung hay không.
Đây là lý do tại sao "lợi nhuận của CPU" là đúng nếu nhìn từ góc độ cấp ngành, nhưng vẫn chưa rõ từ góc độ liệu Intel có thể nhận được làn sóng cổ tức này hay không.
Cuộc chiến giành vị trí của CPU trên sân khấu sức mạnh tính toán AI đã diễn ra được 3 năm.
Kịch bản ba năm qua là "GPU là trung tâm và CPU là thiết bị hỗ trợ". Kịch bản này bắt đầu nới lỏng vào năm 2026 - không phải CPU lại nhanh hơn GPU mà chính sức mạnh tính toán AI đang thay đổi. Khi AI mở rộng từ "đào tạo mô hình" sang "điều hành hàng nghìn tác nhân", những thứ như điều phối, đồng thời và luồng dữ liệu một lần nữa trở thành nút thắt cổ chai của hệ thống và CPU trở thành không thể thay thế ở vị trí này.
Intel đặt cược vào điều này và Xeon 6+ chính là câu trả lời. Nhưng liệu điều này có đúng hay không và liệu Intel có thể nhận được làn sóng cổ tức này hay không cuối cùng sẽ được trả lời trong phòng máy tính của khách hàng vào năm 2027 và 2028. AMD, phe ARM, các nhà sản xuất đám mây phát triển CPU của riêng họ và NVIDIA tự sản xuất CPU. Mọi biến có thể thay đổi hướng của tập lệnh.
Sự trở lại của CPU là có thật nhưng ai sẽ dẫn dắt sự trở lại này vẫn chưa được xác định.
Liên kết gốc
