Litecoin

Sau khi DeepSeek V4 ra mắt: Zhipu và MiniMax lao dốc, Nvidia hoảng loạn

2026/04/25 00:39
👤ODAILY
🌐vi

Con hào đào tạo mô hình lớn của Nvidia ở Trung Quốc đã bị hạ cấp từ “cần thiết” thành “tùy chọn”

Sau khi DeepSeek V4 ra mắt: Zhipu và MiniMax lao dốc, Nvidia hoảng loạn

DeepSeek V4 cuối cùng đã trực tuyến. Đây là khoảnh khắc đã được chờ đợi gần năm tháng. Mô hình chính MoE tham số 1T + phiên bản Flash tham số 285B, tiếp theo là phiên bản 1.6T Pro đầy đủ, có nguồn mở hoàn toàn cho giao thức GitHub, Apache 2.0, đồng thời các trọng số và mã triển khai được phát hành đồng thời.

Ngay khi mô hình ra đời, thị trường vốn đã đưa ra câu trả lời theo 3 cách độc lập và đan xen nhau.


Những phản ứng khác nhau từ thị trường vốn

Chuỗi sức mạnh điện toán chia sẻ A gần như đã tăng vọt. Cambrian đã kết thúc chuỗi tích cực thứ 11 liên tiếp, tăng 3,7% chỉ trong một ngày và mức tăng tích lũy trong tháng vượt quá 60%. Thông tin Haiguang đạt giới hạn hàng ngày là 10% và đóng cửa ở mức +8,4%. Cổ phiếu SMIC A +4,91%, cổ phiếu Hồng Kông +8,81%. Cổ phiếu Huahong Hong Kong đạt mức tối đa +18% và đóng cửa ở mức +12%. Quỹ Khoa học và Công nghệ Chip Cathay ETF đã thu hút 2,4 tỷ nhân dân tệ chỉ trong một ngày, đạt quy mô cao kỷ lục.

Sự kết thúc của công ty mô hình chứng khoán Hong Kong lại mang một màu sắc khác. Zhipu (02513.HK) giảm 8,07%, tỷ lệ bán khống là 9,9%. MiniMax (00100.HK) giảm 7,40% và tỷ lệ bán khống tăng vọt lên 22,87%. Đây là dữ liệu bán khống trong một ngày cao nhất trong lĩnh vực AI ở Hồng Kông trong ba tháng qua. Cả hai công ty đều là đại diện cho làn sóng niêm yết AI trên chứng khoán Hồng Kông vào nửa cuối năm 2025. Khả năng cạnh tranh cốt lõi được ghi trong bản cáo bạch IPO là cùng một câu, "mô hình cơ sở tự phát triển".

Phản ứng ở bên kia Thái Bình Dương cũng cụ thể không kém. Nvidia mở cửa giảm 1,8% vào đêm qua, giảm xuống -2,6% trong ngày và kết thúc ngày giao dịch ổn định. Bài đánh giá thị trường nhanh chóng của Bloomberg đã so sánh sự hợp nhất này với “khoảnh khắc DeepSeek” V3 vào ngày 27 tháng 1. Điểm khác biệt là sự kiện vào tháng 1 là một đợt bán tháo hoảng loạn đã xóa sạch 600 tỷ USD giá trị thị trường chỉ trong một ngày. Cái này giống như một sự đánh giá lại, có cường độ nhẹ nhưng có chiều hướng rõ ràng. Một tuyên bố mới xuất hiện trong biên bản nghiên cứu của tổ chức người mua, "Nhu cầu suy luận AI của Trung Quốc đang bắt đầu tách rời khỏi nhu cầu suy luận AI của Bắc Mỹ."

Việc đặt ba chiếc đĩa này lại với nhau là phán quyết đầu tiên được thị trường viết ra trong vòng 24 giờ sau khi V4 ra mắt. Sau khi nguồn mở giành chiến thắng, tiền lại bắt đầu chọn phe của nó. Những gì có thể định giá không còn là bản thân mô hình nữa mà là mô hình chạy trên thẻ nào và nó được cài đặt trong chuỗi ngành nào.


Với 11 mô hình mới trong 30 ngày, V4 sẽ tiếp thêm lửa cho trại nguồn mở

Bản thân khoảng thời gian phát hành V4 là một phần lý do khiến phản ứng này ngày càng gia tăng.

Cuộn tới 30 ngày qua. Từ ngày 26 tháng 3 đến ngày 24 tháng 4, ít nhất 11 mẫu lớn có tầm ảnh hưởng đáng kể đã được ra mắt hoặc cập nhật lớn trên khắp thế giới và danh sách này bao gồm hầu hết tất cả những hãng sản xuất lớn. Anthropic Opus 4.6, Google Gemini 3.1 Pro, OpenAI GPT-5.5, Mistral Large 3, Meta Llama 4, Dark Side of the Moon Kimi K2.6, Alibaba Qwen3-Next, Byte Beanbao 2.5 Pro, Tencent Hunyuan 3.0, Kimi K2.6 Plus và cuối cùng là DeepSeek V4 được phát hành vào sáng sớm ngày 23 tháng 4.

Trung bình, một mẫu mới được phát hành cứ sau 2,7 ngày. Tốc độ này nhanh đến mức ngay cả các nhà quản lý quỹ cũng không có thời gian để đọc bản phát hành. Nhưng nhìn qua dòng K-line trong 30 ngày của tài sản AI Trung Quốc-Hồng Kông, chỉ có một cái tên có thể để lại dấu ấn lâu dài trên thị trường. GPT-5.5 vào ngày 8 tháng 4 đã khiến Nvidia tăng 4,2% chỉ trong một ngày, đạt mức cao nhất trong một ngày. Sau đó là DeepSeek V4 vào ngày 23-24 tháng 4, khiến chuỗi điện toán Trung Quốc-Hồng Kông trải qua những bước nhảy vọt liên tục.

Sự khác biệt không nằm ở khả năng của mô hình. Sự chênh lệch giữa 11 mẫu xe này trên bảng xếp hạng LMArena trong hầu hết các trường hợp đều không quá 50 điểm và nằm trong dải hẹp “cùng hạng”. Sự khác biệt nằm ở sự chồng chất của hai điều.

Điều đầu tiên là nguồn mở. Trong số 10 mô hình hàng đầu, chỉ có Llama 4 là nguồn mở, nhưng thỏa thuận có trọng số của Llama 4 đi kèm với một danh sách dài các hạn chế thương mại. Cộng đồng nhà phát triển châu Âu và Mỹ nhận được những đánh giá khá thờ ơ và OpenRouter đã rơi khỏi top 10 vào ngày thứ ba sau khi nó xuất hiện trực tuyến. Giao thức của V4 là Apache 2.0, không có ngưỡng trọng lượng, không hạn chế thương mại và mã suy luận được phát hành đồng thời. Đây là mô hình nguồn mở hàng đầu đầu tiên trong sáu tháng qua đã gây áp lực lên phe nguồn đóng ở ba khía cạnh: hiệu suất, giá cả và tính mở.

Điều thứ hai là thời gian. Trong bối cảnh phe nguồn đóng liên tục khuếch đại các bước đi, câu chuyện về nguồn mở đang bị ép lại nhiều lần. Opus 4.6 đã đẩy Nhiệm vụ mã SWE-Bench lên tầm cao mới và GPT-5.5 đặt giá cho mỗi triệu mã thông báo ở điểm neo chìm là 1,25 USD. Liệu nguồn mở có thể bắt kịp nguồn đóng hay không đã là một cuộc tranh luận ở Thung lũng Silicon trong hai năm. V4, một sản phẩm mã nguồn mở hàng đầu với ước tính trực tiếp hàng tháng là 90 triệu, đã khiến cuộc tranh luận bị tạm dừng.

Theo một nhà quản lý quỹ lớn trong nước tại một buổi roadshow, "Trước V4, chúng tôi đã giảm giá khi định giá các mô hình lớn nguồn mở. Sau V4, mức chiết khấu bắt đầu bị đảo ngược."


DeepSeek đã thay đổi bảng giá của chuỗi cung ứng điện toán

Có một dòng trong bản phát hành V4 chưa từng xuất hiện trong bất kỳ tài liệu chính thức nào về mô hình lớn của Trung Quốc: "Ngày 0 Toàn bộ ngăn xếp thích ứng với Cambrian Epoch 590 và Huawei Ascend 950PR, đồng thời mã triển khai là nguồn mở.” Sức nặng của dòng chữ này chỉ có thể hiểu được khi nối ba đường ẩn song song trong 12 tháng qua. Ba vạch tối này lần lượt thuộc về phần cứng, phần mềm và phản ứng của Thung lũng Silicon.

Vạch đậm đầu tiên nằm ở mặt chip. Huawei Ascend 950PR sẽ chính thức được sản xuất hàng loạt vào tháng 12 năm 2025. Máy có sức mạnh tính toán FP4 là 1,56 PFLOPS và dung lượng HBM là 112GB. Đây là lần đầu tiên một chip AI nội địa được so sánh với dòng Nvidia B về các chỉ số cứng. Trong tác vụ suy luận MoE tham số 1T của V4, thông lượng thẻ đơn cao hơn 2,87 lần so với H20. Ngăn xếp phần mềm CANN 8.0 hỗ trợ giúp tối ưu hóa khung suy luận LLM xuống cấp độ người vận hành. Benchmark do DeepSeek công bố cho thấy độ trễ suy luận end-to-end của V4 trên siêu nút Ascend (8 thẻ 950PR) thấp hơn 35% so với cụm H100 có cùng kích thước. Dữ liệu của Cambrian 590 thậm chí còn cấp tiến hơn. Sức mạnh tính toán của FP8 chip đơn tương đương với H100 và giá thấp hơn một nửa.

Vạch tối thứ hai nằm ở phía phần mềm. Dòng chính vLLM đã hợp nhất PR phụ trợ Cambrian MLU vào ngày 22 tháng 4. Lần đầu tiên, khung suy luận nguồn mở hỗ trợ nguyên bản các GPU nội địa không phải của NVIDIA. DCU của Haiguang Information đi theo một con đường khác thông qua hệ sinh thái ROCm, nhưng nó hoàn toàn có thể chạy qua lớp định tuyến MoE của V4. Điều này có nghĩa là việc triển khai V4 không còn “chỉ có thể chạy trên một thẻ nội địa nhất định” mà “có thể được lựa chọn giữa nhiều thẻ nội địa”. Sự phụ thuộc của hệ sinh thái vào các nhà cung cấp duy nhất bị phá vỡ, đây là bước ngoặt quan trọng của sản xuất.

Đường dây ẩn giấu thứ ba đến từ Thung lũng Silicon. Vào ngày 15 tháng 4, Huang Renxun đã được các nhà phân tích hỏi tại cuộc họp báo của TSMC về sự tiến bộ của sức mạnh tính toán nội địa của Trung Quốc. Những lời ban đầu của anh ấy rất lạnh lùng và cụ thể, “Nếu họ thực sự có thể lấy được LLM khỏi CUDA, đó sẽ là một thảm họa đối với chúng tôi.” Chín ngày sau, DeepSeek đưa ra câu trả lời bằng một dòng thông báo về Ngày 0.

Từ "thay thế trong nước" đã được sử dụng quá mức trong ba năm qua đến nỗi chúng không còn ý nghĩa nữa. Nhưng sau sáng 24/4, lần đầu tiên vấn đề này có số liệu cụ thể mà thị trường vốn có thể định giá. Thông lượng thẻ đơn, độ trễ suy luận từ đầu đến cuối, chi phí suy luận và mã triển khai có sẵn trên thị trường đã âm thầm đẩy cuộc chiến kỹ thuật kéo dài này đến ngưỡng sản xuất.

Giá cổ phiếu Cambri 11 Logic của Liên Dương ẩn giấu ở đây. Nó không còn là "kho khái niệm GPU trong nước" mà là "nhà cung cấp cơ sở hạ tầng suy luận DeepSeek V4". Logic tương tự cũng có thể giải thích cho việc cổ phiếu Huahong Hong Kong tăng 12%. Nó sản xuất quy trình tương đương 7nm của 950PR. Mỗi mã thông báo V4 chạy trên Ascend trong nước có nghĩa là một phần năng lực sản xuất ban đầu được chuyển cho NVIDIA và TSMC bị mắc kẹt ở Châu thổ sông Châu Giang.

Bước tiếp theo đã được đặt ra. Trong lộ trình của Huawei, 950DT (phiên bản huấn luyện) dự kiến ​​sẽ được giao vào quý 4 năm 2026 và mục tiêu tương ứng là “đào tạo toàn bộ các mẫu V5 hoặc tương đương trên cụm 10.000 thẻ”. Nếu con đường này được thông thoáng, con hào của CUDA về phía đào tạo mô hình lớn của Trung Quốc sẽ bị hạ cấp từ “cần thiết” xuống “tùy chọn”.

QQlink

Tidak ada "backdoor" kripto, tidak ada kompromi. Platform sosial dan keuangan terdesentralisasi berdasarkan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Tim R&D QQlink. Hak Cipta Dilindungi Undang-Undang.