Wawancara CoreWeave: Permintaan AI tampaknya tumbuh setiap hari

2026/06/20 00:43
👤ODAILY
🌐ms

SETELAH GPU, CPU, PENYIMPANAN, DAN PASOKAN DAYA MENJADI BOTLENECK BARU DALAM KOMPUTASI AI.

Wawancara CoreWeave: Permintaan AI tampaknya tumbuh setiap hari

Judul asli: Ai Demand Tampaknya 'Intensifikasi' Setiap Hari

Foto oleh Tae Kim

Dari Peggy, Block Beats

WARTAWAN EDITOR: WAWANCARA INI MENYEDIAKAN JENDELA UNTUK MENGAMATI SIKLUS KALKULATOR AI: PERMINTAAN TIDAK DIDINGINKAN OLEH PEMBELIAN GPU TERAKHIR, TETAPI DIDORONG OLEH PINTAR, PENALARAN DAN APLIKASI AI TINGKAT PERUSAHAAN。

Makalah ini mewawancarai Brannin McBee, wakil pendiri dan kepala petugas pengembangan CoreWeave, dan Nick Robbins, Wakil Presiden Enterprise Development and Investor Relations, untuk membahas situasi saat ini di pasar AI. Pernyataan inti dari CoreWeave ini terus terang – AI tampaknya meningkat dengan cara yang baru setiap hari, dan lengket yang sebenarnya berubah dari \"keberadaan sebuah GPU\" menjadi isu infrastruktur yang lebih kompleks: casing listrik pusat data, CPU, penyimpanan, listrik, kemampuan implementasi rantai pasokan, dan kesediaan klien untuk membayar biaya yang tinggi dari generasi baru algoritme。

CoreWeave unik dalam hal berada di tengah rantai infrastruktur AI: melayani klien garis depan seperti Openai, Anthropic, Meta, Google, Microsoft, Nvidia, serta langsung merasakan perubahan dalam kebutuhan laboratorium penelitian, klien bisnis dan produsen awan super-besar. Jadi apa yang dilihatnya bukan hanya kekurangan "gPU," tetapi beban AI sendiri berubah secara struktural. Dengan munculnya model agentic AI dan resoning, kebutuhan untuk komputasi tidak lagi terbatas pada GPU, dan pentingnya CPU dan penyimpanan meningkat, dan desain pusat data generasi baru harus meninggalkan ruang untuk CPU Vera, server Vera Rubin dan lebih banyak penyimpanan。

Ini menjelaskan mengapa kompetisi infrastruktur AI bergeser dari pembelian chip sederhana ke kemampuan pengiriman proyek yang lebih komprehensif. Orang-orang yang memiliki akses lebih cepat ke pusat data daya, mengirimkan server, mengakses rantai pasokan dan mengoptimalkan setiap biaya token lebih dekat ke inti siklus pengeluaran modal AI. CoreWeave telah berulang kali menekankan "customer-driven" di belakangnya adalah penilaian yang jauh lebih besar: AI cloud produsen tidak lagi hanya seorang salesman, tetapi sedang membangun kembali generasi berikutnya pabrik AI lebih awal dari jadwal, berdasarkan peta jalan pelanggan garis depan。

Bagi para investor dan pengamat industri, bagian yang paling menarik dari wawancara ini bukanlah nomor satu poin, tetapi lebih ke arah kebutuhan infrastruktur AI: GPU tetap penting, tetapi bottenecks menyebar; Nvidia masih berada di inti, tetapi CPU, HBM, penyimpanan dan daya pusat data menjadi variabel baru; dan permintaan AI masih berkembang, tetapi keberhasilan masa depan dan kegagalan mungkin bergantung pada siapa yang mengantarkan infrastruktur kompleks pada daya tahan, stabil dan skala。

Berikut ini adalah teks asli:

CoreWeave dipandang sebagai pemimpin pasar awal yang inovatif di daerah neokloud。

Ini adalah satu-satunya cloud servicer yang telah menerima peringkat tertinggi "Platinum Rating" dari institut penelitian IAI, SemiAnalisis. CoreWeave didirikan pada tahun 2017 untuk menyediakan komputasi GPU skala besar untuk start-up dan perusahaan skala besar。

Konteks Kunci Baru-baru ini mewawancarai Brannin McBee, Co-founder dan Chief Development Officer dari CoreWeave, dan Nick Robbins, Wakil Presiden Pengembangan Enterprise dan Hubungan Investor, pada situasi saat ini permintaan AI dan pasar neocloud。

Berikut ini adalah sorotan editorial dari dialog:

AI DEMAND TERUS MENINGKAT

Kapan gelombang permintaan AI dimulai

Kami melihat awal yang sebenarnya kuartal terakhir. Pada saat itu, kami berkomunikasi di tingkat teknik dengan klien kami tentang produk yang diharapkan dipasarkan pada kuartal pertama tahun ini。

Ini telah menjadi perspektif yang sangat penting ketika kita melihat kebutuhan klien. Ada hubungan mendalam antara kita dan klien kita. Hubungan inilah yang memungkinkan kita melihat tren di muka, daripada bereaksi pasif ketika perubahan terjadi。

JIKA DARI SUDUT PANDANG PRODUK PASAR AI, SAYA AKAN MENGATAKAN BAHWA KUARTAL PERTAMA ADALAH WAKTU KETIKA PENALARAN DAN KONSUMSI AI BERUBAH BESAR, DAN PERCEPATAN INI BERLANJUT HINGGA HARI INI。

Apa status kebutuhan AI saat ini? Apakah tidak ada tanda-tanda melambat dalam beberapa minggu terakhir dibandingkan dengan beberapa bulan yang lalu

Nick: Tampaknya tumbuh dengan cara baru setiap hari。

Tolong jelaskan tren ke atas dalam permintaan CPU relatif terhadap GPU dalam gelombang AI cerdas. Apakah Anda mengerahkan platon Vera CPU rak sebelah Nvidia GPU server

CoreWeave telah menjalankan CPU sejak 2023. Kami selalu memiliki produk awan lengkap. Jadi pertanyaannya bukan apakah kita baru saja mulai menambahkan CPU, tapi apa yang sebenarnya dibutuhkan klien? Apakah permintaan ini dalam hal relatif kenaikan? Jawabannya sangat jelas, memang。

Sebagai badan cerdas dan penalaran sebenarnya muncul dalam model, kebutuhan penyimpanan meningkat dibandingkan dengan generasi sebelumnya. Saya pikir tren ini akan terus berlanjut。

Nick: Jawaban untuk pertanyaanmu adalah ya. Anda pasti akan melihat banyak CPU Vera dikerahkan di sebelah banyak server Vera Rubin. Tahun lalu, kami merancang ulang program dasar pusat data untuk memungkinkan lebih banyak penyimpanan dan lebih banyak CPU untuk dikerahkan di samping GPU。

Kita melakukannya karena kita berada dalam posisi yang sangat unik di seluruh ekosistem. Kami adalah satu-satunya penyedia layanan awan independen yang melayani semua pengguna teknologi paling canggih. Tak ada penyedia layanan awan AI independen lainnya yang dapat mengatakan bahwa Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia dan lainnya adalah pelanggan mereka sendiri。

Ini telah menciptakan roda yang berguna untuk bisnis kita, atau loop umpan balik: kita dapat memahami di mana klien mengambil teknologi dan rencana sesuai。

ORANG-ORANG TIDAK LAGI HANYA GPU

Apakah Anda akan menggunakan Nvidia Vera CPU di masa depan

Nick: Ini tergantung pada beban kerja tertentu. Kami melakukan hal-hal atas dasar permintaan klien. Kami berharap untuk menjadi anak angkat awal dan penting Vera CPU, seperti yang sudah kami ungkapkan. Saat ini, armada kita sebenarnya adalah AMD, tapi seiring waktu, ini mungkin berubah sesuai dengan kebutuhan klien. Ketertarikan klien pada Vera CPU sangat kuat。

Ini juga peringatan yang baik tentang bagaimana kontrak kita bekerja. Seperti yang Anda tahu, 98% dari pendapatan kami adalah kontrak-driven. Kami tidak menebak apa yang diinginkan klien infrastruktur. Klien akan memberitahu kita dengan sangat jelas konfigurasi apa yang mereka butuhkan. Semuanya adalah klien didorong. Ini pelanggan yang mendefinisikan apa yang kita bangun。

Bicara tentang pola kompetisi. Bagaimana kau bisa di pasaran dan bersaing dengan penyedia layanan cloud besar seperti SpaceX, Nebius, Oracle, dan Azure, AWS, Google

Saya lebih suka melihat verifikasi pihak ketiga dalam hal diferensiasi. Selain dari Cina, sembilan dari 10 besar laboratorium AI di dunia menggunakan platform kami. Kita selalu dipilih sebagai level tertinggi prestasi. Saya tidak berpikir bahwa alasan kita mendapatkan tugas GPU ini adalah karena kita memiliki hubungan pribadi dengan Jensen。

Ini menunjukkan keyakinan kuat dari pemasok dalam catatan implementasi kami dan kapasitas teknik, yang dapat kita tunjukkan secara global。

Kita bisa memenangkan penyedia layanan awan yang besar karena kita sangat baik dalam hal itu. Kita bisa membangun sistem ini dengan sangat cepat, dan mereka bekerja dengan sangat baik. Kita bisa memenangkan klien lab penelitian karena kita menyediakan versi teknis terbaik dan melakukan yang terbaik di setiap token。

Kami telah berhasil memenangkan klien perusahaan karena infrastruktur memang bekerja dengan baik, dan kami telah membangun hierarki yang sangat baik, sebanding dan optimal, yang merupakan sumber yang diakui seperti peringkat platinum。

NAMUN SEMAKIN, DI KALANGAN PENYEDIA LAYANAN AWAN AI, KAMI TELAH MEMBANGUN LAPISAN KAPASITAS YANG PALING CANGGIH, MELIPUTI PENALARAN DAN MENGEMBANGKAN ALAT UNTUK MEMBANTU BISNIS BENAR-BENAR MENEMPATKAN AI KE DALAM PRODUKSI。

Ini berarti bahwa kita membangun dan menyampaikan produk yang pada akhirnya akan membantu perusahaan-perusahaan yang relatif kurang matang secara teknologi untuk mengubah data menjadi model dan ke dalam rumah cerdas, dan bahwa kita juga dapat lintas pasar CoreWeave layanan awan dalam proses。

Apa yang sedang terjadi? Apa itu shell pusat data yang sudah memiliki listrik? PU

Ini shell bertenaga, shell pusat data dengan listrik. Lebih tepatnya, itu adalah komponen di dalam shell. Secara khusus kau menyebutkan tukang listrik, yang mana itu benar. Ini adalah daerah yang kompleks。

Tapi yang penting adalah kita sudah memiliki 49 situs seperti itu dan berjalan. Kami tidak berharap pada satu atau dua stasiun. Kita sudah melakukannya 49 kali。

Ini adalah catatan implementasi yang sangat mendalam。

Ini juga berarti bahwa kita telah mengumpulkan banyak pengetahuan tentang bagaimana menangani masalah rantai pasokan, tentang mana pemasok dalam rantai pasokan ini cocok untuk bekerja sama dan mana pemasok tidak。

editor: powered shells mengacu pada pusat data membangun sendiri, mengecualikan perangkat keras server komputasi aktual。

Apa yang dapat Anda ceritakan tentang biaya dan kekurangan memori HBM? Bagaimana tanggapan Anda? Apakah klien perlu menanggung biaya kenaikan harga

Jawabannya ya. Model bisnis kami dirancang untuk mengunci harga GPU kami dikenakan biaya pelanggan kami sementara menandatangani perintah pembelian GPU dan menentukan berapa banyak kita membayar. Secara lebih luas, harga server, yang jelas termasuk biaya HBM。

Itulah bagaimana kita mengisolasi efek fluktuasi harga harian。

Jika biaya komponen kita meningkat dalam kesepakatan berikutnya, kita akan mencerminkannya dengan harga yang kita pikir dapat dibebankan kepada klien, dengan demikian melindungi keuntungan kita. Kami dilindungi dengan baik dalam menyalurkan biaya ini kepada klien kami. Ini adalah sesuatu yang kita ikuti sangat dekat。

saat ini, akses ke komponen bukanlah yang terbesar. bobotneck terbesar adalah shell bertenaga. tapi pada suatu saat di masa depan, jawabannya mungkin berubah。

Bagaimana menurutmu penyebaran Vera Rubin untuk mendaki lereng? Apa yang akan terjadi pada paruh kedua tahun ini

Nick: Kita jelas adalah perusahaan pertama di dunia yang memulai dan sepenuhnya mengesahkan VR, atau kabinet Vera Rubin. Tahun lalu kami melakukan hal yang sama pada GB200, GB300. Saya berharap VR mulai muncul tahun ini。

SAYA MENGHARAPKAN PENYEBARAN YANG BENAR-BENAR BESAR, SANGAT KUAT UNTUK MENDAKI LERENG SEPANJANG 2027. IRAMA INI MIRIP DENGAN GB: GB MULAI MUNCUL PADA TAHUN 2025, TETAPI TANJAKAN SKALA BESAR SEBENARNYA BERJALAN MELALUI 2026. ARTINYA, ADA BANYAK PENYEBARAN PADA AKHIR TAHUN LALU, TAPI INI ADALAH TAHUN PENYEBARAN GB YANG BENAR-BENAR BESAR。

SAYA BERHARAP DALAM 12-18 BULAN KE DEPAN, VR AKAN MEMILIKI IRAMA YANG SANGAT MIRIP。

QQlink

无加密后门,无妥协。基于区块链技术的去中心化社交和金融平台,让隐私与自由回归用户手中。

© 2024 QQlink 研发团队. 保留所有权利.