Wawancara CoreWeave: permintaan untuk AI tampaknya tumbuh setiap hari

2026/06/20 00:41
👤ODAILY
🌐id

SETELAH GPU, CPU, PENYIMPANAN, DAN PASOKAN LISTRIK MENJADI BOTOL BARU DALAM KOMPUTASI AI.

Wawancara CoreWeave: permintaan untuk AI tampaknya tumbuh setiap hari

Judul asli: Ai Permintaan Tampaknya 'Intensify' Setiap Hari

Foto Tae Kim

Original by Peggy, Block Beats

EDITOR MENEKAN: WAWANCARA INI MENYEDIAKAN JENDELA UNTUK MENGAMATI SIKLUS KALKULATOR AI: PERMINTAAN TIDAK DIDINGINKAN OLEH BUYOUT GPU YANG TERAKHIR, TETAPI DIDORONG OLEH KECERDASAN, PENALARAN, DAN APLIKASI TINGKAT KECERDASAN BUATAN。

Koran ini mewawancarai Brannin McBee, pendiri dan kepala pengembangan petugas CoreWeave, dan Nick Robbins, Ketua Perusahaan Development dan Relasi Investor, untuk mendiskusikan situasi saat ini di pasar AI. Pernyataan inti CoreWeave adalah sederhana - Al tampaknya meningkat dengan cara baru setiap hari, dan bottleneck nyata adalah pergeseran dari "keberadaan GPU" untuk masalah infrastruktur lebih kompleks: jaringan listrik data centres, CPUs, penyimpanan, listrik, menyediakan kemampuan implementasi rantai, dan kesediaan klien untuk membayar biaya tinggi dari generasi baru algoritma。

CoreWeave adalah unik dalam hal ini berada di tengah rantai infrastruktur AI: ia melayani klien garis depan seperti Openai, Anthropic, Meta, Google, Microsoft, Nvidia, serta indra langsung perubahan dalam kebutuhan laboratorium penelitian, klien bisnis dan produsen awan super-besar. Jadi apa yang dilihatnya bukan hanya kekurangan GPU, tapi beban AI itu sendiri berubah secara struktural. Dengan munculnya AI agentic dan model resoning, kebutuhan untuk komputasi tidak lagi terbatas pada GPU, dan pentingnya CPU dan penyimpanan meningkat, dan desain dari pusat data generasi baru harus meninggalkan ruang untuk Vera CPU, server Vera Rubin dan banyak penyimpanan。

Hal ini menjelaskan mengapa kompetisi infrastruktur AI berubah dari pembelian chip sederhana menjadi kemampuan pengiriman proyek yang lebih komprehensif. Mereka yang memiliki akses lebih cepat ke pusat data daya, menyebarkan server, mengakses rantai pasokan dan mengoptimalkan biaya setiap token lebih dekat ke inti siklus pengeluaran modal AI. CoreWeave telah berulang kali menekankan "pelanggan-didorong" di belakangnya adalah penilaian yang jauh lebih besar: produsen awan AI tidak lagi hanya seorang salesman, tetapi membangun kembali generasi berikutnya pabrik AI lebih cepat dari jadwal, berdasarkan peta jalan pelanggan garis depan。

Bagi investor dan pengamat industri, bagian yang paling menarik dari wawancara ini bukanlah angka tunggal, melainkan arah dari infrastruktur buatan: permintaan GPU tetap penting, namun keberhasilan dan kegagalan di masa depan mungkin bergantung pada siapa yang mengirimkan prasarana kompleks pada stabil, dan skala。

Berikut adalah teks asli:

CoreWeave dipandang sebagai pemimpin pasar awal yang inovatif di daerah neocloud。

Ini adalah satu-satunya pelayan awan yang telah menerima tingkat tertinggi "Peringkat Platinum" dari lembaga penelitian IAI, SemiAnalysis. CoreWeave didirikan pada tahun 2017 untuk menyediakan skala besar komputasi GPU untuk starter-up dan skala besar perusahaan。

Konteks Key Context baru-baru ini mewawancarai Brannin McBee, pendiri Co-founder and Chief Development Officer dari CoreWeave, dan Nick Robbins, Ketua Perkembangan Enterprise dan Relations, pada situasi saat ini permintaan AI dan pasar neocloud。

Berikut ini adalah highlights editorial dialog:

PERMINTAAN AI TERUS MENINGKAT

Kapan gelombang permintaan AI dimulai

Kami melihat awal yang sebenarnya kuartal terakhir. Pada saat itu, kami berkomunikasi pada tingkat rekayasa dengan klien kami tentang produk yang mereka harapkan untuk dipasarkan pada kuartal pertama tahun ini。

Ini telah menjadi perspektif yang sangat penting ketika kita melihat kebutuhan klien. Ada hubungan teknik yang saling berhubungan antara kami dan klien kami. Ini adalah hubungan yang memungkinkan kita untuk melihat tren di muka, daripada bereaksi pasif ketika perubahan terjadi。

JIKA DARI SUDUT PANDANG PRODUK DARI PASAR AI, SAYA AKAN MENGATAKAN BAHWA KUARTAL PERTAMA ADALAH WAKTU KETIKA PENALARAN DAN KONSUMSI AI MENJADI BESAR, DAN PERCEPATAN INI TERUS SAMPAI HARI INI。

Bagaimana status Al saat ini dibutuhkan? Apakah tidak ada tanda-tanda perlambatan dalam minggu-minggu terakhir dibandingkan dengan beberapa bulan yang lalu

Nick: Tampaknya tumbuh dengan cara baru setiap hari。

Tolong jelaskan tren ke atas dalam permintaan bagi CPU relatif terhadap GPU dalam gelombang AI kecerdasan. Apakah Anda menyebarkan peleton dari rak CPU Vera sebelah server GPU Nvidia

CoreWeave telah menjalankan CPU sejak 2023. Kami selalu memiliki produk awan lengkap. Jadi pertanyaannya bukan apakah kita baru saja mulai menambahkan CPU, tapi apa yang benar-benar dibutuhkan klien? Apa permintaan ini relatif? Jawabannya sangat jelas, memang。

Sebagai badan cerdas dan penalaran sebenarnya muncul dalam model, kebutuhan penyimpanan meningkat dibandingkan dengan generasi sebelumnya. Saya pikir tren ini akan terus berlanjut。

Nick: Jawaban untuk pertanyaanmu adalah ya. Anda pasti akan melihat banyak CPU Vera dikerahkan di samping banyak server Vera Rubin. Tahun lalu, kami benar-benar merancang ulang program pusat data dasar untuk memungkinkan lebih banyak penyimpanan dan lebih banyak CPU yang akan dikerahkan di sebelah GPU。

Kita melakukannya karena kita berada dalam posisi yang sangat unik di seluruh ekosistem. Kami satu-satunya penyedia layanan awan independen yang melayani semua pengguna teknologi paling canggih. Tidak ada penyedia layanan Al independen lainnya yang dapat mengatakan bahwa Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia dan lainnya adalah pelanggan mereka sendiri。

Ini telah menciptakan roda yang berguna untuk bisnis kita, atau loop umpan balik: kita dapat memahami di mana klien mengambil teknologi dan rencana sesuai。

BOTTLENECKS TIDAK LAGI HANYA GPU

Apakah Anda akan menggunakan Nvidia Vera CPU di masa depan

Nick: Hal ini tergantung pada muatan kerja spesifik. Kami melakukan sesuatu atas dasar permintaan klien. Kami berharap menjadi adopter awal dan penting dari Vera CPU, seperti yang telah kami ungkapkan. Pada saat ini, armada kami sebenarnya didominasi AMD, tapi dari waktu ke waktu, ini dapat berubah menurut kebutuhan klien. Klien yang tertarik pada Vera CPU sangat kuat。

Ini juga pengingat yang baik tentang bagaimana kontrak kami bekerja. Seperti yang Anda tahu, 98% dari pendapatan kita adalah kontraksi. Kami tidak menebak apa yang diinginkan klien infrastruktur. Klien akan memberitahu kita sangat jelas konfigurasi apa yang mereka butuhkan. Semuanya didorong klien. Ini adalah pelanggan yang mendefinisikan apa yang kita sedang membangun。

Bicara tentang pola kompetisi. Bagaimana Anda bisa di pasar dan bersaing dengan penyedia layanan awan besar seperti SpaceX, Nebius, Oracle, dan Afure, AWS, Google

Brannin: saya lebih suka melihat verifikasi pihak ketiga dalam hal diferensiasi. Selain Cina, sembilan dari 10 laboratorium AI terbaik di dunia menggunakan platform kami. SemiAnalysis selalu dipilih keluar kita sebagai tingkat tertinggi kinerja. Saya tidak berpikir bahwa alasan kita mendapatkan tugas GPU ini karena kita memiliki hubungan pribadi dengan Jensen。

Hal ini menunjukkan kepercayaan diri yang kuat pemasok dalam kami implementasi catatan dan kapasitas rekayasa, yang kita dapat menunjukkan terbaik secara global。

Kita bisa memenangkan penyedia layanan awan besar karena kita sangat baik dalam hal itu. Kita dapat membangun sistem ini dengan sangat cepat, dan mereka bekerja dengan sangat baik. Kita bisa memenangkan klien lab penelitian karena kita menyediakan versi teknis terbaik dan melakukan yang terbaik di setiap token。

Kami telah mampu memenangkan klien perusahaan karena infrastruktur memang bekerja dengan baik, dan kami telah membangun hirarki yang sangat baik, sebanding dan optimal, yang merupakan sumber diakui seperti rating platinum。

TAPI SEMAKIN, DI ANTARA PENYEDIA LAYANAN AWAN AI, KAMI TELAH MEMBANGUN LAPISAN KAPASITAS YANG PALING CANGGIH, MELIPUTI ALASAN DAN ALAT-ALAT YANG BERKEMBANG UNTUK MEMBANTU BISNIS BENAR-BENAR MEMASUKKAN AI KE DALAM PRODUKSI。

Ini berarti bahwa kita sedang membangun dan mengantarkan produk yang akhirnya akan membantu perusahaan yang relatif kurang teknologi dewasa untuk mengubah data menjadi model dan menjadi kecerdasan dalam rumah, dan bahwa kita juga dapat menyeberangi layanan awan CoreWeave pasar dalam proses。

Apa itu botol saat ini? Apakah shell pusat data yang sudah memiliki listrik? GPU

Ini adalah shell bertenaga, shell pusat data dengan listrik. Lebih tepatnya, itu adalah komponen di dalam shell. Anda secara khusus disebutkan listrik, yang sangat benar. Ini daerah yang rumit。

Tapi yang penting adalah bahwa kita sudah memiliki 49 situs tersebut on line dan berjalan. Kita tidak menaruh harapan pada satu atau dua stasiun. Kita sudah melakukannya 49 kali。

Ini adalah catatan implementasi yang sangat dalam。

Ini juga berarti bahwa kita telah mengumpulkan banyak pengetahuan tentang bagaimana menangani masalah rantai pasokan, tentang yang pemasok dalam rantai pasokan ini cocok untuk bekerja sama dan yang pemasok tidak。

editor: kerang bubuk mengacu ke pusat data bangunan itu sendiri, termasuk perangkat keras server komputasi aktual。

Apa yang bisa Anda ceritakan tentang biaya dan kekurangan memori HBM? Bagaimana tanggapanmu? Apakah klien perlu menanggung biaya kenaikan harga

Jawabannya adalah ya. Model bisnis kami dirancang untuk mengunci harga GPU yang kami bayar pelanggan kami sambil menandatangani perintah pembelian GPU dan menentukan berapa banyak yang kami bayar. Lebih luas, harga server, yang jelas termasuk biaya HBM。

Itulah bagaimana kita mengisolasi efek fluktuasi harga sehari-hari。

Jika biaya komponen kami meningkat dalam kesepakatan berikutnya, kita akan merefleksikannya dalam harga yang kita pikir dapat dikenakan biaya kepada klien, sehingga melindungi keuntungan kita. Kami dilindungi dengan baik dalam menyalurkan biaya ini kepada klien kami. Ini adalah sesuatu yang kita ikuti sangat erat。

saat ini, akses ke komponen bukanlah hambatan terbesar. penghambat terbesar adalah shell bertenaga. tapi di masa depan, jawabannya mungkin berubah。

Bagaimana Anda mengharapkan penyebaran Vera Rubin untuk mendaki lereng? Apa yang akan terjadi di paruh kedua tahun ini

Nick: Kita adalah perusahaan pertama di dunia untuk memulai dan memvalidasi penuh VR, atau kabinet Vera Rubin. Tahun lalu kami melakukan hal yang sama di GB200, GB300. Saya berharap VR mulai muncul akhir tahun ini。

SAYA MENGHARAPKAN PENYEBARAN YANG BENAR-BENAR BESAR, SANGAT KUAT UNTUK MENDAKI LERENG SEPANJANG TAHUN 2027. RITME INI MIRIP DENGAN GB: GB MULAI MUNCUL PADA TAHUN 2025, TAPI JALAN SKALA BESAR YANG NYATA SEBENARNYA BERJALAN MELALUI 2026. ARTINYA, ADA BANYAK PENYEBARAN PADA AKHIR TAHUN LALU, TAPI INI ADALAH TAHUN YANG BENAR-BENAR BESAR PENYEBARAN GB。

SAYA BERHARAP DALAM 12 SAMPAI 18 BULAN KE DEPAN, VR AKAN MEMILIKI IRAMA YANG SANGAT MIRIP。

QQlink

暗号バックドアなし、妥協なし。ブロックチェーン技術に基づいた分散型ソーシャルおよび金融プラットフォームで、プライバシーと自由をユーザーの手に取り戻します。

© 2024 QQlink 研究開発チーム. 無断転載を禁じます。