Pada era AI, pertempuran terakhir Token antara penawaran dan permintaan

Judul video: Wawancara Super and Demand dari Al Tokens 124; Dylan Patel

Video By Invest Like The Best

Foto oleh Peggy Block Beats

Editor menekan: Terhadap latar belakang lompatan terus-menerus dalam kapasitas model AI, akses besar-besaran dari alat-alat seperti Claude Code and Cursor ke perusahaan-perusahaan, diskusi industri beralih dari "model-model yang kuat" ke "model-model yang bagus dalam produksi". Tapi ketika pemrograman AI, analisis otomatis dan pemodelan data muncul sebagai konsensus baru, pertanyaan bottom-up mulai muncul: ketika biaya implementasi secara cepat ditekan, apakah kelangkaan tenaga kerja, modal atau akses ke model perbatasan dan token

Kiri untuk Patrick O 'Shaughtnessy, kanan untuk Dylan Patel

Pos ini diselenggarakan oleh Patrick O 'Shaughtnessy dalam percakapan dengan Dylan Patel, pendiri SemiAnalysis. Dylan telah lama difokuskan pada AI Infrastruktur, Semikonduktor Suplai Chain dan Model Ekonomi, dialog di mana ia membahas bagaimana AI dapat mengubah organisasi perusahaan, layanan informasi, permintaan tanda, rantai pasokan komputasi, dan sentimen sosial, dimulai dari pengeluaran perusahaan Claude Code sendiri。

Apa yang paling menarik tentang percakapan ini adalah bukan bahwa model sedang diperbarui lagi, benchmark, tetapi bahwa itu menyediakan cara untuk memahami ekonomi AI - untuk melihat AI sebagai sistem produksi yang secara massal kapasitas implementasi, efisiensi organisasi dan keuntungan industri, bukan hanya upgrade perangkat lunak。

Percakapan ini bisa dipahami dari lima sudut。

Pertama, biaya implementasi rusak。& nbsp; Di masa lalu, ide-ide tidak langka, dan apa yang benar-benar sulit adalah mengubahnya menjadi produk, sistem, dan pengantar. Sekarang, Claude Code, yang memungkinkan staf non-teknis untuk menulis kode, menerapkannya, dan melakukan analisis data, akan membutuhkan jangka panjang pemeliharaan tim, dimulai dengan beberapa menggunakan model. Biaya tahunan Claude Code di Semianallysis telah mencapai $7 juta, lebih dari seperempat dari pengeluaran gajinya, yang berarti AI tidak lagi hanya alat efisiensi tetapi berubah menjadi modal produksi baru untuk perusahaan。

Kedua, industri layanan informasi pertama kali ditulis ulang。& nbsp; Dylan bisnis pada dasarnya penjualan analitis, penasihat dan data set, yang merupakan daerah yang paling mudah dimodifikasi oleh AI. Chip analisis terbalik, modelling jaringan energi, indikator makroekonomi, yang mungkin membutuhkan masukan tim jangka panjang di masa lalu, sekarang dapat digunakan oleh beberapa untuk membangun produk yang tersedia dalam beberapa minggu. Ini berarti tekanan AI pada ISS bukan "akan menggantikan?" Ini adalah "yang dapat kembali terlibat lebih cepat". Perusahaan yang tidak menggunakan AI akan dimodifikasi lebih cepat, sementara mereka yang menggunakan AI harus terus meningkatkan standar untuk menghindari digantikan oleh pesaing yang lebih efisien berikutnya。

pada tingkat yang lebih dalam, token menjadi sumber daya produksi baru。& nbsp; digunakan untuk membeli subscriptions perangkat lunak, isu utama adalah apakah alat ini bekerja dengan baik; sekarang, garis depan hak akses model, batas rate, kontrak perusahaan dan anggaran token mulai menentukan kapasitas produksi secara langsung. Model yang lebih kuat tidak selalu berarti biaya yang lebih tinggi, sebagai token cerdas mungkin mengambil langkah-langkah lebih sedikit untuk melakukan nilai tinggi tugas. Kompetisi sebenarnya adalah pindah dari "yang menggunakan AI" ke "siapa yang mendapat model terkuat dan menggunakan token paling mahal dalam skenario bernilai tertinggi"。

Permintaan ini juga akan terus disalurkan ke seluruh rantai pasokan。& nbsp; token gunakan surge dan akhirnya menjadi sebuah tekanan konstan pada pengeluaran modal GPU, CPU, memori, FPGA, PCB, tembaga balok, peralatan semikonduktor dan pabrik kristal. Ini adalah logika di balik referensi terhadap "efek cambuk sapi": hilir, tampaknya, hanya model yang telah meningkat permintaan untuk panggilan, tetapi dapat ditransmisikan hulu ke dalam perintah, perluasan produk dan kenaikan harga yang berlipat ganda. Distribusi keuntungan dari industri tersebut tidak terbatas pada perusahaan model dan NVIDIA, namun terus tumpah di sepanjang rantai semikonduktor dan pusat data。

Dan akhirnya, rebound sosial AI bisa datang lebih awal. & nbsp;Keprihatinan publik tentang pengganti pekerjaan, konsumsi energi, perluasan pusat data dan konsentrasi kekuasaan akan meningkat secara bersamaan saat AI memasuki aliran kerja. Dylan bahkan memprediksi protes besar melawan AI dalam waktu tiga bulan. Untuk perusahaan model, terus menekankan bahwa "AI akan mengubah dunia" tidak selalu mengurangi kecemasan, tapi mungkin memperkuat imajinasi orang biasa tentang kehilangan kendali. Industri AI kemudian perlu membuktikan bukan hanya kemampuan teknologinya, tapi bagaimana menciptakan nilai-nilai konkret dan umum yang dirasakan di masa sekarang。

Hari ini, isu utama AI bergerak dari "apa yang model bisa lakukan" ke "yang dapat mengakses model, bagaimana mereka dapat digunakan, dan yang dapat menangkap nilai yang diciptakan oleh model". Dalam hal ini, subjek dari diskusi ini bukan hanya Claude Code, Anthropic atau perusahaan AI, melainkan sebuah struktur yang menyusun ulang sekitar produktivitas, pengeluaran modal, efisiensi organisasi dan penerimaan sosial。

Berikut ini adalah teks asli (untuk memfasilitasi membaca dan memahami, teks asli telah dikonsolidasikan):

TL; DR

VARIABEL INTI AI BERGERAK DARI "DAPAT ATAU TIDAK" KE "NILAI TIDAK LAYAK DILAKUKAN", DAN KELANGKAAN SEBENARNYA DARI BIAYA IMPLEMENTASI ADALAH IDE BERNILAI TINGGI YANG DAPAT DIPERBESAR OLEH MODEL。

Claude Code menghabiskan 25 persen biaya gaji hanya untuk memulai dengan, Al bergerak dari perangkat lunak alat untuk perusahaan modal produksi baru。

kompetisi untuk model garis depan tidak lagi hanya kompetisi kapasitas, melainkan kompetisi untuk hak-hak token; hambatan bisnis baru dapat dibuat oleh mereka yang dapat memperoleh model terkuat lebih awal dan lebih mantap。

INDUSTRI LAYANAN INFORMASI AKAN PERTAMA KALI DICETAK ULANG OLEH AI, SEBAGAI BIAYA PRODUKSI UNTUK DATA, ANALISIS DAN PENELITIAN YANG JATUH CEPAT DAN LAMBAT PERUSAHAAN AKAN DIMODIFIKASI LEBIH CEPAT。

Permintaan token tidak akan melambat karena pengurangan harga dari model lama, karena setiap model yang lebih kuat melepaskan contoh nilai-tinggi baru dan mendorong pengguna menuju model maju yang lebih mahal。

Perubahan terbesar yang dilakukan oleh AI tidak membuat orang bekerja kurang, tetapi untuk memungkinkan jumlah orang yang sama untuk melakukan beberapa kali sama, mereka yang tidak dapat membuat dan menangkap nilai token akan terkunci di "bawah permanen"。

KEKURANGAN KALKULATOR MENYEBAR SEPANJANG RANTAI PASOKAN SEMIKONDUKTOR, DARI GPU, CPU, MEMORI KE PCB, PABRIK TEMBAGA DAN PRODUSEN PERALATAN, DAN PERMINTAAN AI TELAH MENJADI DORONGAN HARGA UNTUK SELURUH RANTAI INDUSTRI。

Masalah sebenarnya bukan hanya berapa banyak uang yang dihasilkan perusahaan model, tapi berapa banyak "GDP hantu" diciptakan oleh keputusan-keputusan, efisiensi dan efek rantai token。

Organiser lainnya

Claude Code menjadi tenaga kerja baru

Patrick O 'Shaughtnessy (Moderator):

kau bercerita tentang perubahan besar penggunaan tim-mu tahun ini. bisa kau ulangi? apa yang membuatmu mengerti apa yang terjadi di dunia ini

Dylan Patel (SemiAnalysis Founder):

Tahun lalu, kami pikir kami pengguna berat AI. Semua orang menggunakan ChatGPT, semua orang menggunakan Claude, dan aku memberikan tim semua langganan yang mereka inginkan. Pada saat itu, perusahaan menghabiskan sekitar puluhan ribu dolar。

Tapi tahun ini, pengeluaran mulai melambung. Titik awal yang sebenarnya mungkin terakhir Desember, dengan penampilan Opus. Ini termasuk Doug, CEO kami Douglas Lawler. Dia pada dasarnya mengambil memimpin dalam mendorong non-teknis untuk menulis kode dengan AI. Dia membawa seluruh perusahaan dalam sedikit. Tentu saja, para insinyur sedang digunakan, tapi dari Januari tahun ini, pengeluaran kami jelas akan naik, dan kemudian cepat patah。

Kami kemudian menandatangani kontrak perusahaan dengan Anthropic. Terakhir kali saya berbicara dengan Anda, pengeluaran tahunan kami adalah sekitar $5 juta; sekarang $7 juta。

Patrick O 'Shaughtnessy:

Dan itulah angka minggu lalu。

Dylan Patel:

Ya, banyak dari itu adalah penggunaan itu sendiri. Yang benar-benar menarik adalah orang-orang yang tidak pernah menulis kode sebelumnya sekarang menggunakan Claude Code, dan beberapa orang menghabiskan ribuan dolar sehari. Tapi dalam istilah perusahaan, kami menghabiskan $7 juta setahun untuk Claude Code, dan gaji kami sekitar $25 juta. Artinya, Claude Code telah menghabiskan lebih dari 25 persen pengeluaran gaji。

JIKA TREN INI TERUS BERLANJUT, BAHKAN MUNGKIN MELEBIHI 100 PERSEN DARI GAJI TOTAL PADA AKHIR TAHUN. INI SEDIKIT MENAKUTKAN. UNTUNGNYA, SAYA TIDAK PERLU MEMILIH ANTARA "ORANG" DAN "AI" SEKARANG, KARENA PERUSAHAAN TUMBUH CEPAT. LEBIH SEPERTI: SAYA TIDAK PERLU MEMPEKERJAKAN ORANG BEGITU CEPAT, TAPI SAYA BISA MENGHABISKAN LEBIH BANYAK UANG UNTUK AI, DAN ITU BERHASIL, DAN PERUSAHAAN BISA TUMBUH LEBIH CEPAT。

Tapi saya berpikir bahwa cepat atau lambat perusahaan lain akan mulai menghadapi masalah: Jika satu orang bisa melakukan lima, sepuluh, atau bahkan 15 pekerjaan dengan Claude Code, apa yang terjadi selanjutnya? Pertama, memang ada kebutuhan untuk perampingan, dan kedua, sekarang ada berbagai macam manfaat。

Sebagai contoh, kami memiliki laboratorium rekayasa terbalik di Oregon, yang telah dibangun selama satu setengah tahun. Ada banyak perangkat high-end, seperti mikroskop, memindai mikroskop elektron. Penggunaan inti laboratorium adalah chip analisis terbalik, ekstraksi struktur chip dan analisis bahan yang digunakan dalam pembuatan mereka. Ini juga salah satu data yang kami jual。

Namun, analisis data tersebut telah menjadi proses yang sangat lambat di masa lalu. Sekarang, ada satu orang di tim kami yang hanya ribuan dolar di Claude token, dan itu adalah aplikasi. Aplikasi ini dapat mempercepat GPU dan menjalankan server kami di CoreWeave. Yang harus kita lakukan adalah mengirimkan gambar chip yang otomatis menunjukkan lokasi setiap materi pada gambar: Ini tembaga, ini Tantalum, ini platinum, ini kobalt. Kemudian Anda dapat melakukan analisis meta- terbatas seluruh struktur chip stack sangat cepat, dan itu divisualisasikan, bersama dengan antarmuka grafis lengkap dan dasbor。

Orang ini, yang telah bekerja di Intel sebelumnya, mengatakan bahwa di masa lalu itu telah menjadi tim lengkap untuk melakukan dan mempertahankan. Ini luar biasa untuk menempatkan sesuatu seperti itu di perusahaan secara keseluruhan。

Ada contoh lain yang menarik bagiku, yaitu Malcolm. Dia adalah seorang ekonom di sebuah bank besar. Departemen Ekonomi bank itu bisa 100 sampai 200 orang. Dia membuat sesuatu yang menakjubkan sekarang。

DIA MEMBAWA DATA TERMASUK DATA FRED, LAPORAN PEKERJAAN DAN DATA LAINNYA DARI APIS YANG BERBEDA. KAMI JUGA MENANDATANGANI KONTRAK DENGAN BEBERAPA PENYEDIA DATA DAN MENDAPAT AKSES API. DIA KEMUDIAN MENARIK SEMUA DATA DAN MULAI BERJALAN KEMBALI DAN MENGANALISIS EFEK PERUBAHAN EKONOMI YANG BERBEDA PADA INFLASI ATAU DEFLASI DALAM EKONOMI。

Biro Statistik Tenaga Kerja Amerika Serikat memiliki satu set klasifikasi pekerjaan dengan sekitar 2.000 tugas. Malcolm menggunakan AI untuk menilai tugas mana yang sekarang dapat dilakukan oleh AI, yang tidak dapat, dan yang menunjukkan menurut seperangkat rubrik. Hasil menunjukkan bahwa sekitar 3% dari tugas sekarang dapat dilakukan oleh AI。

Jadi dia menciptakan indikator untuk mengukur apa yang bisa dilakukan oleh AI dan bagaimana penurunan itu akan ketika itu dilakukan oleh AI. Keluaran mungkin meningkat, tapi karena biaya jatuh terlalu banyak, dalam teori PDB mungkin kontrak. Dia menyebutnya "PDB Phantom"。

dia membuat serangkaian analisis berdasarkan konsep ini dan menciptakan model bahasa yang benar-benar baru, benchmark, yang berisi sekitar 2.000 eval。

Patrick O 'Shaughtnessy:

Dia melakukan semua ini sendiri

Dylan Patel:

Ya, dia melakukannya sendiri. Dia berkata kepada saya, "Saudara, dibutuhkan 200 orang tim ekonom per tahun untuk melakukannya". Dia benar-benar di Claude, mengatakan semuanya berubah。

Patrick O 'Shaughtnessy:

Sebagai operator bisnis, bagaimana kau memahami ini? Anda telah berubah dari pengeluaran hampir tidak ada, hingga sekarang hampir 25 persen pengeluaran gaji, dan masih meningkat. Pada titik apa yang Anda pikirkan, "Tunggu, harus saya menginjak rem? Haruskah saya mengontrol biaya?" Mungkin kita tidak perlu selalu menggunakan model garis depan yang baru saja keluar hari ini, seperti Opus 4.7, tetapi kita dapat beralih ke model yang lebih murah

Dylan Patel:

Setelah semua, aku dalam bisnis informasi. Kami menjual analisis, kami berkonsultasi, kami membuat set data. Saya tidak melihat alasan mengapa hal-hal ini tidak akan sepenuhnya komersial pada kecepatan yang sangat cepat。

Jika saya tidak terus meningkatkan produk data pertama yang saya jual, lebih banyak orang yang melakukan hal yang sama. Kita masih bisa menjualnya karena kita terus melakukannya lebih baik dan lebih baik. Tapi cara kami melakukannya di tahun 2023, itu tidak benar-benar sama cara orang melakukannya sekarang. Jika saya tidak terus meningkatkan standar, saya akan dimodifikasi. Jika saya tidak bergerak cukup cepat, saya akan kehilangan keuntungan saya。

JADI MASALAHNYA ADALAH, YA, AL AKAN MENGKOMERSIALISASI BANYAK HAL, SAMA SEPERTI ITU MENGKOMERSIALISASI PERANGKAT LUNAK. TETAPI MEREKA YANG BERGERAK CUKUP CEPAT UNTUK MENGUASAI HUBUNGAN PELANGGAN, TERUS MENYEDIAKAN LAYANAN YANG SANGAT BAIK DAN TERUS-MENERUS MENINGKATKAN LAYANAN MEREKA TIDAK AKAN MENYUSUT, TETAPI AKAN TUMBUH LEBIH CEPAT. MEREKA YANG TIDAK KOMPETEN DAN TIDAK MELAKUKAN APA-APA AKAN KEHILANGAN。

JADI ITU SEPERTI MASALAH BERTAHAN HIDUP: JIKA SAYA TIDAK MENGGUNAKAN AI, ORANG LAIN AKAN, DAN KEMUDIAN MEREKA AKAN MENGALAHKAN SAYA。

Contoh sederhana lainnya adalah sektor energi. Kami memiliki beberapa analisis energi sekitar tahun lalu mencoba untuk membangun model energi. Model ini sangat kompleks, dan pasar layanan data energi berukuran sekitar 900 juta dolar, jadi jelas ini pasar besar yang ingin saya masuki. Namun walaupun beberapa tim kami telah bekerja selama setahun, kami tidak benar-benar dalam bisnis layanan data energi。

Kalau begitu, Claude Code gila. Kami memiliki seorang pria yang bertanggung jawab energi dan industri di pusat data, Jeremy. Setelah dia mulai menggunakan Claude Code, segalanya tiba-tiba berubah. Dalam tiga minggu, ia menghabiskan banyak uang, sekitar $600.000 sehari, dan itu adalah berlebihan nyata. Namun, ia menangkap setiap pembangkit listrik di Amerika Serikat, setiap jalur transmisi di atas tingkat tegangan tertentu, dan menciptakan peta dari seluruh jaringan Amerika Serikat dari berbagai sumber data terbuka, dengan banyak akses samping permintaan。

Kami telah membuatnya menjadi dashboard yang memungkinkan kita untuk melihat dan menganalisis kekurangan daya dan surplus dalam berbagai microregations Amerika Serikat, serta banyak rincian. Ini akan sampai dalam beberapa minggu。

Kami kemudian menunjukkan kepada sejumlah pelanggan yang telah membeli data kami, termasuk pedagang energi. Setelah membacanya, mereka berkata, "Wow, sudah berapa lama ini terjadi?" Ini bagus, lebih baik daripada perusahaan ". Dan kemudian kita harus tahu bahwa ada 100 orang di perusahaan yang telah melakukan hal ini selama 10 tahun。

Tentu saja, produk kami tidak lengkap dan kuat seperti mereka, tetapi dalam beberapa hal mereka lebih baik. Jadi sekarang aku memodifikasi layanan data energi ini. Tapi pada gilirannya, jika saya tidak berjalan lebih cepat, siapa yang akan mengkomersialisasi saya

Jadi, dari sudut pandang bisnis, pertanyaannya bukan, "Apakah saya menghabiskan banyak uang?" Ya, aku menghabiskan banyak uang. Tapi pertanyaannya adalah, apa yang saya dapatkan dari uang ini? Apakah membawa pendapatan lebih? Jika jawabannya adalah ya, uang itu layak。

Patrick O 'Shaughtnessy:

Apakah Anda khawatir bahwa pada akhirnya, mereka yang mengontrol modal dan bertanggung jawab untuk berinvestasi, yang mempekerjakan Anda sering karena apa yang Anda lakukan, akan berkata, "Kami memiliki analis diri kita sendiri, dan mereka cerdas. Mengapa kita tidak melakukannya sendiri?" Jika itu menjadi begitu mudah, pada titik apa itu semua mengalir kembali ke agen investasi? Setelah semua, mereka kemungkinan besar untuk mendapatkan leverage maksimum dari data dan wawasan。

Dylan Patel:

Pertama, bisnis layanan informasi pada dasarnya sama: Saya telah mendapatkan nilai dari pesan, dan jelas tidak ada klien yang mendapatkan nilai dari informasi itu。

Jika saya menjual informasi untuk satu dolar, Anda bersedia untuk menghabiskannya karena Anda tahu itu membantu Anda membuat keputusan yang membuat Anda mendapatkan lebih dari satu dolar. Dengan kata lain, Anda mendapatkan arbitrase. Anda membuat lebih banyak uang dari saya dari menjual informasi ini。

Investasi dana sendiri pasti memiliki kapasitas layanan informasi mereka sendiri. Terutama untuk lembaga seperti Jane Street dan Citadel, mereka sangat rinci dan mendalam dalam hal data. Tapi mereka masih akan membeli data kami, dan mereka terus melakukannya, dan kerjasama dengan kami berkembang。

Kurasa ada semacam faktor. Kita bergerak lebih cepat, lebih fleksibel, tim yang lebih kecil, dan fokus pada daerah yang sangat spesifik: infrastruktur AI, dan perubahan besar yang ditimbulkan, termasuk AI, ekonomi token dan hal-hal yang terkait. Kita bisa melihat arah sebelumnya dan membangun hal-hal lebih cepat。

Jadi, tentu saja, para profesional investasi mencoba melakukan sesuatu untuk diri mereka sendiri. Tapi lebih sering, mereka membeli data kami secara langsung, dan kemudian membangun di atasnya. Bagi mereka, membeli data kami biasanya lebih murah daripada membangunnya dari awal. Dan, tentu saja, akhirnya seseorang akan mencoba untuk melakukannya sendiri。

Token menjadi sumber daya produksi baru

Patrick O 'Shaughtnessy:

saya pikir setiap kali saya berbicara dengan anda, saya berakhir dengan pertanyaan yang sama: persediaan dan permintaan token. itulah yang paling menarik bagiku sekarang. apakah pengalaman anda sendiri memberi anda pemahaman baru tentang pihak permintaan? apakah anda mengubah penilaian anda tentang kebutuhan token setelah anda merasa sangat baik

Dylan Patel:

Jika kita mundur, dari sudut pandang makro, ARR Anthropic mungkin telah tumbuh dari $9 miliar menjadi sekitar $35 miliar, $40 miliar. Pada saat acara ini ditayangkan, mungkin mencapai 40 miliar sampai 45 miliar dolar。

Tapi mereka belum tumbuh sampai tingkat yang sama. Jika Anda menghitung, dan menganggap bahwa mereka belum mengurangi algoritma R & D - jelas tidak, karena mereka menerbitkan model baru, seperti Metis, Opus 4, Opus 4.7 - maka satu hal: kalkulus tambahan, bahkan jika mereka semua pergi ke penalaran, adalah sekitar 72 persen lebih rendah dari rasio Maori mereka。

Pada kenyataannya, bagian dari kalkulus tambahan kemungkinan berada di R & D, sehingga rasio Māori mereka yang sebenarnya mungkin lebih tinggi dari 72 persen. Kau tahu, pada awal tahun ini, seseorang membocorkan beberapa informasi dalam dokumen pembiayaan mereka, dan itu sekitar 30 persen。

Bagaimana bisa bisnis menaikkan tingkat Māori ke tingkat ini dalam waktu singkat? Pada prinsipnya, itu karena permintaan terlalu tinggi. Mereka dapat memperketat tingkat penggunaan, batas kecepatan dan pembatasan. Apa yang benar-benar penting adalah bahwa Anda memiliki seorang manajer pelanggan Anthropic, kontrak perusahaan, dan mendapatkan promosi yang Anda butuhkan. Jika tidak, token akhirnya akan menjadi sangat agresif。

Siapa pun yang mampu untuk mendapatkannya. Anthropic menghadapi masalah yang sama - tentu saja, itu bukan masalah, tapi realitas tentang bagaimana kapitalisme bekerja. Ya, klien mungkin membayar mereka $40 miliar per tahun untuk token, tetapi token ini lebih dari $40 miliar nilai diciptakan oleh klien。

nilai dari setiap token yang diciptakan oleh perusahaan yang berbeda berbeda berbeda. tapi sebagai model menjadi lebih cerdas, apa yang benar-benar penting adalah siapa yang sampai ke token yang paling cerdas dan menggunakannya untuk hal yang paling berharga。

Sebagai orang, Anda harus memutuskan bagaimana menggunakan token ini untuk mengembangkan bisnis dan menciptakan nilai. Banyak orang menginginkan token, dan mereka akan mengkonsumsi token. Tapi biasa SaaS start- up yang memproduksi perangkat lunak di San Francisco dengan Claude tidak benar-benar membuat banyak uang. Jadi cepat atau lambat, mereka akan diperas dari harga token。

Patrick O 'Shaughtnessy:

Itulah yang saya temui hari ini di jalan. Setelah diterbitkan, Opus 4.7, saya ingin menggunakan 4.7 dan segera. Dan kemudian aku terputus. Aku tidak bisa menggunakannya. Aku bahkan tidak bisa membayangkan terus menggunakan 4.6, meskipun aku sudah puas dengan 4.6 selama beberapa minggu terakhir, itu sudah kuat。

Apakah Anda terkejut bahwa orang begitu bertekad untuk menggunakan model yang paling mahal dan maju

Dylan Patel:

Tidak sama sekali. Salah satu kenangan paling lucu yang saya miliki dalam sebulan terakhir dan setengah adalah bahwa saya berlutut dengan teman saya Leopold, hampir di depan co- pendiri Anthropic, memintanya untuk memberi kita akses Metis。

Kami tahu itu ada, jadi kami berkata, "Silakan, mari kita menggunakannya". Dan dia berkata: "Sesungguhnya aku tidak mengetahui apa yang kamu katakan"

Patrick O 'Shaughtnessy:

bagaimana reaksimu ketika lembar harga, atau kartu eval keluar

Dylan Patel:

Ada rumor sebelum Bay Zone, dan kita mungkin tahu itu akan sangat kuat. Jika Anda melihat benchmark, tentu saja benchmark akan berubah, tetapi Mephisto / Metis mungkin lompatan terbesar dalam kapasitas model dalam dua tahun terakhir。

Saya pikir ini sangat penting: cukup kuat bahwa Anthropic bahkan tidak ingin mempublikasikannya sepenuhnya. Meskipun mereka telah menerbitkan harga kepada beberapa klien, mereka juga telah menerbitkan selektif, misalnya, untuk pengaturan sekuriity- terkait. Mungkin lima atau sepuluh kali biaya token, tetapi mereka masih tidak ingin sepenuhnya dirilis karena mereka khawatir tentang dampaknya pada dunia nyata。

Jadi yang kita miliki sekarang adalah versi yang lebih buruk dan lebih lemah dari Opus 4.7. Dan mereka membuatnya jelas untuk model Kari bahwa kami benar-benar sengaja membuat yang lebih buruk pra-optimasi kemampuan keamanan cyber. Saya tidak tahu apakah Anda membaca bagian itu。

Jadi apa yang saya katakan adalah, siapa pun Anda, selama Anda memiliki modal yang cukup, Anda harus pergi membeli langganan bisnis anthropic, tekan token dan membayar alih-alih menggunakan langganan reguler. Karena dengan begitu kau takkan mudah ditahan。

dan kemudian anda harus berpikir tentang bagaimana menggunakan token ini pada misi nilai atas dan menghasilkan uang dari mereka. karena pada dasarnya, dalam satu atau dua tahun, banyak bisnis pada dasarnya token arbitrase. token kuat, tapi intinya adalah di mana anda menunjukkan mereka。

dalam tiga atau empat tahun ke depan, model itu sendiri mungkin tahu bagaimana token harus digunakan dan bagaimana memaksimalkan nilai。

Jika Anda melihat kembali pada setiap benchmark, Anda akan menemukan bahwa biaya mencapai tingkat tertentu kompetensi di masa lalu adalah X, dan sekarang mungkin hanya satu persen, atau bahkan seribu. Misalnya, ketika DeepSeek mencapai kapasitas tingkat GPT-4, biayanya sekitar satu persen GPT-4. Sejak itu, biaya model GPT-4 terus menurun。

TENTU SAJA, TIDAK ADA YANG BENAR-BENAR PEDULI TENTANG MODEL GPT-4 LAGI. APA YANG ANDA INGINKAN ADALAH MODEL GARIS DEPAN, KARENA MENCIPTAKAN SESUATU YANG BENAR-BENAR EKONOMI. NAMUN, MODEL GPT-4 MASIH DAPAT DIGUNAKAN UNTUK BEBERAPA ADEGAN, TETAPI MEREKA BIASANYA LEBIH KECIL。

Jadi yang mendorong permintaan bukanlah kemampuan lama menjadi lebih murah, namun contoh baru muncul. Sekarang Anda menggunakan model level Opus 4.6 atau Opus 4.7. Setahun kemudian, jika saya memperoleh kualitas yang sama dari kapasitas pemodelan saat ini, saya mungkin menghabiskan $70.000, mungkin 100 kali lebih sedikit。

Tapi itu tidak masalah. Karena kemudian, aku akan menggunakan model yang lebih kuat untuk melakukan sesuatu yang lebih berharga。

Anthropic Metis lebih mahal sebagai model itu sendiri, tetapi mengkonsumsi jauh lebih sedikit tanda untuk menyelesaikan hal yang sama. Jadi dalam kebanyakan misi, sebenarnya lebih murah daripada Opus 4.6。

Dylan Patel:

karena jauh lebih efisien. bahkan jika setiap token itu sendiri lebih "cerdas" dan lebih mahal, ia membutuhkan lebih sedikit token untuk melakukan tugasnya。

Patrick O 'Shaughtnessy:

Terakhir kali aku melihatmu, Metis mungkin baru saja dirilis, atau model kartu baru saja keluar. Kau bilang itu cukup kuat untuk menakut-nakuti Anda sedikit. Apa maksudmu

Dylan Patel:

Tujuan Anthropic pada tahun 2025, bahkan dari 2024, adalah memiliki insinyur perangkat lunak tingkat L4 dalam model pada akhir 2025. Secara keseluruhan, mereka pada dasarnya melakukannya dengan Opus 4.6。

Tapi mereka tidak mengatakan jika Anda melihat Metis, dibandingkan dengan benchmark, itu lebih seperti seorang insinyur L6. L4 mungkin adalah insinyur perangkat lunak yang relatif junior, dan L6 sudah menjadi insinyur berpengalaman。

Saya ingat Anthropic mengatakan bahwa model ini telah tersedia secara internal sejak Februari. Jadi dalam dua bulan, mereka melompat dari L4 ke L6. Jadi apa yang terjadi selanjutnya

Dan ketika Anda berpikir tentang evolusi model itu, Anda melihat bahwa itu benar-benar mempercepat. Ritme pelepasan Anthropic dikompresi, dan ritme rilis OpenAI dikompresi. Kenapa? Karena biasanya, untuk membuat model yang lebih baik, Anda perlu beberapa hal。

Pertama-tama, kau perlu sosok yang kuat. Menghitung sangat mahal dan memiliki timescale sendiri. Kami akan melacak hal-hal ini, yang sebenarnya tumbuh, tetapi sebagian besar didirikan dalam jangka pendek. Anda telah menandatangani matematika. Hal ini cukup banyak diselesaikan. Tentu saja, akan ada penundaan dan penyesuaian di tengah, dan mungkin ada beberapa lagi, tetapi keseluruhan tetap。

Kedua, Anda membutuhkan peneliti yang sangat baik. Perusahaan sekarang bersedia membayar puluhan juta dolar untuk orang-orang ini。

Akhirnya, kapasitas tercapai. Secara historis, ini sangat sulit untuk dicapai. Jika aku punya ide, aku harus mewujudkannya, dan itu sulit. Tapi sekarang bahwa ide-ide di mana-mana, menjadi sangat mudah untuk dicapai. Ini mahal, tapi sangat mudah。

Jadi pertanyaannya adalah: Bagaimana seseorang memutuskan ide mana yang akan dicapai? Akibatnya, ketika menjadi terlalu mudah, Anda dapat mencapai lebih banyak ide dan berlari lebih cepat di treadmill ini。

HAL INI DAPAT TERJADI DALAM STUDI MODEL AI, SEHINGGA FREKUENSI MODEL RILIS TELAH BERKURANG DARI ENAM BULAN MENJADI DUA BULAN. HAL INI JUGA DAPAT TERJADI DI DAERAH LAIN. SEBAGAI CONTOH, SAYA INGIN MODEL SETIAP PEMBANGKIT LISTRIK DI AMERIKA SERIKAT, SETIAP JALUR TRANSMISI, DIJALANKAN KEMBALI, MENGANALISIS SUPPLYNEQUEST HUBUNGAN DALAM MIKORESI- DAN SAYA BISA MELAKUKANNYA SEKARANG。

ide itu sendiri murah. intinya adalah, ide yang masuk akal? ide mana yang sepadan dengan modalmu untuk membeli token dan mengeluarkannya? karena kemampuan untuk mencapai sudah ada. ini adalah perubahan yang paling kritis。

Jika biaya terus menurun - dan itu tidak - kita bahkan tidak benar-benar punya Metis. Opus 4.7 baru saja dirilis beberapa jam yang lalu, tapi kami sangat bersemangat di dalam tim。

Apa yang membawa ini ke dunia? Saya pikir itu akan mengatur ulang cara perekonomian bekerja。

Di masa lalu, implementasi sangat penting karena sulit; ide murah. Sekarang, ide tidak hanya murah, mereka cukup, tetapi implementasi juga sangat mudah. Jadi, apa yang benar-benar layak dilakukan adalah bahwa hanya ada cukup baik ide untuk... Mereka dapat membuktikan bahwa Anda bernilai uang bahkan jika sudah sangat murah。

Patrick O 'Shaughtnessy:

Jadi kau benar-benar takut? Atau hanya memperkenalkan ketidakpastian yang sulit dipahami

Dylan Patel:

Ketidakpastian pasti ada. Tapi aku merasa ini membawa semacam ketakutan. Pertanyaannya adalah, bagaimana masyarakat bisa menstruktur ulang dirinya sendiri

APA YANG PENTING KETIKA ANDA TINGGAL DI DUNIA DI MANA "KEMAMPUAN UNTUK MELAKUKAN SESUATU" TIDAK SEPENTING ITU? YANG PENTING ADALAH, DAPATKAH ANDA MEMILIH IDE YANG TEPAT AGAR AL MEMBUAT HAL ITU TERJADI; DAPATKAH ANDA MENJUALNYA, ATAU DAPATKAH ANDA MENJUAL APA YANG AI MENYADARI; DAPATKAH ANDA MENAIKKAN MODAL UNTUK ARAH INI? ITULAH YANG MEMBUATNYA PENTING。

Dan itu kembali ke pertanyaan sebelumnya: penting untuk memiliki model up-to-date selamanya. Siapa yang bisa mendapatkan model terbaru

Anthropic memiliki sebuah proyek, dan aku tahu itu tidak disebut Earwig, tapi aku suka menyebutnya Earwig sengaja untuk menggoda orang Anthropic. Mereka hanya menawarkan Metis untuk perusahaan tertentu untuk keamanan cyber. Saya pikir ini akan terjadi: model ini akan lebih sempit dan lebih sedikit dapat diakses。

Catatan: Earwig dimaksudkan untuk menjadi hama, serangga kecil, dan sering disebut earplug dalam bahasa Cina. Ini lebih seperti sandiwara: di satu sisi, kedengarannya seperti semacam bug, di sisi lain, ada koneksi antara "menyelinap ke telinga" dan "meningkatkan orang"。

Aku tahu OpenAI, Anthropic dan perusahaan lain mengatakan mereka ingin semua orang memiliki AI yang kuat. Tapi AI sangat mahal. Siapa yang akan membayar untuk triliunan dolar infrastruktur? Mereka yang memiliki uang dan dapat membangun hal-hal berguna dengan AI。

dan anda tidak ingin ada yang menyuling model anda, sehingga anda tidak menerbitkannya dalam skala besar. anda akan memberikannya kepada klien lebih sedikit dan lebih sedikit. kemudian pelanggan ini akan mulai berjuang untuk token。

Kecuali Anthropic punya kenaikan harga yang besar. Mereka bisa menggandakan harga Opus, dan aku akan terus membayar. Aku yakin kebanyakan pengguna akan terus membayar. Tapi saya tidak berpikir bahwa bahkan memecahkan masalah kapasitas besar mereka。

jadi masalahnya adalah: di mana siklus ini berakhir? apa yang terjadi ketika penggunaan token, dan nilai tambahan token ini, semakin terkonsentrasi di tangan beberapa perusahaan

Aku tidak punya Metis sekarang. Tapi siapa? Bank atas memiliki. Sekarang mereka mungkin hanya menggunakannya dalam keamanan cyber, tapi saya bisa membayangkan dunia: karena saya memiliki kontrak bisnis untuk Anthropic, dan karena Anthropic orang-orang seperti saya, mereka mungkin bersedia untuk memberi kita sedikit lebih awal akses, atau sedikit batas kecepatan yang lebih tinggi. Saya tentu berharap itu terjadi。

Dan kemudian pesaing saya tidak memiliki akses ini, dan aku bisa mengalahkan mereka。

Mungkin juga kasus lain. Contohnya, Ken Griffin dari Citadel, yang memiliki denyut nadi yang sangat kuat dan sangat kaya. Dia mungkin pergi dan menandatangani perjanjian dengan OpenAI atau Anthropic, berkata, "Saya membeli $10 miliar per tahun token pertama. Setiap kali Anda mempublikasikan model baru, saya akan membeli top $10 miliar token, maka yang lain

Apa yang terjadi kemudian? Dia bisa menghancurkan semua orang di pasar。

Ini hanya satu contoh. Hal ini juga dapat terjadi di daerah keamanan cyber, seperti kekhawatiran Anthropic yang model membuatnya lebih mudah untuk hack ke dalam sistem. Itu bisa terjadi dalam layanan informasi seperti saya, dan saya menggunakannya untuk menghancurkan orang。

Saya percaya bahwa hal ini memiliki dampak yang sangat luas. Kita tidak tahu apa yang bisa dilakukan model ini. Anthropic tidak tahu, OpenAI tidak tahu, tidak ada yang tahu. Akhirnya, terserah pengguna akhir untuk mencari tahu: di mana token ini dapat digunakan? Apa yang bisa mereka bangun? Apa yang bisa kau bayangkan

Ini, tentu saja, akan sangat meningkatkan produktivitas dan memiliki sisi yang sangat positif bagi kemanusiaan. Tapi pertanyaannya adalah, bagaimana bisa sumber daya dan akses terkonsentrasi

Robot akan mengambil gelombang permintaan berikutnya

Patrick O 'Shaughtnessy:

sekarang, robot, atau robot, mengkonsumsi token, hampir diabaikan dibandingkan dengan bidang lain. bagaimana menurutmu? akankah itu menjadi kurva permintaan kedua? setiap hari, dalam satu mil, bisnis robot baru muncul, mencoba untuk membuat sesuatu yang menarik。

Dylan Patel:

Berikut adalah konsep yang disebut "soft-hanya spesialisasi". Dengan kata lain, dunia mungkin dimulai dengan singularitas AI yang hanya terjadi dalam perangkat lunak. Tapi masalahnya adalah bahwa banyak dunia masih fisik. Anda akan melihat bahwa dunia pada akhirnya akan diselenggarakan di sekitar perangkat keras, bukan hanya perangkat lunak. Jadi saya berpikir bahwa begitu-disebut "keajaiban perangkat lunak" hanya periode pendek, bukan akhir. Karena kita berakhir di dunia fisik。

Apa bagian sulit nyata dari robot sekali perangkat lunak menjadi sangat mudah? Ini pemrograman, microcontroller, implementasi, dan kontrol semua hal ini. Ini sangat sulit sekarang。

MODEL AI MEMILIKI FITUR YANG MENARIK: MEREKA SEBENARNYA SANGAT TIDAK EFISIEN. INI HANYA KARENA KAMI MEMBERI MEREKA DATA BESAR BAHWA MEREKA BELAJAR SESUATU DAN DALAM BEBERAPA HAL MELAMPAUI KEMANUSIAAN。

Tapi model robot saat ini, seperti VLA, yang merupakan Vision- Languag- Action, model visual-linguistik, panas sekarang, tapi saya tidak berpikir itu akan menjadi sesuatu yang akhirnya dapat diperluas. Mereka tidak efisien, dan kita tidak dapat memperluas data robot cukup cepat。

Harus ada beberapa cara di masa depan untuk melatih model robot dalam skala besar. Ini seperti manusia terus melihat data sepanjang hidup mereka. Hal yang nyata tentang kemanusiaan adalah bahwa kita sangat "efisien sampling". Satu contoh, dua contoh, kita bisa belajar。

Jika kemampuan ini diterapkan pada robot, akan sangat berbeda. Setelah singularitas pada tingkat perangkat lunak telah muncul, menjadi sangat murah bagi siapa pun untuk mulai membangun model ini. Dan kemudian orang dapat mulai membangun robot yang sangat berguna。

jadi saya pikir dalam enam sampai 18 bulan ke depan, kita akan mulai melihat terobosan nyata dalam robotika. kemampuan kuncinya adalah belajar. dan kemudian akan ada model robot yang sudah terlatih, dan anda akan menyewa atau membeli robot, dan anda akan menunjukkan beberapa contoh, dan itu akan melakukan pekerjaan。

Kau menyuruhnya melipat kedua hal ini, itu bisa melakukannya. Dan Anda katakan itu, "Hal ini benar-benar memiliki keseimbangan. Ini akan dimulai dan selesai. Percayalah, aku sudah sering melakukannya。

Jadi saya pikir robot memiliki sedikit kemampuan belajar。

Memang benar bahwa sudah ada perusahaan yang melakukan robotika, beberapa untuk iklan dan beberapa untuk tugas-tugas sederhana. Tapi itu akan sangat dibagi. Misalnya, robot yang digunakan untuk melipat pakaian, atau robot yang lebih dibagi menjadi papan tulis. Ini bisa menjadi layanan sewa, itu bisa menjadi paket model, Anda bisa mengunduhnya pada robot standar, itu bisa melakukannya, dan kemudian Anda bisa membayar untuk itu。

dalam hal apapun, bidang komoditas fisik akan disertai dengan percepatan yang signifikan dan efek deflasi. dan ini pada akhirnya akan terus mendorong pertumbuhan gila token dalam permintaan. jadi saya pribadi tidak berpikir kebutuhan tanda akan melambat。

Patrick O 'Shaughtnessy:

Apakah Anda belajar sesuatu yang baru tentang dunia dari hasil Metis dan bagaimana itu dibangun? Dengan kata lain, jika Anda membongkar semua komponen dari skala hukum, seperti pra-pelatihan..

Dylan Patel:

Ini model yang jauh lebih besar dari sebelumnya. $100,000 Blackwell, setara dengan ratusan ribu chip dari generasi sebelumnya. Tentu saja, TPU dan Triton memiliki ritme rilis yang berbeda, sehingga mereka tidak dapat benar-benar cocok. Tapi akhirnya, ya, Metis adalah model yang lebih besar. Ini membuktikan skala hukum masih berlaku. Semua itu menunjukkan bahwa garis tren berlanjut: dengan lebih banyak masukan ke model, model menjadi lebih baik。

Dan itu bukan hanya "kalkulus lebih untuk membuat model lebih baik". Pada saat yang sama, kita terus-menerus memperoleh dalam efisiensi komputasi. Dan semua penelitian dan pengembangan energi bahwa laboratorium dimasukkan ke dalamnya berubah menjadi satu hal: Jika saya ingin model untuk tingkat tertentu kompetensi, biaya untuk mencapai kapasitas tersebut akan berkurang secara signifikan setiap enam bulan, atau sekarang setiap dua bulan. Tapi jika aku menariknya cukup besar, aku masih bisa membuat lompatan besar ke depan。

Jadi, ya, itu membuktikan bahwa ini terus terjadi. Google dan Anthropic bukan pengguna GPU di sisi pelatihan. OpenAI juga harus meluncurkan model generasi baru. Saya pikir mereka mengambil lebih rasional dan berprinsip langkah maju pada skala. Dan kali ini, Anthropic membuat lompatan besar。

Tahun ini kita akan melihat model yang lebih baik dan lebih baik, dan ritme hanya akan mendapatkan lebih cepat。

Patrick O 'Shaughtnessy:

Kita sudah membicarakan percakapan ini sejak lama, tapi hampir tidak menyebutkan OpenAI. Ini akan menjadi hal yang aneh di masa lalu。

Dylan Patel:

Itu bagian yang menyenangkan. Sekarang banyak orang akan berkata, "Jadi Anthropic telah menang, kan? Mereka memiliki Metis pada bulan Februari, tetapi mereka bahkan tidak dibebaskan karena mereka merasa tidak perlu. Perhitungan mereka telah terjual habis dan pendapatan meningkat sebesar $10 miliar per bulan. Dan hari ini, Opus 4.7 dibebaskan, dan semua ini terjadi sebelum rumor OpenAI, yang tercakup dalam media seperti The Information。

Jadi di permukaan, Anthropic jelas memimpin, OpenAI tampaknya selesai. Tapi apa yang menarik adalah bahwa matematika Anthropic sangat terbatas, dan mereka dapat memperluas pada kecepatan yang sangat terbatas. Dario digunakan untuk melebih-lebihkan bahwa OpenAI terlalu radikal dalam hal aritmatika, dan skala Anthropic lebih rasional. Tapi sekarang Anthropic mungkin berpikir bahwa kita benar-benar harus memiliki bakat lebih。

OpenAI sepenuhnya mampu membayar tagihan ini. Bahkan, mereka telah dibiayai banyak uang untuk meningkatkan kapasitas bertahap mereka. Selain itu, mereka digunakan untuk membeli kredit dari perusahaan seperti Oracle, Coreweave, SoftBank, Microsoft, dll, pada skala yang sangat radikal dan bahkan "tidak bertanggung jawab". Sekarang mereka juga mendapatkan Trainium dari Amazon。

Jadi OpenAI melakukan hal yang sangat gila dalam matematika, dan mereka tahu mereka membutuhkan lebih。

Menariknya, jika kita melihat Opus 4.6, mari kita tidak mempertimbangkan model untuk saat ini, tetapi proliferasi dari teknologi ini. Anda dan saya bisa menggunakannya segera pada hari pertama dari model rilis, tetapi bisnis lain membutuhkan waktu. Orang-orang juga perlu waktu untuk belajar. "Claude Kebangkitan Waktu" tidak akan memukul semua orang pada waktu yang sama. Jadi pada akhir tahun, dengan asumsi model Opus 4.6-grade, seluruh ekonomi bersedia menghabiskan $100 miliar per tahun, yang saya tidak berpikir adalah berlebihan. Setelah semua, sekarang biaya $40 miliar。

Patrick O 'Shaughtnessy:

Ini pada dasarnya hanya dorongan linear。

Dylan Patel:

Ya, linear, bukan eksponensial. Untuk mencapai pertumbuhan eksponensial, Anda perlu model yang lebih baik. Tapi Anthropic tidak memiliki kapasitas untuk memenuhi kebutuhan ini. Jadi, dengan asumsi OpenAI atau Google dengan cepat mencapai tingkat kemampuan ini, semua orang bisa melakukannya selanjutnya。

Anthropic mungkin dapat mengisi 70% dari tingkat Māori, tetapi jika OpenAI mencapai tingkat kapasitas yang sama berikutnya, bahkan jika mengumpulkan hanya 50% dari tingkat Māori, itu akan makan semua permintaan ingremental. Dan itu mungkin juga tidak cukup kalkulatif untuk melayani semua pengguna. Jadi mungkin Metis, model seperti ini, jika dunia memiliki bakat yang cukup, bisa membawa $500 miliar, bahkan lebih berlebihan. Permintaan pasar untuk token ini terlalu kuat dan ketersediaan daya komputasi sangat terbatas。

Kami telah melihat ini di booming harga H100. Kehidupan layanan GPU juga meningkat. Jelas, bahkan laboratorium baris-kedua, mereka menjual, belum lagi laboratorium baris pertama. Pertama-baris laboratorium akan memiliki marjin keuntungan yang lebih baik, tapi kedua-baris laboratorium akan terjual habis, dan bahkan laboratorium tiga puluh baris mungkin telah dekat untuk menjual keluar。

nilai ekonomi dari model terkuat tumbuh lebih cepat dari kemampuan infrastruktur untuk memberikan token ini kepada orang-orang. jadi celah ini akan terus melebar. laboratorium modelling juga akan terus tumbuh dalam keuntungan sampai orang-orang di rantai pasokan perangkat keras dan infrastruktur reaksi rantai: dll., mengapa saya tidak menaikkan margin keuntungan saya

Patrick O 'Shaughtnessy:

Jadi dapat dikatakan bahwa penilaian Anda hari ini di sisi permintaan, terutama Anda sendiri contoh SemiAnalysis, benar-benar meledak. Dan lebih luas lagi, ketika orang memasuki apa yang Anda sebut "Al psikosis" dan merasakan apa yang dapat mereka lakukan dan merasa bahwa kesulitan hampir sepenuhnya hilang, seperti yang saya lakukan. Dalam beberapa minggu, pengeluaran token saya sendiri telah melambung。

kedengarannya itu keputusan yang cukup bagus. di sisi permintaan, apa ada yang terlewatkan? jika anda tidak menggunakan lebih banyak token, anda tidak akan pernah keluar dari bawah permanen. bisa kau sebarkan

Dengan kata lain, baik Anda menggunakan lebih banyak token, dan melalui token ini Anda menciptakan ekstra nilai ekonomi, tetapi banyak orang yang bosan dan malas. Mereka akan berpikir, "Saya hanya akan bekerja satu jam sehari, tidak delapan jam, jadi AI akan melakukan sebagian besar pekerjaan saya"

Dylan Patel:

Itu cara yang membosankan. Cara yang lebih dingin adalah: saya masih bekerja delapan jam sehari, tapi saya melakukan delapan kali pekerjaan, mungkin lima kali uang. Mungkin tidak lima kali, tapi harus seperti itu。

Tentu saja, jika Anda hanya melakukan pekerjaan, itu sulit. Ada orang yang melakukan berbagai pekerjaan pada saat yang sama, dan ada orang yang memulai perusahaan dan mulai menjual. Anda perlu menangkap nilai ekonomi AI sebelum digunakan oleh semua orang, dan itu berubah menjadi label industri. Karena itu tidak persis frame sekarang. Jika Anda tidak menggunakan lebih banyak token, jika Anda tidak membuat nilai dari token ini dan menangkapnya, Anda tidak dapat keluar dari dasar permanen。

ada tiga pertanyaan berbeda di sini: pertama, gunakan lebih banyak token; kedua, ciptakan nilai dari token ini; dan ketiga, ambil nilai dari nilai yang anda buat dari token. jika anda tidak dapat melakukan tiga hal ini, anda tidak akan pernah keluar dari dasar permanen sebagai kemampuan model terus gelombang dan sumber daya mungkin menjadi lebih terkonsentrasi。

Oke, mari kita bicara sisi pasokan. Apa yang terjadi sekarang? Jika kurva permintaan naik, perubahan apa yang terjadi di depan seluruh depot pasokan untuk menyajikan semua token ini? Sebagai permintaan meningkat, segala sesuatu di sisi pasokan meningkat. Harga meningkat baik di GPU NVIDIA atau di tempat lain. Pada saat yang sama, kehidupan mereka yang berguna sedang diperpanjang。

Itulah tren harga untuk H100. Di masa lalu, telah dikatakan bahwa GPU memiliki kehidupan yang berguna kurang dari lima tahun, yang benar-benar omong kosong. Beberapa kelompok Hopper, tiga atau empat tahun yang lalu, sekarang kembali kontrak selama tiga atau empat tahun; beberapa A100 cluster juga memperbaharui kontrak untuk tahun mendatang。

Jadi kehidupan aktif GPU jelas bukan lima tahun, atau bahkan tujuh atau delapan tahun. Kita belum tahu, tunggu sampai Hopper benar-benar sampai ke panggung itu. Tapi jelas, itu bukan lima tahun. Dan pada saat pembaruan, harga naik。

INI BERARTI BAHWA TINGKAT MĀORI UNTUK CLUSTER SEBENARNYA TIDAK 35 PERSEN, TAPI LEBIH TINGGI. KEUNTUNGAN AWAN BERKEMBANG. LAPISAN PERANGKAT KERAS MEMILIKI MARJIN KEUNTUNGAN YANG SANGAT SEHAT, DAN NVIDIA MASIH PENGISIAN SEKITAR 75% DARI TINGKAT MAORI. MELIHAT LEBIH JAUH KE BAWAH RANTAI PASOKAN, JELAS BAHWA MARGIN KEUNTUNGAN RANTAI MEMORI TELAH MENINGKAT SECARA SIGNIFIKAN. KEMAJUAN BESAR JUGA DIBUAT DI DAERAH-DAERAH SEPERTI MODUL CAHAYA DAN CHIP LOGIS, DAN MARGIN LABA PERLAHAN-LAHAN MENINGKAT。

DAN YANG LEBIH PENTING, PERUSAHAAN SEPERTI NVIDIA YANG MEMBUAT CHIP MEMBAYAR KEMAJUAN BESAR. JADI BAHKAN JIKA TINGKAT MĀORI TIDAK MENINGKAT SECARA SIGNIFIKAN, BIAYA MODAL, TITIK ALIRAN UANG TUNAI, ATAU PENGEMBALIAN MODAL INVESTASI SEDANG MENINGKAT。

Anda dapat melihat ini melintasi rantai pasokan. ASML telah terjual habis sepenuhnya, dan perlu Carl Zeiss untuk memperluas lebih cepat. Sepanjang rantai pasokan, setiap rantai dijual keluar dan margin keuntungan meningkat; atau kemajuan diterima, sehingga meningkatkan pengembalian modal investasi, yang sebenarnya diperlukan untuk berinvestasi lebih sedikit。

INI ADALAH TREN KONSISTEN DI SELURUH RANTAI PASOKAN. BAHKAN PCB SEPERTI INI. PABRIK PCB MEMBUTUHKAN PLATINUM TEMBAGA, YANG TERJUAL HABIS, DAN ORANG-ORANG MULAI MEMBUAT KEMAJUAN UNTUK PLATINUM TEMBAGA。

Hal ini dapat dikatakan bahwa selama hal ini memiliki pulsa, selama itu dalam rantai pasokan dan terjual habis, orang akan berjuang untuk lebih persediaan bertahap dan untuk persediaan dalam tahun-tahun mendatang。

Kekurangan kekuatan komputasi menyebabkan seluruh rantai industri

Dylan Patel:

Persediaan rantai biasanya bereaksi cepat. Tapi kali ini ada tempat yang unik: hari ini rantai pasokan lebih kompleks daripada sebelumnya, dan apa yang kita bangun lebih kompleks daripada sebelumnya, sehingga siklus pengiriman lebih panjang. Tidak mengatakan bahwa industri lain tidak memiliki siklus pengiriman 18 bulan, tapi kali ini pembangunan pasokan baru itu sendiri memakan waktu beberapa tahun。

ITULAH MEMORI. KAPASITAS MEMORI HANYA DAPAT TUMBUH DENGAN PERSENTASE GANDA DIGIT PER TAHUN, MISALNYA, 20%, 30%. NAND BAHKAN LEBIH RENDAH, DRAM SEDIKIT LEBIH TINGGI. MESKIPUN SINYAL PERMINTAAN KUAT PADA AKHIR 2025 DAN PERUSAHAAN MEMORI MERESPON SEGERA, KAPASITAS BARU NYATA TIDAK AKAN DATANG。

Selain pertumbuhan 20 sampai 30 persen yang akan terjadi setiap tahun, mereka pasti dapat menekan sedikit lebih produktif. Tapi itu tidak sampai 2028 untuk pasokan baru yang nyata. Ini bisa menjadi akhir 2027 di awal, tapi mungkin 2028. Ini sangat unik. Bahkan jika mereka ingin memperluas produksi mereka secepat mungkin, pasokan tidak akan segera tiba。

AKIBATNYA, HARGA INGATAN MENINGKAT. DAN AKU BILANG, TERUTAMA DRAM, HARGA AKAN SETIDAKNYA DUA KALI LIPAT, ATAU BAHKAN TIGA KALI LIPAT。

BEBERAPA ORANG AKAN BERKATA, "KISAH KENANGAN TELAH RUSAK, DAN SEMUA ORANG MENGERTI". TAPI TIDAK BENAR-BENAR, ANDA TIDAK BENAR-BENAR MENGERTI. DRAM MASIH MUNGKIN DUA ATAU TIGA KALI LIPAT DARI SEKARANG, KARENA ITU ADALAH BERAPA BANYAK YANG DIPERLUKAN. MEREKA HARUS MEREBUT KAPASITAS DARI TEMPAT LAIN. DALAM EKONOMI KAPITALIS, SATU-SATUNYA CARA UNTUK MEREBUT KAPASITAS DARI TEMPAT LAIN ADALAH UNTUK MENGHANCURKAN BAGIAN PERMINTAAN PADA HARGA YANG LEBIH TINGGI. KITA TIDAK DALAM SISTEM PENJATAHAN, JADI ITU PASTI TERJADI. MARJIN KEUNTUNGAN AKAN TERUS MENINGKAT。

Saya pikir ada juga masalah kapasitas besar dengan chip logis. Pembangunan baru saja diterbitkan, dan mereka telah meningkatkan pengeluaran modal. Namun, pembangunan pabrik bundar akan memakan waktu lama. Mereka membuat setiap upaya untuk mengekstrak lebih banyak output dari setiap tanaman yang ada. Namun, tidak ada peningkatan cepat dalam harga listrik, karena mereka "orang baik". Peningkatan harga mungkin hanya dalam satu digit, daripada tiga digit meningkat seperti produsen memori。

Jadi pada akhirnya Anda akan melihat pasar di mana listrik adalah perusahaan yang besar, tapi apakah itu benar-benar mengambil semua nilai-nilai? Belum tentu。

AKU BARU SAJA MENYEBUTKAN BEBERAPA HAL, SEPERTI TEMBAGA, KACA, LASER YANG DIBUTUHKAN PCB. INI ADALAH RELATIF BAIK - DIPAHAMI, TAPI SANGAT DIBAGI RANTAI PASOKAN, YANG JUGA SANGAT TEGANG. MELIHAT HULU, RANGKAIAN PASOKAN PERALATAN PEMBUAT KRISTAL SEMI KONDUKTOR TERUS DIPERTIMBANGKAN TELAH MENINGKAT SECARA SIGNIFIKAN, TETAPI PASAR SERIUS MEREMEHKAN PENTINGNYA。

Pengeluaran modal untuk tahun ini adalah 56 miliar dolar. Kita mulai pada bulan Januari dengan proyeksi sebesar $57,4 miliar, dan kemungkinan besar akan sedikit lebih tinggi, karena kita melihat beberapa cara untuk meningkatkan pengeluaran modal。

Tapi tidak ada kekhawatiran yang nyata: apa artinya ini untuk tahun depan? Apa artinya untuk tahun depan

Akibatnya, dalam tiga tahun, pembangkit listrik dapat meningkatkan pengeluaran modal hingga $100 miliar. Mungkin dua tahun kemudian, pada tahun 2028, mereka benar-benar bisa menghabiskan $100 miliar untuk pengeluaran modal. Aku serius mengatakan bahwa pembangkit listrik bisa menghabiskan $100 miliar di tahun 2028 untuk pengeluaran modal。

Banyak orang tidak bisa membayangkan itu. Tapi apa artinya untuk rantai pasokan hilir nya? Apa artinya bagi perusahaan seperti Lam Research, Applied Materials, ASML? Apa artinya bagi perusahaan seperti rantai pasokan hilir, seperti MKS Industries

Sapi-sapinya bisa diperbesar。

Catatan: Istilah "frown whips" mengacu pada pembesaran dalam rantai pasokan. Secara khusus, Al membutuhkan pada bagian bawah terlihat seperti hanya lonjakan tanda penggunaan, tetapi ketika ditransmisikan ke rantai pasokan hulu, mereka diperbesar oleh lapisan, yang berubah menjadi expansi yang lebih berlebihan, harga meningkat dan kapasity- mengambil。

Jika bangunan-up benar-benar ingin menghabiskan $100 miliar untuk pengeluaran modal di 2028, dan saya pikir mungkin bahwa banyak orang akan berpikir itu gila, tapi itu benar-benar bisa terjadi。

Patrick O 'Shaughtnessy:

BAGAIMANA DENGAN EKOLOGI CHIP LAINNYA? GPU SELALU BENAR-BENAR DOMINAN. TAPI APAKAH CPU, ASICS ATAU HAL-HAL LAIN MUNCUL SEBAGAI KESEMPATAN BARU DAN BOTTLENECKS? DI LUAR DOMINASI GPU NVIDIA, APALAGI YANG HARUS DIFOKUSKAN

Dylan Patel:

YA, ASCIC TAMPAKNYA LEPAS LANDAS. TAPI PERTAMA-TAMA SAYA INGIN MELOMPAT DARI CHIP AI ITU SENDIRI DAN BERBICARA TENTANG SESUATU YANG LAIN. KAMI TELAH MELAKUKAN SEBUAH PROYEK DI FPGA, DAN TERNYATA SETIAP GENERASI BERIKUTNYA AI HANGERS AKAN MEMBUTUHKAN 120 FPGA. JADI APA ARTINYA UNTUK SEMUA PERUSAHAAN FPGA

Hal yang sama berlaku untuk CPU. Semua lingkungan belajar diperkuat, ditambah "kode spam" yang Anda dan saya buat, Sekarang mereka semua berjalan pada contoh Vercel, contoh dari AWS, atau sumber daya awan yang kita mulai dengan. Semua ini membutuhkan CPU. Jadi CPU sekarang benar-benar dijual, dan permintaan meningkat cepat。

Patrick O 'Shaughtnessy:

MARI KITA LIHAT APA CPU BERMAIN DALAM SISTEM

Dylan Patel:

ADA DUA ALASAN UTAMA MENGAPA ANDA MEMBUTUHKAN BANYAK CPU。

PERTAMA, MEMPERKUAT PEMBELAJARAN. KETIKA MELAKUKAN PEMBELAJARAN INTENSIF, CPU SANGAT PENTING。

Di masa lalu, Anda akan membuang seluruh data internet ke dalam model, dan kemudian model akan memuntahkan beberapa hasil. Sekarang, Anda masih menempatkan data internet dalam model, tapi kemudian Anda memasukkannya ke dalam lingkungan, dan Anda berkata, "Ayo, cobalah. Model akan mencoba banyak hal yang berbeda. Akhirnya, lingkungan menilai keberhasilan dari hasil dari usahanya dan menunjukkannya. Lingkungan ini bisa apa saja. Hal ini dapat sederhana, misalnya, untuk memeriksa apakah teks keluaran cocok dengan format yang benar atau apakah keluaran terstruktur benar. Ini bisa sangat rumit。

SEKARANG ORANG-ORANG MASUK KE ADEGAN YANG SANGAT KOMPLEKS. SEBAGAI CONTOH, SAYA INGIN ANDA MEMBUKA BERKAS INI, MENGUBAHNYA, MENGEDITNYA, MEMPERBARUINYA, DAN MENGIRIMKANNYA KE SITUS WEB. ATAU, "AKU INGIN KAU MEMBUKA PERANGKAT LUNAK SIMULASI FISIKA SIEMENS DAN MENGEDIT MODEL CAD INI". JADI LINGKUNGAN INI MENJADI LEBIH KOMPLEKS. DAN LINGKUNGAN INI BERJALAN DI CPU, BUKAN DI GPU DAN BUKAN DI ASIC。

ASIC ATAU GPU BERTANGGUNG JAWAB UNTUK MENJALANKAN MODEL ITU SENDIRI: MENERIMA DATA MASUKAN DARI LINGKUNGAN, MENGIRIMNYA KE MODEL, MENGHASILKAN JALUR KELUARAN YANG BERBEDA, YAITU, CARA YANG BERBEDA DI MANA MODEL PERCAYA DAPAT MEMECAHKAN MASALAH. JALUR INI KEMUDIAN DIEVALUASI DAN DINILAI. MEREKA JALAN SUKSES AKAN DIGUNAKAN UNTUK MELANJUTKAN PELATIHAN MODEL, UNTUK MEMPERBARUI MODEL DAN MENGULANGINYA. JADI INI ADALAH TEMPAT PERTAMA YANG SANGAT BERGUNA UNTUK CPU。

Tempat kedua adalah penyebaran。

KETIKA ANDA MEMILIKI MODEL-MODEL YANG KUAT INI, DAN ANDA MENYEBARKANNYA, MEREKA MENGHASILKAN KODE-KODE DAN SEMUA HASIL YANG BERGUNA. TAPI HASIL-HASIL INI TIDAK LANGSUNG DARI GPU KE OTAK MANUSIA. MEREKA AKAN KELUAR DARI GPU ATAU ASIC MENJADI APLIKASI YANG ANDA SEBARKAN, DAN APLIKASI ITU SENDIRI BIASANYA BERJALAN PADA CPU。

JADI INI ADALAH BIDANG LAIN DARI KEBUTUHAN BESAR. CPU SEBAGIAN BESAR TERJUAL HABIS。

NILAI AI HARD UNTUK MENDAPATKAN STATISTIK GDP

Patrick O 'Shaughtnessy:

Ketika Anda terus-menerus menilai pasokan dan kecenderungan permintaan dan mencoba untuk menjadi yang paling berpengetahuan dari keduanya, apa yang Anda ingin tahu, tapi belum

Dylan Patel:

saya pikir bagian tersulit bagi kita, bagi semua orang, adalah tokenomics, atau token ekonomi. biaya menjalankan infrastruktur, biaya token, biaya model, margin keuntungan laboratorium ini adalah penilaian yang sangat baik. tapi apa yang benar-benar sulit untuk model adalah menggunakan dan kecepatan adopsi。

Pada bulan Januari, kami membuat beberapa prediksi yang sangat radikal pada bulan Februari, dan sebagai hasilnya, Anthropic mudah melebihi itu. Bagaimana kita mengkalibrasi model ini? Sumber data apa yang harus digunakan? Pada bulan Februari, kami membuat asumsi yang sangat radikal tentang Maret, dan mereka melampaui itu. Ketika Anda melihat angka pendapatan $10 miliar, reaksinya adalah: apa itu? Bagaimana mereka bisa menambahkan 10 milyar dolar untuk pendapatan mereka? Siapa yang menggunakan token ini? Kenapa? Apa yang mereka bangun dengan token ini? Dan, yang lebih penting, bagaimana mereka bisa membangun dengan token-token ini menyebar ke ekonomi? Berapa banyak nilai yang telah mereka ciptakan

Ini bukan sesuatu yang mudah ditangkap oleh statistik PDB. Sebagai contoh, saya menggunakan semua nilai yang dibuat dengan token, yang akhirnya diterjemahkan menjadi informasi yang lebih baik. Lalu aku menjual informasi dan menjualnya dengan harga yang lebih rendah dari orang lain di masa lalu。

informasi ini kemudian memasuki seluruh sistem ekonomi, memungkinkan orang untuk membuat keputusan investasi yang lebih baik atau keputusan kompetisi yang lebih baik. mereka perusahaan semikonduktor, perusahaan pusat data, atau hyperscaler, jadi apa nilai dari informasi ini? apa pengaruhnya pada ekonomi

Ini jelas sangat mengkhawatirkan dari indikator subjektif apapun. Tapi pertanyaannya adalah, di mana GDP Ghost? PDB Phantom. Apa itu? Bagaimana kita melacak nilai ekonomi yang nyata

Karena indikator PDB yang ada tidak akurat. Dan jika Anda bertanya Dylan Patel berapa banyak GDP telah dibuat, jumlahnya akan sangat kecil, dan akan keluar dari proporsional untuk nilai yang saya pikir benar-benar miliki。

jadi pertanyaan terakhir adalah: berapa banyak nilai token ini dibuat? ini bukan hanya pendapatan langsung, tapi efek riak yang mereka bawa. apa konsekuensi dari semua yang mereka lakukan

saya pikir itu adalah masalah yang sebenarnya dan tantangan yang paling sulit untuk diukur. saya pikir kita memiliki penilaian yang sangat baik di sisi pasokan. kami juga memiliki penilaian yang sangat baik tentang banyak sinyal di sisi permintaan. tapi sulit untuk mengukur dan mengukur nilai apa token ini telah dibuat. saya berharap bahwa kita bisa melakukan ini setiap tiga bulan, karena terlalu cepat。

PROTES ANTI-AI, MUNGKIN DALAM WAKTU TIGA BULAN

Patrick O 'Shaughtnessy:

Menurutmu apa yang terjadi selanjutnya? Aku akan melihat Anda di San Francisco dalam tiga bulan. Apa yang kau harapkan

Dylan Patel:

Protes massal。

Patrick O 'Shaughtnessy

SEBUAH PROTES TERHADAP AI。

Dylan Patel

Orang-orang membenci AI. AI sekarang bahkan kurang populer dari ICE, lebih dari politisi. Aku tidak tahu bagaimana Pew melakukannya, tapi rupanya AI kurang populer daripada politisi。

Sebagai Anthropic meningkatkan pendapatan begitu banyak, mulai memicu perubahan bisnis hilir. Orang-orang akan takut pada AI. Mereka akan mulai menyalahkan AI untuk pertumbuhan jumlah masalah mereka, serta untuk banyak lama-berdiri, mendalam masalah global。

MASALAH INI AKAN MUNCUL DAN DIKAITKAN DENGAN AI. KEMUNGKINAN BAHWA BEBERAPA POLITISI, ATAU ORANG DI MEDIA SOSIAL, BERPENGARUH, AKAN MULAI MEMPERSENJATAI AI UNTUK MENYERANG ORANG LAIN。

Anda melihat komentar di bawah beberapa artikel berita. Rumah Sam Altman dilemparkan dalam botol terbakar dua kali dalam dua minggu, dan seseorang di bagian komentar menjerit. Ini hanya permulaan. Jadi saya pikir dalam tiga bulan kita akan melihat protes besar melawan AI。

Patrick O 'Shaughtnessy:

APA DAYA UNTUK MENGIMBANGINYA? AI, BAGAIMANA SEHARUSNYA REAKSI INDUSTRI DI MUKA

Dylan Patel:

Pertama, Sam Altman dan Dario harus berhenti mewawancarai. Mereka terlalu tidak menarik. Aku tidak tahu apa yang mereka lakukan. Setiap wawancara membuat orang biasa membenci mereka bahkan lebih. Sam Altman di Tucker Carlson, sebagai contoh, mungkin membuat seluruh Republik lebih membenci OpenAI. Dario adalah sama. Mereka benar-benar tidak menarik. Itu poin pertamanya。

KEDUA, MEREKA HARUS MULAI MENUNJUKKAN HAL-HAL POSITIF YANG DAPAT DILAKUKAN AI。

KETIGA, MEREKA PERLU BERHENTI BERBICARA TENTANG BAGAIMANA "KEMAMPUAN AI AKAN MENGUBAH DUNIA". ORANG HANYA BISA TAKUT MENDENGARNYA. TERUTAMA KETIKA MEREKA TIDAK MEMILIKI HUBUNGAN NYATA DENGAN TEKNOLOGI INI。

Patrick O 'Shaughtnessy

Mereka tidak tahu bagaimana menggunakannya。

Dylan Patel:

Dan mereka tidak terhubung dengan itu. Orang biasa tidak mengenal karyawan Anthropic atau karyawan OpenAI. Orang biasa tidak tahu siapa orang-orang ini atau apa target mereka. Mereka hanya melihat perusahaan-perusahaan ini sebagai kelompok kecil yang licik: ribuan orang berkumpul di satu perusahaan untuk mengubah dunia, otomatisasi semua pekerjaan dan menghancurkan masyarakat. Itulah yang banyak orang lihat。

SELAIN ITU, PERUSAHAAN-PERUSAHAAN INI MEMBIAYAI DAN MEMPROMOSIKAN PEMBANGUNAN SEJUMLAH BESAR PUSAT DATA DAN PEMBANGKIT LISTRIK YANG, DI MATA PUBLIK, DAPAT MENCEMARI DUNIA. ORANG TIDAK BENAR-BENAR MENGERTI APA YANG TERJADI. JADI PERUSAHAAN-PERUSAHAAN INI HARUS BERHENTI BERBICARA TENTANG PERUBAHAN BESAR YANG AKAN TERJADI DI MASA DEPAN, SEKARANG: BAGAIMANA AI AKAN MEMBUAT PERBEDAAN YANG POSITIF SEKARANG. SAYA PIKIR INI MEMERLUKAN SEBUAH ORGANISASI BESAR DAN RENOVASI MEREK。

Patrick O 'Shaughtnessy:

Aku suka melakukan percakapan ini denganmu. Terima kasih atas waktumu。

Dylan Patel:

Bagus, terima kasih。

Tautan Video

Pada era AI, pertempuran terakhir Token antara penawaran dan permintaan

TL; DR

Organiser lainnya

Claude Code menjadi tenaga kerja baru

Token menjadi sumber daya produksi baru

Robot akan mengambil gelombang permintaan berikutnya

Kekurangan kekuatan komputasi menyebabkan seluruh rantai industri

NILAI AI HARD UNTUK MENDAPATKAN STATISTIK GDP

PROTES ANTI-AI, MUNGKIN DALAM WAKTU TIGA BULAN

Artikel Terkait

U.S.S.S.S.D. News

Dekat TGE, MegaETH Eco- Defi emas menggali panduan

Ketika Agen AI mengambil alih rantai otoritas: Seberapa jauh paradigma keuangan baru dari Web 4.0

Untuk 3 juta cedera tulang belakang, dia meretas kursi roda

Produk

Hukum & Dukungan

Tautan Teman