JUDUL ASLI: "HWANG IN-HOON GTC FULL SPEECH: USIA PENALARAN, 2027 SETIDAKNYA TRILIUN DOLAR, LOBSTER ADALAH SISTEM OPERASI BARU"

Asli oleh: Wall Street

PADA 16 MARET 2026, KONGRES SECARA RESMI DIBUKA DENGAN ALAMAT KUNCI OLEH PENDIRI DAN CEO HOANG IN- HOON。

PADA KONFERENSI INI, YANG DIANGGAP SEBAGAI "ZIARAH TAHUNAN INDUSTRI AI", KAMI TELAH MENEMUKAN CARA UNTUK MEMBUAT PERBEDAANWONG IN- HOON MENGGAMBARKAN PERJUANGAN WEI DA YOUNG DARI PERUSAHAAN CHIP KE INFRASTRUKTUR AI DAN PERUSAHAAN PABRIK. UBAHAku tidak tahu. Menghadapi perhatian terbesar pasar untuk keberlanjutan kinerja dan ruang untuk pertumbuhanHuang In- hoon rincian yang mendasari logika bisnis yang mendorong pertumbuhan masa depan - "Ekonomi Pabrik Token"。

Panduan performance sangat optimis, "setidaknya $1 triliun pada tahun 2027"

SELAMA DUA TAHUN TERAKHIR, PERMINTAAN PERHITUNGAN AI GLOBAL TELAH MELEDAK SECARA EKSPONENSIAL. SEBAGAI MODEL BESAR BEREVOLUSI DARI "SENSITISASI" KE "GENERASI" UNTUK "DEBAT" DAN "TINDAKAN" (TUGAS) KONSUMSI DAYA KOMPUTASI MENINGKAT SECARA DRAMATIS. HWANG IN- HOON MEMBERIKAN HARAPAN YANG SANGAT KUAT UNTUK PASAR TINGGI ORDER BUNGA DAN KOLEKSI LANGIT-LANGIT。

In- hoon Huang, dalam pidatonya, menyatakan:

Tahun lalu pada saat ini, saya berkata, kami melihat $500 miliar dalam permintaan kepastian yang tinggi, meliputi Blackwell dan Rubin sampai 2026。sekarang, di sini, saya melihat setidaknya $1 triliun permintaan pada tahun 2027。

Trilyunan dolar Wong In- hoon diharapkan untuk mendorong harga saham Inggris naik sebesar 4,3 persen。

Selain itu, ia menambahkan ke nomor ini:

Apa itu masuk akal? Itu yang kumaksud. Bahkan, kita bahkan akan kehabisan pasokan。Saya yakin bahwa kebutuhan komputasi aktual akan jauh lebih tinggi。

WONG IN- HOON MENUNJUKKAN BAHWA SISTEM HARI INI TELAH TERBUKTI MENJADI "INFRASTRUKTUR MURAH DI DUNIA". GENERALITAS INI MEMUNGKINKAN KLIEN UNTUK SEPENUHNYA MEMANFAATKAN DAN MEMPERTAHANKAN SIKLUS UMUR PANJANG DARI $1 TRILIUN DIINVESTASIKAN DI HAMPIR SEMUA BIDANG MODEL AI。

Saat ini, 60 persen bisnis di Ingweida berasal dari lima penyedia layanan awan supermasif terbaik, sementara 40 persen lainnya tersebar luas dalam bidang kedaulatan awan, perusahaan, industri, robotika dan batas komputasi。

Ekonomi Token Factory. Setiap watt kinerja menentukan kehidupan bisnis

UNTUK MENJELASKAN LEGITIMASI 1 TRILIUN PERMINTAAN INI, HUANG IN- HOON MENUNJUKKAN CEO PERUSAHAAN GLOBAL SET BARU BERPIKIR BISNIS。Dia mencatat bahwa pusat data masa depan tidak lagi merupakan repositori dokumen, tapi "workshop" yang menghasilkan Token (unit dasar dibuat oleh AI)。

Wong In- hoon stres:

SETIAP PUSAT DATA, SETIAP TANAMAN ADALAH MENURUT DEFINISI DIBATASI OLEH LISTRIK. SEBUAH TANAMAN 1GW TIDAK AKAN PERNAH MENJADI 2GW, HUKUM FISIKA DAN ATOM。Dengan kekuatan tetap, yang memiliki volume tertinggi per watt dari Token, yang memiliki biaya produksi terendah。

HUANG IN- HOON MEMBAGI LAYANAN AI MASA DEPAN MENJADI EMPAT TINGKAT BISNIS:

Lantai BebasTinggi, rendah, rendah)

:: tingkat intermediate(~ $3 per juta)

Tingkat Lanjutan(~ $6 per juta)

:: lapis kecepatan tinggi(~ $45 per juta token)

undo-type(~ $150 per juta token)

Dia menunjukkan bahwa AI akan lebih cerdas dengan jumlah model dan konteks yang tumbuh, namun tingkat produksi Token akan lebih rendah. Huang In- hoon menyatakan:

Dalam pabrik Token ini, Anda melalui dan kecepatan generasi Token akan diterjemahkan langsung ke pendapatan tepat Anda tahun depan。

Wong In- hoon menekankan bahwa muda Wei Da arsitektur akan memungkinkan klien untuk mencapai tingkat yang sangat tinggi penetapan pada tingkat bebas, sementara meningkatkan kinerja dengan mengejutkan 35 kali pada tingkat tertinggi penalaran nilai。

Vera Rubin mencapai 350 kali lebih cepat dalam dua tahun, Groq mengisi dalam hyperdrive penalaran

Di bawah batasan batas fisik ini, Yestaa menggambarkan sistem komputer AI yang paling kompleks yang pernah ada, Vera Rubin. Huang In- hoon menyatakan:

Aku sering berbicara tentang Hope, dan aku akan mengangkat chip, dan itu lucu. Tapi dengan Vera Rubin, kau berpikir tentang sistem. Dalam sistem pendingin cair 100 persen ini, yang benar-benar menghilangkan kabel tradisional, butuh dua hari untuk memasang hangar dan sekarang hanya dua jam。

Hoang Inhoon mencatat bahwa Vera Rubin menciptakan data yang menakjubkan melompat di pusat data GW yang sama 1 GW melalui sangat akhir-to-end desain perangkat keras:

Hanya dalam dua tahun, kami meningkatkan tingkat produksi Token dari 22 juta menjadi 700 juta, mencapai 350 kali peningkatan. Hukum Moore hanya dapat membawa sekitar 1,5 kali lebih tinggi sementara itu。

Dalam rangka untuk mengatasi bottlenecks bandwidth di bawah kondisi penalaran kecepatan tinggi (misalnya 1000 Tokens / s), Inverda memberikan solusi akhir untuk mengkonsolidasi Groq perusahaan yang diperoleh: penalaran pemisahan asimetris。

Wong In- hoon menjelaskan:

Sifat dari dua prosesor berbeda. Chip Groq memiliki 500MB SRAM dan sebuah chip Rubin memiliki memori 288GB。

Wong In- hoon mencatat bahwa melalui sistem perangkat lunak Dynamo, Young Weida akan membutuhkan fase komputasi massa dan prefilling untuk Vera Rubin, dan fase decodement yang sangat sensitif untuk penundaan bagi Groq。Huang In- hoon juga menawarkan saran tentang konfigurasi perusahaan:

Jika pekerjaan Anda terutama tinggi-menelan, 100% menggunakan Vera Rubin, jika Anda memiliki banyak tingkat pemrograman bernilai tinggi diperlukan generasi Token, mengambil 25% dari ukuran pusat data untuk Groq。

Ini terungkap bahwa chip Groq LP30, yang telah diproduksi oleh tiga bintang agen, telah diproduksi dalam volume dan diharapkan akan dikirim di kuartal ketiga, sementara pertama Vera Rubin hanger beroperasi pada Microsoft Azure awan。

Selain itu, sehubungan dengan teknologi koneksi cahaya, Huang In- hoon menunjukkan produksi global utama dari sebuah co-container pertukaran optik, Spectrum X, dan tenang pasar melawan atas "mundur tembaga" rute:

KITA PERLU LEBIH BANYAK KABEL TEMBAGA, LEBIH BANYAK CHIP RINGAN, LEBIH BANYAK CPOSAku tidak tahu。

Agen, mengakhiri tradisi, SaaS, "Gaji tahunan ditambah Token" adalah tanda Silicon Valley. Cocok

Selain hambatan hardware, Hwang In- hoon meninggalkan banyak ruang untuk perangkat lunak AI dan revolusi ekologi, terutama wabah Agen。

Dia menjelaskan proyek open-source OpenClaw sebagai "proyek open-source paling populer dalam sejarah manusia", mengklaim bahwa itu hanya memakan waktu beberapa minggu untuk melampaui prestasi Linux selama 30 tahun terakhir. In- hoon Hwang mengatakan bahwa OpenClaw pada dasarnya adalah "sistem operasi" dari komputer Agen。

Huang In- hoon menegaskan:

Setiap perusahaan SaaS (software, layanan) akan menjadi Aaas, Smart, Service. Tidak ada keraguan bahwa, untuk mengamankan pendaratan aman dari tubuh pintar ini, yang memiliki akses ke data sensitif dan kode penegakan, desain referensi NeMo Claw pada tingkat perusahaan telah diperkenalkan, menambahkan mesin strategis dan router privasi。

Bagi pekerja biasa, perubahan juga dekat. Huang In- hoon menggambarkan bentuk baru dari tempat kerja masa depan:

Di masa depan, setiap insinyur di perusahaan kami membutuhkan anggaran Token tahunan。Gaji dasar mereka bisa ratusan ribu dolar per tahun, dan berdasarkan itu, saya akan memberi mereka sekitar setengah skala Token, memungkinkan mereka untuk mencapai keuntungan efisiensi 10x。Ini chip perekrutan baru Silicon Valley: Berapa banyak tawaran Anda, Token

Pada akhir pidato, Huang In- hoon juga "blowed" generasi berikutnya struktur komputasional, Feynman, yang akan untuk pertama kalinya memperluas tingkat yang sama seperti garis tembaga dan CCPO. Apa yang lebih mencolok adalah bahwa komputer pusat data Vera Rubin Space-1, yang dikerahkan di ruang angkasa, sedang dikembangkan oleh Ingweida, yang benar-benar membuka imajinasi algoritma AI 's memperluas luar Bumi。

TEKS PENUH DARI PIDATO GTC 2026, DITERJEMAHKAN SEBAGAI DUKUNGAN ALAT AI:

Moderator:Selamat datang di podium, Hoang Inhoon, pendiri dan Kepala Eksekutif Petugas In Weida。

Huang In- hoon, Pendiri dan Kepala Eksekutif:SELAMAT DATANG DI GTC. SAYA INGIN MENGINGATKAN ANDA BAHWA INI ADALAH KONFERENSI TEKNIS. INI MEMBERI SAYA SENANG MELIHAT BEGITU BANYAK ORANG SEJALAN DI PAGI HARI DAN KALIAN SEMUA DI SINI。

DI GTC, KITA AKAN FOKUS PADA TIGA TEMA UTAMA: TEKNOLOGI, PLATFORM, DAN EKOSISTEM。

SEKARANG MEMILIKI TIGA PLATFORM UTAMA: PLATFORM CUDA-X, PLATFORM SISTEM, DAN PLATFORM AI KAMI BARU-BARU INI DILUNCURKAN。

Sebelum kita mulai, saya ingin mengucapkan terima kasih kepada tuan rumah pra-panas kami - Sarah Guo dari Convition, Alfred Lin dari Redwood Capital (investor pertama di Inggris), dan Gavin Baker, investor institusi pertama di Inverda. Ketiga memiliki wawasan yang mendalam ke dalam teknologi dan memiliki pengaruh besar di seluruh ekosistem teknologi. Tentu saja, aku juga ingin berterima kasih pada semua tamu terhormat yang aku undang hari ini. Berkat tim bintang ini。

Saya juga ingin berterima kasih kepada semua perusahaan yang ada di sini hari ini. Kami memiliki teknologi, platform, dan ekosistem yang kaya. Perusahaan yang ada di sini mewakili hampir semua peserta dalam industri $10 triliun, dan 450 perusahaan telah mensponsori acara ini, dan kami sangat berterima kasih。

Konferensi ini akan memiliki 1.000 forum teknis, 2.000 pembicara dan akan mencakup setiap tingkat artifisial kecerdasan lima lantai arsitektur - dari infrastruktur seperti tanah, listrik dan mesin untuk chip, platform, model dan aplikasi yang akhirnya mendorong seluruh industri。

CUDA: 20 TAHUN AKUMULASI TEKNOLOGI

SEMUANYA DIMULAI DI SINI. TAHUN INI ADALAH ULANG TAHUN KE-20 DARI CUDA。

Selama dua dekade, kami telah bekerja pada pengembangan arsitektur ini。CUDA ADALAH PENEMUAN REVOLUSIONER - SIMT (PERINTAH TUNGGAL MULTI- WIRE) TEKNOLOGI YANG MEMUNGKINKAN PENGEMBANG UNTUK MEMPERSIAPKAN PROGRAM MEREKA DENGAN KODE STANDAR DAN MEMPERLUAS MEREKA UNTUK APLIKASI MULTI- WIRE, YANG PEMROGRAMAN JAUH LEBIH SULIT DARIPADA ARSITEKTUR SIMD SEBELUMNYA。Kami juga baru-baru ini menambahkan fungsi Tiles, yang membantu pengembang untuk memprogram inti (Tensor Core), serta berbagai algoritma matematika di mana kecerdasan buatan tergantung hari ini。SAAT INI, CUDA MEMILIKI RIBUAN ALAT, COMPILER, FRAMEWORK DAN PERPUSTAKAAN, RATUSAN RIBU PROYEK TERBUKA DALAM KOMUNITAS OPEN SOURCE, DAN TELAH TERINTEGRASI DALAM SETIAP EKOSISTEM TEKNOLOGI。

GRAFIK INI MENGUNGKAPKAN 100% DARI LOGIKA STRATEGIS INVERDA, DAN SAYA TELAH BERBICARA TENTANG SLIDE INI SEJAK AWAL. SALAH SATU ELEMEN PALING SULIT DAN SENTRAL UNTUK MENCAPAI ADALAH "BEBAN" DI BAGIAN BAWAH BAGAN. SELAMA DUA DEKADE TERAKHIR, KAMI TELAH MENGUMPULKAN RATUSAN JUTA POTONGAN-POTONGAN GPU DAN SISTEM KOMPUTASI DI SELURUH DUNIA。

GPU KAMI MENCAKUP SEMUA PLATFORM AWAN YANG MELAYANI HAMPIR SEMUA PRODUSEN KOMPUTER DAN INDUSTRI. KAPASITAS BESAR CUDA ADALAH PENYEBAB MENDASARI KECEPATAN KAPAL INI. BEBAN MENARIK PENGEMBANG, YANG MENCIPTAKAN ALGORITMA BARU DAN MEMBUAT TEROBOSAN, MEMECAH PASAR BARU, MEMBUAT EKOLOGI BARU DAN MENARIK LEBIH BANYAK PERUSAHAAN UNTUK MEMPERLUAS BEBAN - SEBUAH RODA YANG MEMPERCEPAT TERUS。

Volume pengunduhan dari Wei Daqu tumbuh pada tingkat yang mengkhawatirkan dan besar dan meningkat. Roda ini telah mengaktifkan platform perhitungan kami untuk mempertahankan aplikasi besar dan mengembangkan terobosan baru。

Yang lebih penting lagi, hal ini memberikan infrastruktur kehidupan yang sangat berguna。Alasan untuk ini jelas: NVIDIA CUDA memiliki berbagai aplikasi operasional yang sangat luas meliputi setiap fase dari siklus kehidupan AI, berbagai platform pemrosesan data, dan berbagai pemecah ilmiah. Oleh karena itu, nilai sebenarnya dari GPU sekali terpasang sangat tinggi. Dan itulah mengapa arsitektur Ampere yang kami terbitkan enam tahun yang lalu, GPU, meningkat。

Penyebab utama dari semua ini adalah:Kapasitas besar, roda kuat dan pengembang wide- ranging。KETIKA FAKTOR-FAKTOR INI BEKERJA SAMA, BERSAMA DENGAN PEMBAHARUAN BERKELANJUTAN DARI PERANGKAT LUNAK KITA, BIAYA AKAN TERUS MENURUN. AKSELERATOR KOMPUTASI, SEMENTARA SECARA SIGNIFIKAN MENINGKATKAN KINERJA APLIKASI, AKAN MEMUNGKINKAN PENGGUNA TIDAK HANYA MELOMPAT DALAM KINERJA PADA TAHAP AWAL, TETAPI JUGA TERUS MEMPEROLEH KEUNTUNGAN DARI BIAYA KOMPUTASI BERKURANG SAAT KITA MEMPERTAHANKAN PERANGKAT LUNAK ITERATIF DARI WAKTU KE WAKTU. KAMI BERSEDIA MEMBERIKAN DUKUNGAN JANGKA PANJANG UNTUK SETIAP GPU DI DUNIA, KARENA MEREKA SANGAT COCOK。

Kami bersedia melakukannya karena kapasitas begitu besar - jutaan pengguna dapat memanfaatkan dari optimasi baru setiap kali mereka diterbitkan。KOMBINASI DINAMIS INI TELAH MEMUNGKINKAN ARSITEKTUR WIDA INGGRIS UNTUK MENJAGA BIAYA TURUN SEMENTARA MEMPERLUAS CAKUPAN DAN MEMPERCEPAT PERTUMBUHAN SENDIRI, AKHIRNYA MERANGSANG PERTUMBUHAN BARU. CUDA ADALAH INTI DARI SEMUA INI。

Dari GeForce ke CUDA: 25 tahun evolusi

DAN PERJALANAN KAMI DENGAN CUDA SEBENARNYA DIMULAI 25 TAHUN YANG LALU。

GeForce -- saya percaya ada banyak orang di sini yang tumbuh bersama GeForce. GeForce adalah proyek promosi pasar paling sukses di Selandia Baru. Kami telah membesarkan klien masa depan karena Anda tidak mampu membelinya. - Orang tua Anda, yang menggantikan Anda, menjadi pengguna pertama dari Yvette, membeli produk kami tahun demi tahun, sampai suatu hari Anda tumbuh menjadi ilmuwan komputer yang baik, pelanggan sejati dan pengembang。

Ini adalah yayasan yang dibuat GeForce 25 tahun yang lalu. Lima tahun lalu, kami menemukan monitor warna yang bisa diprogram. Ini jelas tapi jauh mencapai penemuan untuk pemercepat yang dapat diprogram, dan yang pertama diprogram akselerator di dunia, pixel berwarna. Lima tahun kemudian, kami menciptakan CUDA - salah satu investasi yang paling penting dalam sejarah kami. Perusahaan ini memiliki sumber daya keuangan terbatas pada saat itu, tapi kami menginvestasikan sebagian besar keuntungan kami untuk memperluas CUDA dari GeForce ke setiap komputer. Kita begitu kuat karena kita yakin akan potensinya. Meskipun kesulitan awal, perusahaan telah berpegang pada keyakinan ini selama 13 generasi, 20 tahun, dan sekarang CUDA ada di mana-mana。

Ini adalah warna pixel yang mendorong revolusi GeForce. Dan sekitar delapan tahun yang lalu, kami meluncurkan RTX -- perbaikan total arsitektur untuk grafis komputer modern. GeForce membawa CUDA ke dunia, dan itulah mengapa banyak pelajar, seperti Alex Krizhevsky, Ilya Sutsver, Geoffrey Hinton, Andrew Ng, menemukan bahwa GPU bisa menjadi alat kuat untuk mempercepat pembelajaran dalam-kedalaman, sehingga memicu ledakan besar kecerdasan buatan 10 tahun yang lalu。

Sepuluh tahun yang lalu, kami memutuskan untuk mengintegrasikan warna yang dapat diprogram dengan dua ide baru:Salah satunya adalah pelacakan perangkat kerasIni secara teknis menantangDAN YANG KEDUA ADALAH IDE YANG TAMPAK MAJU -- SEKITAR SATU DEKADE YANG LALU, KAMI MEMPERKIRAKAN BAHWA AI AKAN BENAR-BENAR MENGUBAH GRAFIS KOMPUTER。Sama seperti GeForce membawa AI ke dunia, Al sekarang juga akan menciptakan kembali cara seluruh komputer grafis dibuat。

Hari ini, aku ingin menunjukkan masa depan. Ini adalah grafis generasi berikutnya, yang kami sebut Pembangunan Neural -- kedalaman grafis 3D dikombinasikan dengan kecerdasan buatan. Ini DLSS 5, lihat。

NEURAL RENDERING: INTEGRASI DATA TERSTRUKTUR DENGAN AI YANG DIHASILKAN

Apakah ini menakjubkan? Grafisnya sudah direkayasa ulang。

APA YANG KITA LAKUKAN? KAMI MENGGABUNGKAN GRAFIS 3D (DASAR NYATA DARI DUNIA MAYA) DENGAN DATA TERSTRUKTUR MEREKA, DAN KEMUDIAN MENGINTEGRASIKAN GENERASI AI DAN PERHITUNGAN PROBABILITAS. SALAH SATUNYA ADALAH SEPENUHNYA YAKIN, YANG LAIN SANGAT REALISTIS - KAMI MENGGABUNGKAN DUA KONSEP UNTUK MENCAPAI PRESISI DAN KONTROL MELALUI DATA TERSTRUKTUR, SEMENTARA MEMPRODUKSI MEREKA SECARA REAL TIME. PADA AKHIRNYA, ISINYA INDAH DAN BENAR-BENAR DIKELOLA。

IDE TENTANG INFORMASI TERSTRUKTUR DAN INTEGRASI AI GENERASI AKAN DIULANG DALAM SATU INDUSTRI DEMI SATU。TERSTRUKTUR DATA ADALAH LANDASAN DARI AI KREDIBEL。

Mempercepat platform untuk terstruktur dan tidak terstruktur data

Sekarang saya ingin menunjukkan grafik teknis。

Data terstruktur - SQL yang akrab, Spark, Panda, Velox, dan platform penting seperti Snowflake, Dabricks, Amazon EMR, Azure Fabric, Google BigQuery, sedang memproses bingkai data (Data Frame). Frame data ini, yang seperti lembar kerja raksasa, membawa semua informasi dari dunia bisnis dan adalah fakta dasar perhitungan bisnis。

DI ERA AI, KITA PERLU MEMBUAT AI MENGGUNAKAN DATA TERSTRUKTUR DAN MEMPERCEPAT PENCAPAIAN MEREKA. DI MASA LALU, PERCEPATAN PEMROSESAN DATA TERSTRUKTUR DITUJUKAN UNTUK MEMBUAT PERUSAHAAN LEBIH EFISIEN。DI MASA DEPAN, AI AKAN MENGGUNAKAN STRUKTUR DATA INI PADA TINGKAT YANG JAUH LEBIH CEPAT DARIPADA MANUSIA, DAN AI FACIENTS AKAN MEMBUAT PANGGILAN YANG LUAS KE DATABASE TERSTRUKTUR。

DALAM HAL DATA YANG TIDAK TERSTRUKTUR, BASIS DATA VEKTOR, PDF, VIDEO, AUDIO, DLL MERUPAKAN MAYORITAS BESAR POLA DATA DI DUNIA - SEKITAR 90 PERSEN DARI DATA YANG DIHASILKAN SETIAP TAHUNNYA TIDAK TERSTRUKTUR. DI MASA LALU, DATA INI HAMPIR SEPENUHNYA TIDAK DAPAT DIGUNAKAN: KITA MEMBACANYA DAN MEMASUKKANNYA KE DALAM SISTEM BERKAS, ITU SAJA. KITA TIDAK DAPAT MENCARI ATAU MENCARI KARENA KURANGNYA INDEKS SEDERHANA DATA YANG TIDAK TERSTRUKTUR DAN KEBUTUHAN UNTUK MEMAHAMI MAKNA DAN KONTEKS MEREKA。SEKARANG, AI DAPAT MELAKUKAN HAL INI -- DENGAN TEKNIK SENSORIK MULTI- MODULAR DAN PEMAHAMAN, AL DAPAT MEMBACA DOKUMEN PDF, MENGERTI APA ARTINYA, DAN MEMASUKKANNYA KE DALAM STRUKTUR YANG LEBIH BESAR YANG DAPAT BERKONSULTASI。

Wida Young menciptakan dua fondasi untuk ini:

CuDF: Proses cepat dari frame data, data terstruktur

CUVS: Proses dari data AI untuk penyimpanan vektor, semantik dan data tidak terstruktur

Kedua platform ini akan menjadi salah satu platform dasar yang paling penting untuk masa depan。

Hari ini, kami mengumumkan kerjasama dengan sejumlah perusahaan. Penemu bahasa IBM- SQL akan menggunakan CuDF untuk mempercepat platform Data WatsonX nya. Dell bekerja dengan kami untuk membuat platform data Dell AI yang memadukan CuDF, Cuvs dan mencapai peningkatan kinerja yang signifikan dalam proyek Data NTT. Google Cloud, untuk bagiannya, sekarang mempercepat bukan hanya Vertex AI, tapi BigQuery, dan bekerja dengan Snapchat untuk mengurangi biaya yang dihitung hampir 80%。

Keuntungan perhitungan dipercepat tiga kali lipat: kecepatan, skala, biaya. Ini berlangsung bersama dengan logika Hukum Moore - untuk mencapai lompatan dalam kinerja dengan mempercepat perhitungan sementara terus mengoptimalkan algoritma sehingga setiap orang dapat menikmati biaya yang dihitung penurunan terus menerus。

Weeda membangun platform akselerator yang membawa bersama perpustakaan: RTX, cuDF, cuvs, dll。PUSTAKA INI DIINTEGRASIKAN KE DALAM LAYANAN AWAN GLOBAL DAN SISTEM OEM UNTUK MENCAPAI PENGGUNA GLOBAL。

Kolaborasi dalam-kedalaman dengan penyedia layanan awan

Kerjasama dengan penyedia layanan awan utama

Google Cloud:Kami mempercepat Vertex AI dan BigQuery, dan integrasi mendalam dengan JaX / XLA, saat melakukan kinerja yang sangat baik di PyTorch -- satu-satunya akselerator di dunia untuk menunjukkan warna pada PyTorch dan JAX / XLA. We introduced Google Cloud ecology to clients like Baseball 10, CrowdStrike, Puma, Saleforce。

AWS:Kami mempercepat EMR, SageMaker dan Bedrock, dengan integrasi mendalam dengan AWS. Tahun ini saya sangat senang bahwa kami akan memperkenalkan OpenAI ke AWS, yang secara signifikan akan meningkatkan pertumbuhan konsumsi komputasi awan AWS, dan membantu OpenAI memperluas penyebaran daerah dan skalanya。

Microsoft:100 PFLOPS adalah superkomputer pertama yang kami bangun, dan superkomputer yang pertama yang dikerahkan pada Azure, yang menyediakan dasar penting untuk bekerja dengan OpenAI. Kami mempercepat Layanan Awan Azure dan Yayasan AI, bekerja sama untuk memajukan ekspansi area Azure dan bekerja dalam pencarian Bing。

Perlu disebutkan bahwa kemampuan "Konfidentik Komputer" kita, yang menjamin bahwa bahkan operator tidak memiliki akses ke data dan model pengguna, adalah GPU pertama di dunia untuk mendukung perhitungan rahasia, mendukung penyebaran aman OpenAI dan model anthropic di lingkungan awan di seluruh dunia. Dalam kasus Synopsys, kami mempercepat semua EDA dan CAD mengalir dan menyebarkannya ke Microsoft Azure。

Oracle:Kami klien pertama Oracle Al, dan aku bangga bisa menjelaskan pada Oracle untuk pertama kalinya konsep awan AI. Sejak itu, mereka tumbuh pesat, dan kami telah memperkenalkan banyak mitra, seperti Cohere, Kembang Api dan OpenAI。

CoreWeave:AWAN ASLI AI PERTAMA DI DUNIA, DICIPTAKAN UNTUK MELAYANI HOST GPU DAN AWAN AI, MEMILIKI BASIS KLIEN YANG SANGAT BAIK DAN BERKEMBANG PESAT。

Palantir + Dell:Platform AI baru berdasarkan Platform Ontologi Palantir dan platform AI telah dibuat bersama-sama untuk menyebarkan AI terlokalisasi sepenuhnya - dari pemrosesan data (ke kuantitatif atau struktur) hingga ruang akselerator skala penuh di negara manapun, dalam isolasi vakum。

Weida muda telah membangun kemitraan khusus ini dengan penyedia layanan awan global - ekosistem yang menang yang membawa klien kita ke awan。

Integrasi vertikal, keterbukaan horisontal: strategi inti Weeda

Weeda adalah yang pertama secara global terintegrasi secara vertikal, perusahaan terbuka horisontal。

Kebutuhan untuk model ini sangat sederhana: percepatan komputasi bukanlah masalah chip, juga bukan masalah sistemik, dan formulasi penuh harus dipercepat aplikasi。CPU DAPAT MEMBUAT KOMPUTER BERJALAN LEBIH CEPAT, TAPI JALAN TELAH MENCAPAI TUTUP BOTOL. DI MASA DEPAN, HANYA MELALUI APLIKASI ATAU SECTOR- SPESIFIK PERCEPATAN BAHWA KINERJA MELOMPAT DAN BIAYA DAPAT BERKELANJUTAN。

Itulah sebabnya Weidar harus menumbuhkan satu bank demi satu, satu wilayah demi satu, satu industri vertikal demi satu. Kami adalah perusahaan komputasi terpadu vertikal, dan tidak ada cara lain. Kita harus memahami aplikasi, mengerti daerah, memahami algoritma secara mendalam dan dapat menyebarkan mereka dalam skenario - pusat data, awan, lokal, marjinal dan bahkan sistem robotik。

Pada saat yang sama, Ying Weidar tetap terbuka mendatar dan bersedia mengintegrasikan teknologi ke platform setiap mitra sehingga dunia dapat menikmati keuntungan dipercepat。

INI SEPENUHNYA TERCERMIN PADA STRUKTUR PESERTA GTC SAAT INI. SEKTOR JASA KEUANGAN MEMILIKI PROPORSI TERTINGGI DARI PESERTA - MUDAH-MUDAHAN PENGEMBANG, BUKAN PEDAGANG. EKOSISTEM KAMI MENUTUPI BAIK HULU DAN HILIR RANTAI PASOKAN. TAHUN LALU ADALAH TAHUN TERBAIK DALAM SEJARAH BISNIS 50 TAHUN, 70 TAHUN DAN 150 TAHUN. KITA BERADA DI AWAL SESUATU YANG SANGAT, SANGAT PENTING。

CUDA- X: MEMPERCEPAT MESIN DALAM INDUSTRI

Di semua daerah vertikal, Yin Weidar memiliki tata letak yang mendalam:

Autopilot:Cakupannya luas dan jauh

Layanan keuangan:Investasi kuantitatif bergerak dari rekayasa karakteristik buatan ke superkomputer-didorong pembelajaran mendalam, mengarah ke "Transformer Time" nya

Kesehatan medis:Itu sendiri "ChatGPT Time", meliputi arah penemuan obat bantu AI, diagnosis dukungan intelijen AI, layanan klien medis, dll

Industri:GELOMBANG KONSTRUKSI TERBESAR DI DUNIA SEDANG BERLANGSUNG

Hiburan dan permainan:PLATFORM AI MENDUKUNG TERJEMAHAN, SIARAN LANGSUNG, INTERAKSI PERMAINAN, DAN AGEN BELANJA PINTAR

Robot:Selama lebih dari satu dekade, tiga struktur komputer utama telah berada di tempat

Telekomunikasi:Pada industri berukuran sekitar $2 triliun, stasiun dasar akan berkembang dari fungsi komunikasi tunggal ke platform infrastruktur AI yang disebut Aerial, yang bekerja dalam kedalaman dengan bisnis seperti Nokia dan T- Mobile

DI JANTUNG SEMUA DAERAH INI ADALAH PERPUSTAKAAN CUDA-X KAMI - YANG MERUPAKAN INTI DARI IN WEIDA SEBAGAI PERUSAHAAN ALGORITMA. BANK-BANK INI ADALAH ASET INTI PERUSAHAAN, MEMUNGKINKAN PLATFORM UNTUK MEMBERIKAN NILAI NYATA DI SELURUH INDUSTRI。

Salah satu yang paling penting dari ini adalah CUDNN, yang benar-benar inovasi kecerdasan buatan dan memicu Big Bang AI modern。

(MEMUTAR VIDEO PRESENTASI CUDA-X)

SEGALA SESUATU YANG BARU SAJA ANDA LIHAT ADALAH SIMULASI -- PEMECAH BERDASARKAN PRINSIP FISIK, MODEL FISIKA PROXY AI, DAN MODEL ROBOT BUATAN. SEMUANYA SIMULASI DAN TIDAK ADA ANIMASI MANUAL ATAU MENGIKAT SENDI. INI ADALAH INTI DARI KEKUATAN INGWEIDA:Kesempatan ini dibuka melalui pemahaman yang mendalam algoritma dan kombinasi organik platform komputasi。

AI NATIVE ENTERPRISES AND THE NEW CALCULATOR AGE

Anda baru saja melihat Wal-Mart, Al- Lea, Morgan Chase, Ross, Toyota dan sebagainya, yang mendefinisikan masyarakat saat ini sebagai raksasa industri, dan ada sejumlah besar perusahaan yang belum pernah Anda dengar -- apa yang kita sebut AI original. Daftar ini sangat besar, termasuk OpenAI, Anthropic dan sejumlah besar perusahaan yang muncul bekerja di daerah vertikal yang berbeda。

Selama dua tahun terakhir, industri telah mengalami penerbangan mengkhawatirkan. Investasi Venture mengalir ke start- up mencapai $150 miliar, terbesar dalam sejarah manusia. Yang lebih penting, untuk pertama kalinya, investasi tunggal melonjak dari jutaan dolar ke ratusan juta atau bahkan miliaran dolar。

Hanya ada satu alasan:Untuk pertama kalinya dalam sejarah, setiap perusahaan tersebut akan memerlukan sumber daya komputasi yang cukup besar dan sejumlah besar token. Industri ini menciptakan, menghasilkan, atau menambah nilai pada token dari institusi seperti Anthropic dan OpenAI。

SAMA SEPERTI REVOLUSI PC, REVOLUSI INTERNET, DAN REVOLUSI AWAN BERGERAK TELAH MENCIPTAKAN SEJUMLAH BISNIS YANG BERKEMBANG, GENERASI PLATFORM PERUBAHAN INI JUGA AKAN MENGHASILKAN KELOMPOK YANG SANGAT BERPENGARUH PERUSAHAAN YANG AKAN MENJADI KEKUATAN PENTING DI MASA DEPAN。

Tiga terobosan bersejarah dalam semua ini

Apa yang terjadi dalam dua tahun terakhir? Tiga hal besar。

Pertama: ChatGPT, era AI generasi peluncuran (2022-end-2023)

TIDAK HANYA DAPAT DIRASAKAN DAN DIPAHAMI, JUGA DAPAT MENGHASILKAN KONTEN UNIK. SAYA MENUNJUKKAN INTEGRASI AI YANG DIHASILKAN DENGAN GRAFIS KOMPUTER. MENGHASILKAN AI SECARA FUNDAMENTAL MENGUBAH CARA PERHITUNGAN DIHITUNG - DARI PENCARIAN KE GENERASI, YANG SANGAT MEMPENGARUHI ARSITEKTUR KOMPUTER, PENYEBARAN DAN KESELURUHAN SIGNIFIKANSI。

Kedua: penalaran AI, diwakili oleh o1

Kemampuan untuk alasan memungkinkan AI untuk merefleksikan diri, rencana, decompose isu - masalah pembusukan bahwa ia tidak dapat memahami langsung ke langkah-langkah dikelola. O1 membuat AI kredibel dan dapat alasan berdasarkan informasi nyata. Untuk alasan ini, jumlah token dimasukkan ke dalam konteks dan keluaran yang digunakan untuk pikiran telah meningkat secara signifikan, dan jumlah token dihitung telah meningkat secara signifikan。

Nomor tiga: Claude Kode, model cerdas pertama

Ini membaca dokumen, menyiapkan kode, compiles, tes, evaluasi dan iteratif. Claude Code telah benar-benar berlebihan proyek perangkat lunak - 100% dari insinyur di Inggris menggunakan satu atau lebih dari Claude Code, Codex dan Cursor, dan tidak satupun dari insinyur perangkat lunak menggunakan AI。

INI ADALAH TITIK BALIK YANG BARU -- ANDA TIDAK MEMINTA AI APA ITU, DI MANA, BAGAIMANA HAL ITU DILAKUKAN, TAPI APA YANG DIBUATNYA, MENGIMPLEMENTASIKAN, MEMBANGUN, MENGGUNAKAN ALAT, MEMBACA DOKUMEN, MEMECAHKAN MASALAH DAN MEMASUKKANNYA KE DALAM TINDAKAN. AI, DARI PERSEPSI, GENERASI, SAMPAI ALASAN, UNTUK BENAR-BENAR MAMPU MELAKUKANNYA SEKARANG。

Selama dua tahun terakhir, jumlah perhitungan yang diperlukan untuk penalaran telah meningkat sekitar 10.000 kali, dan penggunaannya meningkat sekitar 100 kali. Saya selalu berpikir bahwa jumlah permintaan telah meningkat sejuta kali dalam dua tahun terakhir -- itulah yang semua orang rasakan, itulah yang OpenAI rasakan, itulah yang Anthropic rasakan. Jika Anda mendapatkan lebih banyak kredit, Anda mendapatkan lebih banyak token, Anda mendapatkan lebih banyak pendapatan, dan AI akan lebih cerdas. Titik penalaran telah tiba。

TRILYUNAN DOLAR

Tahun lalu pada saat ini, saya katakan di sini bahwa kita memiliki tingkat kepercayaan yang tinggi di Blackwell dan kebutuhan Rubin dan membeli pesanan sebelum 2026, sekitar $500 miliar。

HARI INI, SETAHUN SETELAH GTC, SAYA BERDIRI DI SINI DAN MEMBERITAHU ANDAMelihat ke depan sampai 2027, saya melihat setidaknya $1 triliun. Dan saya yakin bahwa kebutuhan komputasi yang sebenarnya akan lebih dari itu。

Tahun Weida Inggris alasan

2025 adalah tahun inferensi. Kami ingin memastikan, selain pelatihan dan post-, keunggulan dapat dipertahankan pada setiap tahap siklus kehidupan AI, memungkinkan infrastruktur diinvestasikan untuk berfungsi secara efisien dan terus menerus, dan biaya unit tersebut berkurang semakin lama。

Pada saat yang sama, Anthropic dan Meta secara resmi bergabung dengan platform NVIDIA, yang bersama-sama mewakili sepertiga dari kebutuhan komputasi AI global. Model open source berada di tingkat depan dan ada di mana-mana。

WEIDA MUDA SAAT INI SATU-SATUNYA PLATFORM DI DUNIA YANG DAPAT MENGOPERASIKAN SEMUA DOMAIN AI - BAHASA, BIOLOGI, GRAFIK KOMPUTER, VISI KOMPUTER, SUARA, PROTEIN DAN KIMIA, ROBOTIKA, DLL - SEMUA MODEL AI, TIDAK PEDULI TEPI ATAU AWAN, TIDAK PEDULI BAHASA. KESAMAAN DARI SEMUA SKENARIO INI DENGAN ARSITEKTUR INGGRIS WEIDA MEMBUAT KITA PLATFORM PALING MAHAL DAN PALING TERPERCAYA。

Saat ini, 60 persen dari bisnis di Ingweida berasal dari lima penyedia layanan awan top-besar di dunia, dengan sisa 40 persen di bidang awan regional, awan berdaulat, perusahaan, industri, robotik, ujung komputasi, dllAKU TIDAK TAHU. LEBAR CAKUPAN AI ITU SENDIRI KETAHANAN - ITU JELAS SEBUAH PLATFORM BARU PERUBAHAN。

Grace Blackwell dan NVLink 72: inovasi struktur yang berani

Pada puncak arsitektur Hopper, kami memutuskan untuk benar-benar mengatur ulang sistem, memperluas NVLink dari 8 sampai NVLink 72, dan membongkar sepenuhnya sistem komputasi. Grace Blackwell NVLink 72 adalah taruhan teknis besar, yang tidak mudah untuk semua mitra, dan kami ingin mengungkapkan rasa terima kasih kami yang tulus untuk semua。

PADA SAAT YANG SAMA, KAMI TELAH MEMPERKENALKAN NVFP4 -- BUKAN HANYA FP4 BIASA TETAPI BRAND - JENIS BARU DARI INTI KETEGANGAN DAN UNIT KOMPUTASI. KAMI TELAH MENUNJUKKAN BAHWA NVFP4 DAPAT MENCAPAI PENALARAN TANPA KEHILANGAN PRESISI, DENGAN KINERJA YANG BESAR DAN PENINGKATAN EFISIENSI ENERGI, DAN SAMA-SAMA UNTUK PELATIHAN。

Selain itu, serangkaian algoritma baru, dinamo dan TensorRT-LLM, telah muncul, dan kami bahkan telah mendedikasikan miliaran dolar untuk optimasi inti untuk membangun superkomputer bernama DGX Cloud。

Alasan kami terbukti luar biasa. Data dari Semi Analysis - yang paling komprehensif AI penalaran penilaian kinerja sampai saat ini - menunjukkan bahwa YVD adalah di depan baik dimensi per watt token dan biaya per token. Hukum Morse asli bisa membawa H200 1.5 kali lebih tinggi kinerja, tapi kami melakukan 35 kali. Dylan Patel dari Semi Analisis bahkan mengatakan:"Hwang In- hoon konservatif, sebenarnya 50 kali. Dia benar。

Dan kami mengutipnya: "Jensen Sandbagged

Biaya setiap token di Inggris adalah terendah di dunia dan tidak ada yang saat ini memiliki akses. Ini disebabkan oleh desain sinergis yang luar biasa。

Dalam kasus Fireworks, rata-rata kecepatan token adalah sekitar 700 per detik sebelum perangkat lunak dan algoritma diperbarui dalam Weaverda; pembaruan hampir 5.000 per detik, meningkat sekitar tujuh kali. Dan itulah kekuatan desain yang sangat sinergis。

Tanaman AI: Dari Pusat Data ke Tumbuhan Token

Pusat data digunakan untuk menjadi repositori berkas, dan sekarang itu adalah pabrik yang menghasilkan token. Setiap penyedia layanan awan, setiap perusahaan AI, akan menggunakan "efisiensi tanaman yang tajam" sebagai indikator kinerja inti di masa depan。

Ini adalah argumen inti saya:

Sumbu Vertikal:Sepanjang put - jumlah token per detik pada daya tetap

Poros Cross-:Kecepatan Interaktif (Kecepatan Token) - Semakin cepat penalaran merespon, semakin besar model yang tersedia, semakin lama konteksnya, semakin pintar AI

token adalah komoditas massal baru yang, sekali matang, bernilai lapisan:

:: lantai bebas(Tinggi, kecepatan rendah)

:: tingkat intermediate(~ $3 per juta)

Tingkat Lanjutan(~ $6 per juta)

:: lapis kecepatan tinggi(~ $45 per juta token)

undo-type(~ $150 per juta token)

Dibandingkan dengan Hope, Grace Blackwell telah meningkat 35 kali dalam nilai tertinggi dan memperkenalkan lapisan baru. Dalam model yang disederhanakan, 25% kekuatan dialokasikan ke empat tingkat, Grace Blackwell menghasilkan lima kali lebih banyak pendapatan daripada Hope。

Sistem komputasi generasi AI berikutnya

(Mainkan video pengantar Vera Rubin)

Vera Rubin adalah sistem teroptimasi akhir yang lengkap yang dirancang khusus untuk pekerjaan berat:

Inti Komputer dari model bahasa besar:NVLink 72 GPU cluster, pemrosesan prefill dan KV Cache

New, Vera CPU:DIRANCANG KHUSUS UNTUK PENAMPILAN TUNGGAL YANG SANGAT TINGGI, MENGGUNAKAN MEMORI LPDDR5, DENGAN EFISIENSI ENERGI YANG SANGAT BAIK, ADALAH SATU-SATUNYA PUSAT DATA DI DUNIA MENGGUNAKAN CPU LPDR5 COCOK UNTUK ALAT PINTAR AI

Sistem penyimpanan:Bluefield 4 + CX 9, platform penyimpanan yang benar-benar baru untuk era AI, industri penyimpanan global 100% Tambahkan ke CPO Spectrum X Switch: download global dari switch optik Ethernet, sepenuhnya diproduksi

& nbsp; KyberSebuah sistem rak baru yang mendukung 144 GPU menjadi satu domain NVLink, komputer di depan, latar belakang NVLink untuk membentuk komputer raksasa

Rubin Ultra:Hypernode generasi berikutnya, dirancang vertikal untuk mencocokkan rak Kyber untuk mendukung sambungan skala besar NVLink

Vera Rubin telah menjadi pendinginan cair 100 persen, berkurang dari dua hari ke dua jam instalasi, memperkenalkan pendingin air panas 45 ° C, dan secara signifikan mengurangi tekanan pendinginan di pusat data. Kali ini Satya (Nadra) telah mengirim surat yang mengkonfirmasi bahwa hanggar Vera Rubin yang pertama adalah on line dengan Microsoft Azure, dan saya sangat didorong oleh hal ini。

Groq Integrasi: Extreme ekstensi dari penalaran kinerja

Kami memperoleh tim Groq dan memperoleh otorisasi teknis. Groq adalah prosesor data stream definitif (Processor Datuflow Determinististic), yang digunakan menggunakan komilers statis dan kompiler, dengan sejumlah besar SRAM didedikasikan untuk optimasi satu beban untuk penalaran, dengan sangat rendah penundaan dan kecepatan produksi yang sangat tinggi。

Namun, kapasitas memori terbatas Groq (SRAM pada film 500MB) membuat sulit untuk membawa parameter dari model besar dan KV Cache secara independen, membatasi aplikasi skala besar。

Solusinya adalah dinamo, sumber perangkat lunak penjadwalan beralasan. Dengan Dynamo, kita mengumpulkan garis penalaran

Decode dari Prefill and Attention:Selesai dengan Vera Rubin (butuh banyak penyimpanan komputer dan penyimpanan KV Cache)

Feed- Forward Decode Jaringan:i. misalnya komponen generasi token, selesai pada Groq (lebar lebar lebar dan lambat rendah dibutuhkan)

Dengan menghubungkan erat dua dengan Ethernets, penundaan akan berkurang sekitar setengah oleh model khusus. Di bawah penyebaran dinamo, "Sistem operasi pabrik AI", keseluruhan kinerja meningkat 35 kali dan menciptakan tingkat benar-benar baru penalaran bahwa NVLink 72 tidak bisa mencapai sebelumnya。

Groq dan Vera Rubin menyarankan:

Gunakan 100% Vera Rubin untuk token nilai tinggi jika muatan tugas didominasi oleh overput tinggi

Groq bisa diperkenalkan, dengan tingkat yang disarankan sekitar 25% Groq + 75% Vera Rubin Groq LP30, bekerja pada tiga bintang, sekarang dalam produksi dan Q3 diharapkan untuk memulai pengiriman. Terima kasih Samsung atas kerja samanya。

Sebuah lompatan bersejarah dalam alasan

Kuantifikasi kemajuan teknologi sebelumnya: dalam periode 2 tahun, tingkat produksi token pada 1 Giva Al pabrik akan meningkat dari 22 juta token / s menjadi 700 juta token / s, naik 350 kali. Dan itulah kekuatan desain yang sangat sinergis。

Peta jalan teknologi

Blackwell:Saat ini dalam produksi, sistem rak standar Oberon, ekstensi kabel tembaga ke NVLink 72, ekstensi opsional optik ke NVLink 576

Vera Rubin (saat ini):Kyber Hanger, NVLink 144 (Cronic Cable); Oberon hanger, NVLink 72 + Optical, diperpanjang ke NVLink 576; Spectrum 6, pertukaran CPO pertama global

Vera Rubin Ultra (segera datang):Sebuah generasi baru dari Rubin Ultra GPU, chip LP35 (integrasi pertama NVFP4), perkalian lebih lanjut

Feynman (generasi berikutnya):GPU baru, chip LP40 (dikembangkan bersama-sama oleh tim Inggris dan Groq, terintegrasi NVFP4); CPU-Rosa baru (Rosalyn); Bluefield 5; CX 10; dan Kyber rak mendukung kabel tembaga dan ekspansi CPO

Peta jalan jelas:Tiga rute ekstensi kabel tembaga, ekstensi optik (Scale-Up) dan ekstensi optik (Scale-Out) maju secara paralel, dan kita membutuhkan ekspansi berkelanjutan produksi oleh semua mitra dalam hal kabel tembaga, serat optik dan CPO。

DSX NVIDIA: SEBUAH PLATFORM KEMBAR DIGITAL DI PABRIK

AI MENJADI SEMAKIN KOMPLEKS, TETAPI BERBAGAI PEMASOK TEKNOLOGI YANG MEMBUAT ITU TIDAK PERNAH BEKERJA SATU SAMA LAIN DALAM FASE DESAIN SAMPAI MEREKA BERTEMU DI PUSAT DATA - JELAS TIDAK CUKUP。

Untuk itu, kami menciptakan Omniverse, dan berdasarkan itu, platform DSX NVIDIA, platform bagi semua mitra untuk merancang dan mengoperasikan tanaman AI Kelas Giva- di dunia maya。DSX MENYEDIAKAN:

:: mesin on-board, termal, listrik dan sistem simulasi jaringan

:: Menghubungkan ke grid untuk mencapai energi sinergis-menyelamatkan gerakan

:: Konsumsi energi dinamis dan optimasi pendinginan berdasarkan Max- Q dalam pusat data

Diperkirakan secara konservatif bahwa sistem dapat meningkatkan efisiensi energi dua kali lipat, yang merupakan keuntungan yang sangat signifikan pada skala yang kita bicarakan. Omniverse, dimulai dengan Bumi digital, akan membawa kembar digital dari semua ukuran, dan kami bekerja dengan mitra global untuk membangun komputer terbesar dalam sejarah manusia。

Selain itu, Inggris berbaris ke ruang angkasa. Thor chip telah disertifikasi untuk radiasi dan sedang dioperasikan pada satelit. Kami bekerja sama untuk mengembangkan Vera Rubin Space-1 untuk pusat data luar angkasa. Panas panas termal adalah inti tantangan di ruang angkasa, di mana kita mengumpulkan insinyur top untuk menyerang。

OpenClaw: Sistem operasi usia tubuh cerdas

Peter Steinberger mengembangkan perangkat lunak bernama OpenClaw. Ini adalah proyek open-source yang paling populer dalam sejarah manusia, melampaui prestasi Linux selama 30 tahun hanya dalam beberapa minggu。

OpenClaw pada dasarnya merupakan sistem intelijen yang mampu:

:: Manajemen sumber daya, akses ke alat, sistem dokumentasi dan model bahasa besar

:: Implikasi dari penjadwalan dan waktu tugas

Secara bertahap menguraikan masalah dan memanggil sub- intelijen

Dukungan untuk semua jenis masukan atau keluaran (suara, video, teks, surat, dll)

Ini benar-benar sistem operasi - sistem operasi untuk komputer tubuh cerdas. Windows membuat komputer pribadi mungkin, OpenClaw membuat intelijen pribadi mungkin。

Setiap perusahaan membutuhkan strategi OpenClaw sendiri, sama seperti kita membutuhkan Linux, HTML, Kubernetes。

ENTERPRISE IT COMPREHENSIVE RESHAPING

IT:DATA DAN DOKUMEN MEMASUKI SISTEM, MELEWATI ALAT DAN ALIRAN KERJA DAN AKHIRNYA MENJADI ALAT UNTUK PENGGUNAAN MANUSIA. PERUSAHAAN PERANGKAT LUNAK MENCIPTAKAN ALAT, SISTEM INTEGRATOR (GSI) DAN PERUSAHAAN KONSULTASI MEMBANTU BISNIS UNTUK MENGGUNAKANNYA。

IT:Setiap perusahaan SaaS akan berubah menjadi Aaas (Agentik sebagai Layanan, Cerdas sebagai Layanan) - tidak hanya untuk menyediakan alat, tetapi untuk menyediakan AI badan cerdas khusus di daerah tertentu。

Tapi inilah tantangan utama:Intra- perusahaan intelijen memiliki akses ke data sensitif, kode penegakan, dan komunikasi eksternal. Ini harus ketat diatur dalam lingkungan bisnis。

Untuk itu, kami bekerja dengan Peter untuk mengintegrasikan keselamatan ke dalam versi interprise-, yang diluncurkan:

Cakar NeMo (desain referensi):OpenClaw- berbasis kerangka acuan tingkat kerja untuk sebuah set terpadu NVIDIA cerdas AI toolkit

Buka Perisai (tingkat keamanan):Terpadu ke OpenClaw, yang menyediakan mesin strategis, pagar jaringan, rute privasi untuk memastikan keamanan data perusahaan

Awan Nemo:Terunduh dan terhubung dengan mesin strategis dari semua perusahaan SaaS

INI ADALAH RENAISSANCE OF THE ENTERPRISE IT, INDUSTRI SENILAI 2 TRILIUN DOLAR YANG AKAN TUMBUH DALAM SKALA TRILIUNAN DOLAR, BERGERAK DARI MENYEDIAKAN ALAT-ALAT UNTUK MENYEDIAKAN LAYANAN TUBUH AI CERDAS KHUSUS。

Aku benar-benar bisa meramalkan:di masa depan, setiap insinyur di perusahaan akan memiliki anggaran token tahunan. mereka bisa dibayar ratusan ribu dolar per tahun, dan saya akan memberi mereka kuota token ekstra sama dengan setengah gaji, sehingga keluaran mereka akan 10 kali lebih besar. "berapa banyak tanda kuota yang melekat pada entri telah menjadi subjek perekrutan baru di silicon valley。

(Dan bagi tiap-tiap umat) golongan orang-orang yang beriman yang telah mendahului kalian (ada tanda-tanda) yang menunjukkan kepada keesaan Allah swt. (dan perumpamaan-perumpamaan) yaitu dijadikan-Nya sebagai perumpamaan. Kepentingan OpenClaw tidak bisa diremehkan. Ini sama pentingnya dengan HTML, Linux。

NVIDIA OPEN MODEL INITIATIVE

Dalam hal kecerdasan yang didefinisikan sendiri (Cakar Ubahan), kami telah menyediakan model garis depan dari penelitian NVIDIA:

Model Bidang Model Dunia Cosmos Nemtron Large Language Model Cosron

Kami berada di garis depan teknologi di setiap bidang, dan kami berkomitmen untuk terus iterasi - Nemtron 4, Cosmos 1, Cosmos 2, Groq, ke generasi kedua。

Nemotron 3 peringkat di antara tiga model terbaik global terbaik di OpenClaw dan berada di garis depan. Nemotron 3 Ultra akan menjadi model dasar terkuat yang pernah mendukung negara-negara dalam membangun AI berdaulat。

Hari ini, kami mengumumkan pembentukan Aliansi Nemtron untuk menginvestasikan miliaran dolar dalam pengembangan dasar model AI. Para anggotanya termasuk BlackForest Labs, Cursor, LangChain, Mistral, Perplekness, Reflection, Sarvam (India), Berpikir Mesin (Laboratorium Mira Murati)。

Satu perusahaan perangkat lunak perusahaan demi perusahaan lain telah menggabungkan desain referensi Cakar Nemo dan tubuh cerdas NVIDIA AI toolkit ke dalam produknya sendiri。

AI FISIKA DAN ROBOT

INTELEJEN DIGITAL BERGERAK DI DUNIA DIGITAL -- MENULIS KODE, MENGANALISIS DATA; DAN AI FISIKA ADALAH TUBUH KECERDASAN YANG DIBANGUN, SEBUAH ROBOT。

GTC INI MEMILIKI 110 ROBOT, MENCAKUP HAMPIR SEMUA PERUSAHAAN ROBOTIKA DAN PENGEMBANGAN DI SELURUH DUNIA. DI WEIDA MENYEDIAKAN TIGA KOMPUTER (KOMPUTER PELATIHAN, KOMPUTER SIMULASI, KOMPUTER ON-BOARD) DAN TUMPUKAN PERANGKAT LUNAK LENGKAP DAN MODEL AI。

Sehubungan dengan autopilot, pilot "ChatgPT Time" telah tiba. Hari ini, kami mengumumkan bahwa empat mitra baru akan bergabung dengan platform Siap RoboTaxi Inggris: Biadi, Modern, Jepang, Gili, untuk produksi tahunan total 18 juta. Ini, bersama dengan Mercedes sebelumnya, Toyota dan Jenderal, telah memperkuat formasi. Pada saat yang sama, kami mengumumkan kerjasama besar dengan Uber untuk menyebarkan dan mengakses RoboTaxi Siap kendaraan di beberapa kota。

Dalam hal robotika industri, banyak robotika seperti ABB, Universal Romanics, dan KUKA bekerja sama dengan kami untuk menggabungkan model AI fisik dengan sistem simulasi untuk mendorong robot untuk mendarat di jalur produksi global。

Dalam telekomunikasi, Caterpillar dan T-Mobile juga terdaftar. Di masa depan, basis stasiun nirkabel tidak akan lagi hanya sebuah titik komunikasi, melainkan sebuah Aerial AI RAN - sebuah platform perhitungan cerdas yang mampu nyata waktu mengirimkan aliran, menyesuaikan balok untuk membentuk, dan mencapai efisiensi efisiensi energi。

Link khusus: Olaf

(memutar Disney Olaf video demonstrasi robot)

Newton sedang bekerja

Aku sangat senang melihatmu。

Ya, karena aku memberimu komputer - jetson

Apa itu

Ada di perutmu。

Menakjubkan。

Kau belajar berjalan di Omniverse。

Aku suka berjalan. Itu lebih baik daripada naik rusa melihat langit yang indah。

Wong In- hoon: Ini justru karena simulasi fisika -- pemecah Newton berdasarkan NVIDIA Warp, yang kami kembangkan bersama dengan Disney dan Deepmind untuk beradaptasi dengan dunia fisik yang nyata。

Itu yang kumaksud。

Ini adalah di mana Anda cerdas. Aku manusia salju, bukan bola salju。

Bisa kau bayangkan? Masa depan Disneyland -- semua karakter robot berkeliaran bebas di taman. Tapi jujur, kupikir kau lebih tinggi. Aku belum pernah melihat manusia salju pendek seperti itu。

Olaf: (tanpa izin)

Wong In- hoon, akan Anda membantu saya menyelesaikan pidato saya hari ini

Bravo

Ringkasan alamat catatan kunci

Hari ini, kita berbagi tema inti berikut:

Kedatangan titik-titik penalaran:Alasan telah menjadi inti dari beban kerja AI. Token adalah massa barang baru. Fungsi penalaran langsung menentukan pendapatan

PABRIK AI USIA:Pusat data telah berevolusi dari fasilitas penyimpanan file ke pabrik produksi token, dan setiap perusahaan akan mengukur kompetisinya oleh "efisiensi tanaman AI" di masa depan

OpenClaw Smart Revolution:OpenClaw membuka usia komputasi cerdas, dan bisnis IT bergerak dari usia alat-alat ke usia Islam, dan setiap perusahaan perlu mengembangkan strategi OpenClaw

4 AI FISIK DAN ROBOTIKA:SMARTY SEDANG SCALED DOWN, DAN AUTOPILOT, ROBOT INDUSTRI, ROBOT MANUSIA BERSAMA-SAMA MERUPAKAN KESEMPATAN BESAR BERIKUTNYA UNTUK FISIKA

TERIMA KASIH, GTC. BERSENANG-SENANGLAH

Tautan Asli

Pidato penuh GTC: Permintaan pasar akan melebihi triliunan dolar pada tahun 2027; semua orang harus mengembangkan strategi OpenClaw