Token Budget War: Perusahaan AI memasuki "Akuntansi"

2026/05/29 02:38
👤ODAILY
🌐id

BIAYA AI, ROI DAN ALOKASI SUMBER DAYA DALAM PERUSAHAAN

Token Budget War: Perusahaan AI memasuki "Akuntansi"

Judul asli: Perang Anggaran Token

Foto oleh Jaya Gupta

Bahasa asli: Peggy

EDITOR MENEKAN: AI ENTERPRISE BERGERAK DARI FASE "PENGGUNAAN ATAU TIDAK" KE "BAGAIMANA MENGHITUNG"。

Selama dua tahun terakhir, banyak perusahaan telah mempromosikan penggunaan AI oleh karyawan, lebih untuk menjaga kecepatan dengan kecenderungan teknologi dan tekanan kompetitif. Tapi ketika AI beralasan biaya berubah dari anggaran eksperimental ke biaya operasi yang sedang berjalan, CEO dan CFO mulai mengajukan pertanyaan yang lebih realistis: berapa banyak nilai AI yang dibuat Al? Setiap harga token dolar, apa hasil sebenarnya

Ini adalah jantung Perang Anggaran Token. Jadi, yang disebut perang anggaran token bukan hanya upaya oleh perusahaan untuk menurunkan UUD, tapi latihan perempatan untuk menentukan mana yang layak mendapatkan kredit, yang tugas harus diganti dengan model yang lebih murah, proses yang dapat menggantikan outsourcing atau tenaga kerja, dan yang hanya konsumsi tidak efisien。

Artikel ini adalah yang paling perhatian bahwa penggunaan AI tidak sama dengan nilai. Pada era SaaS, penggunaan biasanya berarti bahwa perangkat lunak digunakan; namun, dalam era AI, konsumsi token hanya dapat mengindikasikan bahwa "counter berjalan". Aliran kerja yang sama dapat menyebabkan perbedaan biaya ganda karena perbedaan dalam petunjuk, konteks, pemilihan model dan jumlah tes ulang. Tagihan semakin tinggi, itu bisa Al benar-benar bekerja, atau sistem tidak bekerja。

Oleh karena itu, dalam tahap berikutnya dari AI Enterprise, kuncinya bukan hanya modelling kapasitas, tetapi apakah biaya token dan hasil bisnis dapat dicocokkan. Fase saya membuktikan bahwa AI dapat menyelesaikan pekerjaannya; fase II menanggapi bahwa itu tidak layak biaya。

Berikut adalah teks asli:

BISNIS AI TELAH BERUBAH DARI "PENGGUNAAN" MENJADI "DISTRIBUSI"。

Pada bagian atas perusahaan, mata uang baru adalah kemampuan Anda untuk mengukur AI kembali investasi. Setiap fungsi ditanya pertanyaan yang sama: Apa yang kau hasilkan? Berapa biayanya? Selama dua tahun terakhir, CEO telah terbangun di pagi hari untuk melihat Jim Cramer di CNBC sementara menonton pesaing mengumumkan keuntungan produktivitas dan meminta perusahaan untuk menggunakan AI. Sekarang apa yang benar-benar datang di bawah tekanan adalah pertanyaan berikut-up: membuktikan nilai。

Claude dibebaskan pada bulan November 2025, ketika anggaran tahunan kebanyakan bisnis untuk 2026 terkunci. Pada kuartal pertama, penggunaan aktual perusahaan telah pergi jauh melampaui apa yang telah direncanakan. Biaya beralasan tidak lagi hanya item anggaran untuk percobaan, tetapi biaya operasi terus. Lalu ada pertanyaan baru, di mana AI benar-benar menciptakan nilai

Pertanyaan ini sulit dijawab karena utilitas token tidak diukur. RUU tidak memberitahu Anda apakah pengeluaran ini diganti tenaga kerja, pendapatan yang dihasilkan, risiko berkurang, mempercepat proses, atau hanya sekelompok insinyur yang marah pada token (# metames). Ketika menghabiskan ratusan ribu dolar, masih terlihat seperti percobaan. Tapi di luar ambang batas tertentu, seperti mencapai tujuh digit, itu menjadi infrastruktur. Perbedaan teknis mulai berdampak pada pernyataan pendapatan: aliran kerja yang sama, kelompok masukan yang sama, dan biaya menjalankan dua token mungkin 5 sampai 10 kali berbeda, tanpa masalah yang jelas. Pada skala percobaan, volatilitas ini sudah cukup mahal, tetapi setelah memasuki skala infrastruktur, menjadi nomor bahwa CFO harus menjelaskan kepada CEO。

hal ini dapat disebut "utilitas token marjinal": nilai komersial dari setiap dolar biaya penalaran. ini adalah sosok yang benar-benar penting pada tahap skala dan saat ini tidak terlihat bagi kebanyakan perusahaan。

Pertanyaan di papan adalah dari "Ai tidak berguna" menjadi "Ai benar-benar memanfaatkan". Dan itulah mengapa perjuangan anggaran token pada dasarnya tentang distribusi token。

dan persaingan untuk kepemilikan token telah meningkat pesat karena telah mencapai naluri manajemen yang tinggi yang telah berlangsung selama 30 tahun: tim besar berarti pekerjaan besar, pekerjaan besar dan kekuatan yang lebih besar. di masa lalu, keberhasilan manajer senior ditandai dengan ukuran tim yang mereka kelola - jumlah bawahan, jumlah bawahan dan jumlah orang dalam struktur organisasi。

Tapi ketika kecerdasan menjadi sumber daya langka, tanda baru menjadi: berapa banyak kecerdasan yang dapat Anda menyebarkan。

BIAYA AI ADALAH PADA DASARNYA BERSAING DENGAN BIAYA TENAGA KERJA。

KEBANYAKAN APLIKASI ANGGARAN AI PADA DASARNYA ADALAH SALAH SATU DARI TIGA JENIS USULAN: MENGGANTI TENAGA KERJA OUTSOURCING, MENGGANTIKAN TENAGA KERJA INTERNAL, ATAU MENGHASILKAN PENDAPATAN BARU。

SEORANG KARYAWAN TELAH MEMBAYAR. SATU KONTRAK OUTSOURCING BPO MEMILIKI HARGA BERDASARKAN PERINTAH KERJA, PEMUKIMAN, FAKTUR ATAU AUDIT. MANUSIA BISA MEMAHAMI LANGKAH-LANGKAH INI. NAMUN, BIAYA PENALARAN LEBIH KOMPLEKS, KARENA BIAYA PENYELESAIAN AKHIR DARI SEBUAH MISI TERGANTUNG PADA BAGAIMANA SISTEM BEROPERASI SELAMA IMPLEMENTASI TERSEBUT. MISI MANAJEMEN KLAIM YANG MEMBUTUHKAN TIGA TES ULANG, PERBAIKAN MANUAL DAN MODEL MAJU MUNGKIN LEBIH MAHAL DARIPADA TENAGA KERJA OUTSOURCING YANG DIMAKSUDKAN UNTUK MENGGANTIKAN. ITULAH MENGAPA DISKUSI INI BERGERAK MAJU: BERAPA BIAYA UNTUK MENYELESAIKAN SEBUAH HASIL? SEBAGAI CONTOH, UNTUK SETIAP LEMBAR KERJA YANG DIPROSES, UNTUK SETIAP KLAIM YANG DIPROSES, UNTUK SETIAP KONTRAK YANG DIPERIKSA, UNTUK SETIAP FAKTUR SELESAI, UNTUK SETIAP POSTING TAMBAHAN DIHINDARI, UNTUK SETIAP PELANGGAN DITAHAN, ATAU UNTUK BIAYA YANG TERKAIT DENGAN SETIAP DOLLAR- BERBASIS KONVERSI PENDAPATAN。

Para eksekutif telah menyadari bahwa BPOs adalah tempat termudah untuk menetapkan benchmarks karena mereka sudah bernilai sesuai dengan 'selesai unit'. Sebaliknya, perbandingan antara staf internal dan AI jauh lebih sulit, ketika karyawan melakukan banyak pekerjaan setiap hari, termasuk sikat istirahat makan siang, TikTok; keuntungan produktivitas sering tercermin dalam menghindari perekrutan atau desentralisasi rilis kapasitas; dan manajer menolak mengurangi nomor tim hanya berdasarkan otomatisasi parsial saja. BPO menyediakan baseline yang dapat diukur untuk tim bisnis。

Ini berbeda dari logika SaaS. SaaS telah melatih perusahaan untuk menggunakan jumlah sebagai indikator proksi dari nilai。

Tapi AI memecahkan ini. Berapa banyak sumber daya penalaran yang dikonsumsi oleh aliran kerja yang sama dapat bervariasi secara signifikan dari petunjuk, konteks ke konteks, model yang dipilih, alat yang akan disebut, jumlah pengulangan, dan apakah angent terjebak. Unit pada tagihan - token - stabil, tetapi merupakan beban kerja yang tidak stabil。

lebih tepatnya: sinyal dan suara menggunakan unit yang sama dengan ukuran. token bill meningkat mungkin berarti bahwa pekerjaan yang sebenarnya sedang dilakukan, tetapi mereka juga berarti bahwa komputasi disia-siakan oleh petunjuk buruk, konteks yang tidak relevan, panggilan alat yang tidak perlu, penalaran berulang dan model yang terlalu kapasitas. tagihan token untuk kedua bisnis mungkin identik, tetapi bisnis di bagian bawah sangat berbeda: salah satunya menerjemahkan alasan ke hasil, sementara yang lain membeli tagihan untuk tidak efektif, keduanya tampak persis sama pada entri tagihan。

Penggunaan SaaS memberitahu Anda bahwa perangkat lunak telah digunakan. Penggunaan AI hanya memberitahu Anda bahwa meteran berjalan. Ini tidak memberitahu Anda jika perusahaan benar-benar berjalan。

mengapa tanda marjinal tembus pandang

Ada tiga poin utama。

Yang pertama adalah untuk mencoba lagi. Jika kemungkinan bahwa individu akan melakukan aliran yang benar untuk pertama kalinya adalah p, konsumsi token yang diharapkan per arus diselesaikan akan secara kasar meningkat oleh T / p, yang T adalah biaya dasar. Jika tingkat penyelesaian menurun dari 90% ke 70%, biaya efektif untuk memecahkan masalah meningkat sekitar 28%, bukan 20%, karena kegagalan memiliki efek senyawa. Dalam aliran bisnis, masukan cenderung membingungkan dan anomali juga penting. Kegagalan tidak hanya mengurangi tingkat akurasi, tetapi juga mengubah rekening ekonomi。

Yang kedua adalah ekspansi konteks. Untuk operasi yang bergantung pada mekanisme perhatian, biaya penalaran meningkat lebih atau kurang oleh O (n2) dengan panjang konteks. Akibatnya, panjang konteksnya dua kali lipat dan biaya penalaran kira-kira empat kali lipat. Semua orang ingin model tersebut memiliki informasi yang cukup, jadi sistem ini cenderung kelebihan pasokan: lima dokumen asli sudah cukup dan 50 sudah diambil; konektor langsung ke seluruh baris surat; dan marah terus berlanjut dengan sejarah dialog yang usang。

Ketiga adalah rutenya. Dan ketika tim tidak tahu model mana yang cukup baik, default menggunakan model terkuat. Tugas klasifikasi dasar dapat berjalan pada model yang sama yang awalnya digunakan untuk penalaran kompleks. Ketika jumlah panggilan mencapai jutaan, pertanyaan tentang apakah tugas-tugas sederhana diberikan kepada model-model kecil atau apakah semua tugas diberikan untuk model-model maju sering perbedaan antara tagihan-tagihan yang dikelola dan masalah tingkat papan。

INDUSTRI PERANGKAT LUNAK NON-AKAN MERASA SAKIT INI DALAM BENTUK "TRANSFORMASI". PERUSAHAAN PERANGKAT LUNAK ADALAH YANG PERTAMA MELIHAT MASALAH INI, KARENA PEKERJAAN YANG TELAH DIOPTIMALKAN TELAH SEPENUHNYA DIINSTRUKSIKAN. TIM TEKNIK MEMILIKI INDIKATOR SEPERTI PR, PENYERAHAN, PENYEBARAN, KECELAKAAN, WAKTU SIKLUS, WAKTU PEMULIHAN RATA-RATA, DAN INDIKATOR INI TERKAIT DENGAN PRODUK. MESKIPUN TIDAK SEMPURNA, PEKERJAAN SEPERTI ITU LEBIH MUDAH DIUKUR。

Perusahaan perangkat lunak tidak akan merasa masalah lebih dalam karena pekerjaan mereka operasional. Sebagai contoh, klaim penyelesaian, cakupan asuransi, perintah layanan penumpang, ulasan kepatuhan, persediaan rantai anomali, perselisihan pembayaran. Atau, perusahaan dengan aset dunia nyata akan menghadapi masalah yang sama. Di masa lalu, aliran-aliran ini sering diukur dalam hal tenaga kerja, berkala, tingkat prestasi dan kesalahan SLA, dan seringkali lebih menuntut dan diperlukan untuk dipertahankan dalam audit, bukan hanya dalam artian rata-rata. Unit kerja dan biaya tidak berbicara bahasa yang sama dan tidak dalam organisasi yang sama. Tim teknis dapat melihat konsumsi token dan sektor bisnis dapat melihat perubahan dalam aliran kerja, tetapi untuk menghubungkan dua, beberapa tim diperlukan untuk setuju pertama pada apa yang harus diukur。

Saya pikir perusahaan perangkat lunak akan mengalami kompetisi token anggaran sebagai masalah pengukuran produktivitas, yang sesuai dengan banyak "PHK AI" yang telah terjadi sebelumnya; bukan perusahaan perangkat lunak akan mengalaminya sebagai masalah transisi。

Lapisan yang hilang adalah hiasan dari token ke hasil. Sebuah perusahaan membutuhkan lapisan transformasi menghubungkan pengeluaran penalaran untuk pekerjaan yang dilakukan dan hasil bisnis dihasilkan. Lapisan ini harus menjawab tiga pertanyaan: berapa biaya sebenarnya dari aliran ini, termasuk pengujian ulang dan pengadaan itu? Bagian mana dari lintasan eksekusi yang benar-benar penting dan yang hanya efektif? Apakah pekerjaan ini mengubah model bisnis - misalnya, untuk setiap layanan penumpang untuk menangani perintah kerja yang lebih sedikit, siklus resolusi yang lebih pendek, anggaran BPO yang lebih kecil, perekrutan tertunda? Tingkat berikutnya adalah sifat dari hasil dalam bahasa bisnis. Alih-alih hanya mengatakan, "Ini biaya pekerjaan $2.13", katanya, "Ini jenis penyelesaian lebih murah untuk angent untuk proses daripada BPO, tetapi jika kebijakan membutuhkan dokumen ekstra tidak biasa, itu menghancurkan ekonomi dengan mencoba lagi。

Pengukuran menjadi memori. Untuk menghubungkan token ke satu hasil, perusahaan harus menangkap apa yang terjadi di tengah: apa yang angen melihat, apa yang diambil, apa alat yang digunakan, apa yang dia abaikan, di mana ia mencoba lagi, ketika ia secara manual tertutup, yang aturan diterapkan, yang preseden bekerja, dan mengapa satu jalan bekerja dan lain gagal. Lapisan pengukuran harus mencatat lintasan keputusan-membuat, yang persis apa perusahaan belum pernah benar-benar telah di masa lalu. Sistem rekaman bisa menangkap apa yang terjadi, tapi jarang mengapa. CRM, misalnya, dapat memberitahu Anda bahwa transaksi telah ditunda, tetapi tidak dapat memberitahu Anda penilaian yang tidak tertulis di belakang perkiraan penjualan。

Alasan untuk memutuskan adalah salah satu yang paling korup dan menghilang aset di perusahaan, karena ada dalam benang Slack, rantai surat, peningkatan pertemuan dan pikiran manusia. Tapi masalahnya adalah orang-orang pergi dan proses berubah。

AI mengubah ini karena angent akan menciptakan lintasan. Setiap pencarian, panggilan alat, uji ulang, upgrade, koreksi manual dan keputusan akhir - membuat adalah bagian dari path dari konteks ke aksi sampai hasil. Awalnya, perusahaan akan menangkap jejak untuk membenarkan pengeluaran. Tapi begitu trek ini ditangkap, mereka lebih berharga daripada biaya pelaporan itu sendiri, karena mereka menjadi catatan permanen bagaimana organisasi benar-benar membuat keputusan. (Batuk, CONTEXT GRAPH) Meskipun aku sudah mendengar kata itu akhir-akhir ini

tingkat distribusi adalah hadiah nyata. jika alasan menjadi sumber daya murah dalam model operasi klien, setiap dolar harus membuktikan dirinya layak dibelanjakan. yang pemasok dapat menjelaskan ketika token dikonversi, ketika tidak, dan mengapa

Bisnis tidak mengetahuinya. Mereka akan membelinya sebagai transformasi. Perusahaan Fortune 500 telah melakukan ini berulang kali sebelumnya: kencangkan sabuk pengaman mereka, menyewa McKenzie, membawa setiap mantan karyawan Palantir di pasar dan kemudian drive perubahan dari atas ke bawah oleh CEO. Token 's atclacement to the results will come in the same way as ERP, BI and digital transformation: as a "project" with executive supportion, the bottom- up set of infrastruktur akhirnya akan menjadi sumber fakta baru. Para pendiri yang mampu melakukannya akan membentuk berbagai jenis tim pendiri dan akan sendiri akan berbeda dari prototipe tradisional pengusaha。

Siapapun yang tahu apa yang akan dilakukan token, dia dapat membuat keputusan distribusi: pekerjaan mana yang layak mendapat kredit lebih, yang seharusnya terbatas, yang harus beralih ke model yang lebih murah, yang harus terus dilakukan oleh orang-orang dan yang dapat menggantikan BPO. Dan setelah Anda membuat keputusan-keputusan ini, Anda mengontrol aliran Al yang dihabiskan dalam perusahaan dan Anda mendapatkan kepercayaan yang diperlukan untuk mengalokasikan sumber daya ini。

TAHAP PERTAMA ENTERPRISE AI MEMBUKTIKAN BAHWA MODEL DAPAT DISELESAIKAN. TAHAP BERIKUTNYA AKAN MENENTUKAN BERAPA BANYAK INI LAYAK DIBAYAR. SEPERTI YANG CHARLIE MANGER KATAKAN: TUNJUKKAN INSENTIF, AKU BISA MEMBERITAHUMU HASILNYA。

Tautan Asli

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.