トークン予算戦争:企業AIが「会計の年齢」に入った
AIコスト、ROI、イントラ・エンタープライズ・リソース配分

原題: トークン予算戦争
Jaya Guptaによる写真
原文:ペギー
編集者プレス:エンタープライズAIは「使用しない」段階から「計算する方法」へと移行しています。
過去2年間に、多くの企業が従業員によるAIの使用を促進し、技術動向や競争力のある圧力でスピードを上げています。 しかし、AIが実験予算から継続的な運用費用、CEO、CFOs がより現実的な質問を始めたとき:AI がどれだけ価値を築いたのか? 実際の結果は何ですか
これは、トークン予算戦争の中心です。 いわゆるトークン予算戦争は、AI法案を下げる企業による試みではなく、企業がより多くのクレジットに値するかどうかを判断するための若返りの演習で、タスクはより安価なモデルに置き換えるべきであり、プロセスはアウトソーシングや労働を交換することができ、そしてそれは非効率的な消費である。
記事は、AIの使用が値に等しくないという最も懸念のことです。 SaaS時代では、利用は通常、ソフトウェアが使用されることを意味します。しかし、AI時代では、トークン消費量は「カウンターが実行されている」のみを示すことができます。 同じワークフローでは、ヒント、コンテキスト、モデル選択、再テスト回数の違いにより、複数のコスト差が発生することがあります。 法案が高まり、AIが本当に機能しているか、システムが機能していないかが高まっています。
そのため、エンタープライズAIの次のフェーズでは、キーは単なるキャパシティではなく、トークンコストとビジネス結果が一致できるかどうかです。 フェーズIIは、AIがその作業を完了できることを証明しました。フェーズIIは、コストに値しないと応答しました。
以下は元のテキストです
業務用AIは「利用しない」から「流通」へ移行しました。
同社のトップでは、新しい通貨は、AIが投資収益を定量化する能力です。 各機能は同じ質問に尋ねられました: 制作したきっかけは何ですか? 費用は何ですか。 過去2年間、CEOは、競合他社を見ながら、CNBC(#bearish)でジム・クラマーを見るために朝に目覚めています。 今、本当に圧力の下に来るものは、フォローアップの質問です:値が証明されます。
クロードは、ほとんどの企業が2026年の年間予算をロックしていた2025年11月にリリースされました。 第1四半期までに、企業の使用状況は計画されたものを超えてうまくいった。 費用は実験の予算だけではありませんが、運用コストを継続します。 そして、AIが本当に価値を創造するという新しい質問があります
トークンのユーティリティが定量化されていないため、この質問は答えにくいです。 この支出は、労働、発生所得、リスクの減少、プロセスのスピードアップ、またはトークン(#metames)でマッドされたエンジニアのグループだけを置き換えたかどうかを通知しません。 数百万ドルを費やすと、実験のようです。 しかし、7桁の到達など、特定のしきい値を超えて、インフラとなります。 技術的な違いは、収入ステートメントに材料の影響を及ぼすことから始まります。同じワークフロー、同じ入力グループ、および2つのトークンを実行するコストは5〜10倍の異なる問題はありません。 実験スケールでは、このボラティリティは既にかなり高価です。しかし、インフラスケールに入ると、CFOがCEOに説明しなければならない番号になります。
「マージナルトークンユーティリティ」と呼ばれることができます。すべてのドルの推論コストの商用値。 スケールステージでは本当に重要な数字で、現在ほとんどの企業に見えない。
ボード上の質問は「Aiは役に立ちません」から「Aiは本当に活用しています。」に行きます。 つまり、いわゆるトークン予算の闘争は、トークン分布について本質的に行われます。
そして、トークン所有権の競争は急速に上昇しています。なぜなら、それは30年間続く高い管理の本能に当たるからです。大きなチームは大きな仕事、大きな仕事、そして大きな力を意味します。 過去に、シニアマネージャーの成功は、彼らが管理したチームの規模によってマークされました - サブ座標の数、サブ座標数、組織構造の人々の数。
しかし、インテリジェンスがスカースリソースになるとき、新しい兆候が生まれます:どの程度の知能がデプロイできますか。
AIの支出は、労働コストと競争する本質にあります。
ほとんどのAI予算アプリケーションは、本質的に3種類の提案の1つです。外部委託ラボを交換したり、内部労働を交換したり、新しい収入を生成したりします。
社員が支払う 1つのBPOアウトソーシング契約は、作業注文、決済、請求書、監査に基づいて価格を持っています。 人間はこれらの対策を理解することができます。 しかしながら、推論の費用はより複雑で、ミッションの最終完了の費用は、その実装中にシステムがどのように動作するかによって異なります。 3つの再テスト、マニュアル修正、フォワードモデルを必要とするクレーム管理ミッションは、代替する外部のマンパワーよりも高価である可能性があります。 そのため、議論が進んでいるのは、結果の完了にかかる費用は何ですか? たとえば、各処理されたワークシートでは、各処理されたクレームに対して、各レビュー契約ごとに、各請求書が完成したため、各顧客が保持されるごとに、または各ドルベースの所得変換に関連する費用については、各追加投稿が回避されます。
役員は、BPOが「完成したユニット」によると既に価格付けられているため、ベンチマークを確立する最も簡単な場所であることを認識しました。 対照的に、社内のスタッフとAIの比較は、ランチブレイクブラシ、TikTokなど、毎日多くの仕事をしています。 生産性向上は、採用や分散能力のリリースを避けるためにしばしば反映されます。 マネージャーは、部分的な自動化に基づいてチーム番号を減らすことに抵抗します。 BPOは、ビジネスチームに満足できるベースラインを提供します。
これはSaaSのロジックとは異なる。 SaaS は、企業が価値のプロキシインジケータとして量を使用するように訓練しました。
しかし、AIはこれを壊しました。 リソースが同じワークフローによって消費される理由は、ヒント、コンテキスト、選択したモデル、呼び出すツール、レトリーの数、およびエージェントが立ち往生しているかによって大きく変化する可能性があります。 請求書の単位 — トークン — は安定していますが、不安定な作業負荷を表します。
より正確に:信号および騒音は測定の同じ単位を使用します。 トークン法案の増加は、実際の作業が行われることを意味するかもしれません。しかし、彼らはまた、コンピューティングが悪いヒント、無関係なコンテキスト、不要なツールコール、反復的な推論と過容量モデルに浪費されていることを意味するかもしれません。 両事業のトークン請求書は同一であるかもしれませんが、一番下にある事業は非常に異なります。 一方、結果に推論を翻訳しました, 一方、無効性のための法案を購入しました, 両者は、法案のエントリに正確に同じ見ました。
SaaS の使用は、ソフトウェアが既に使用中であることを伝えます。 AI使用量はメーターが動くことだけを告げます。 会社が本当に稼働しているかどうかはわかりません。
なぜ証拠金トークンは見えますか
3つのポイントがあります。
まずは試してみてください。 個人が最初に流れを正しくする確率がpの場合、解決されたストリームあたりの期待されるトークン消費量はT/pで大幅増加し、そのTは基本コストです。 完了率が90%から70%に低下すると、問題の解決の有効な費用は20%の代わりに20%増加します。 ビジネスストリームでは、入力は混乱傾向があり、異常も重要です。 精度を低下させるだけでなく、経済口座も変更する。
2 つはコンテキストの拡張です。 注目のメカニズムに大きく依存する操作のために、推論のコストはコンテキスト長でO(n2)増加する。 その結果、コンテクストの長さが倍増し、推論コストが約4倍になります。 誰もが十分な情報を持っているモデルを望んでいるので、システムが過剰供給する傾向があります:元の5つの文書は十分であり、50が取得されます。 コネクタは、メールライン全体に直進します。 そして、エージェントは、対話の古い歴史を続けています。
第三はルートです。 そして、どのモデルが十分によいかわからないとき、デフォルトは最も強いモデルを使用します。 ベース分類タスクは、もともと複雑な推論のために使用していた同じモデルで実行することができます。 コール数が百万に達すると、単純なタスクが小さなモデルに与えられているか、モデルを転送するすべてのタスクが多くの場合、管理可能な請求書とボードレベルの問題の違いであるかどうかの質問。
ソフトでない業界は「トランスフォーメーション」の形でこの痛みを感じるでしょう。 ソフトウェア会社は、最適化された作業が既に完全に計測されているため、この問題が最初に確認されています。 エンジニアリングチームは、PR、提出、導入、事故、サイクルタイム、平均回復時間、およびこれらの指標などの指標を製品にリンクしています。 完璧ではありませんが、そのような作業はより簡単に測定されます。
非ソフトウェア企業は、その作業が運用されているため、より深く問題を感じるでしょう。 例えば、クレーム決済、保険補償、旅客サービス注文、コンプライアンスレビュー、サプライチェーン異常、支払い紛争。 または、現実世界の資産を持つ企業は同じ問題に直面します。 過去に、これらの流れは、多くの場合、労働条件、周期性、SLAの業績および誤差率の観点で測定され、多くの場合、より要求され、監査で維持される必要があり、平均的な意味ではなかった。 ワークユニットとコストユニットは同じ言語を話さないし、同じ組織にはありません。 技術的なチームは、トークン消費量と事業部門がワークフローの変更を見ることができますが、複数のチームをつなぎ合わせるには、まず考慮すべきことに同意する必要があります。
ソフトウェア企業が生産性測定の問題としてトークン予算競争を体験すると思いますが、以前に発生した多くの「AI layoffs」に対応するため、ソフトウェア企業が移行問題として経験するわけではありません。
行方不明層は、トークンから結果までのアトリビューションです。 企業は、作業の推論の支出と生成された事業成果を結びつける変革の層を必要とします。 このレイヤーは3つの質問に答えなければなりません。このストリームの実際の費用は、再テストと修正を含みます。 実行軌跡のどの部分が本当に重要であり、それは効果がありませんか? この作業は、例えば、各旅客サービスが少数の作業注文、より短い解像度サイクル、より小さいBPO予算、遅延された採用を処理するために、ビジネスモデルを変更しますか? 次の層は、ビジネス言語における結果の帰属です。 単に「このジョブストリームは$ 2.13」と言うのではなく、「この種の決済はBPOよりも処理するのに負担が安くなりますが、ポリシーが余計な異常な文書を必要とするならば、それは再び試みることによって経済を破壊します。
測定は記憶になります。 トークンを1つの結果に接続するには、企業は、ミドルで何が起こったのかをキャプチャしなければなりません。 エージェントが何を探し、彼が使用したツール、彼が無視したツール、彼は手動でカバーされたときに、そのルールが適用され、その優先順位が機能し、なぜ1つのパスが機能し、別の失敗した。 測定層は、決定の軌跡を記録しなければなりません。これは、企業が過去に本当に持っていたことがないことです。 記録システムは、何が起こったのかをキャプチャすることができますが、なぜかまれに。 たとえば、CRMは、取引が延期されていることをあなたに伝えることができます, しかし、販売予測の背後にある不当な判断を伝えることはできません。
意思決定の合理化は、Slackスレッド、メールチェーン、アップグレードされた会議、ヒューマンマインドに存在するため、会社の最も破損し、資産を消失するものです。 しかし、問題は、人が離れ、プロセスが変化するということです。
エージェントが軌跡を作成するため、AIはこれを変更しました。 すべての検索, ツールコール, 再テスト, アップグレード, マニュアルの修正と最終的な意思決定は、コンテキストからアクションへのアクションへのパスの一部であります. 当初、会社は支出を正当化するためにトラックをキャプチャします。 しかし、これらのトラックが捕獲されると、組織が実際に決定を下す方法の永続的な記録になるため、コストレポート自体よりも価値があります。 (COUGHING、CONTEXT GRAPH) は、 最近は言葉を聞きましたが
配布レベルは賞品です。 クライアントの運用モデルにおいて、推論が測定コストのリソースとなる場合、各ドルは支出価値自体を証明しなければなりません。 トークンが変換されたとき、いつ、なぜ、どのサプライヤーが説明できますか
企業はそれを把握しません。 トランスフォーメーションとして買います。 フォーチュン500社は、シートベルトを固定し、McKenzieを雇い、市場におけるPalantirのすべての元従業員に持ち出し、その後、最高から最下まで変化を促進しました。 結果に対するトークンのアトリビューションは、ERP、BI、およびデジタルトランスフォーメーションと同じ方法で行われます:エグゼクティブの承認で「プロジェクト」として、インフラのボトムアップセットは、最終的に事実の新しいソースになります。 そのためにできる創設者は、さまざまなタイプの創設チームを形成し、起業家の伝統的なプロトタイプとは違います。
トークンが何をすべきかを誰が知っているのか、彼は配布の決定をすることができます: より多くのクレジットに値するジョブ、制限されるべきである、それはより安いモデルに切り替えるべきであり、それは人々によって行わなければならない、そしてBPOを交換することができる。 これらの決定を下すと、AIが企業内で費やす流れをコントロールし、このリソースを割り当てるために必要な信頼を得ることができます。
エンタープライズAIの第一段階は、モデルが完成できることを証明しました。 次のステージでは、この金額が支払う価値があるかを決定します。 チャーリー・マネガーは言いました: 私にインセンティブを表示, 私はあなたに結果を伝えることができます。
