Token Budget War: 기업 AI는 "계좌의 나이"를 입력

2026/05/29 02:40
👤ODAILY
🌐ko

AI 비용, ROI 및 인트라-ENTERPRISE 자원 할당

Token Budget War: 기업 AI는 "계좌의 나이"를 입력

원래 제목: 토큰 예산 전쟁

사진 Jaya Gupta

원래 언어: Peggy

편집기 프레스 : ENTERPRISE AI는 "USE 또는 NOT"단계에서 "HOW TO COUNT"로 이동합니다。

지난 2 년 동안 많은 회사는 직원에 의해 AI의 사용을 촉진, 기술 동향과 경쟁적인 압력으로 속도를 유지하는 등. 그러나 AI가 비용 실험 예산에서 지속적인 운영 비용, CEO 및 CFOs가 더 현실적인 질문을하기 시작했을 때 : AI가 얼마나 많은 가치를 창출했는지? 모든 달러 토큰 비용, 실제 결과는 무엇입니까

이것은 Token Budget Wars의 핵심입니다. 소위 토큰 예산 전쟁은 AI 법안을 낮추기 위해 기업에 의해 시도뿐만 아니라 더 많은 신용을받을 것을 결정하는 재활 운동, 이는 프로세스가 아웃소싱 또는 노동을 대체 할 수있는 더 싼 모델에 의해 대체되어야한다, 단지 비효율적인 소비。

이 문서는 AI의 사용은 가치와 동일하지 않다는 가장 큰 우려입니다. SaaS 시대에서 사용은 일반적으로 소프트웨어가 사용된다는 것을 의미합니다. 그러나 AI 시대에서 토큰 소비는 " 카운터가 실행된다는 것을 나타냅니다. 동일한 작업 흐름은 힌트, 컨텍스트, 모델 선택 및 재 테스트의 차이로 인해 여러 비용 차이로 발생할 수 있습니다. 법안은 더 키가 큰, 그것은 AI의 정말 작동 될 수, 또는 시스템의 작동하지。

따라서, 엔터프라이즈 AI의 다음 단계에서, 키는 단지 모델링 용량이 아니지만, 토큰 비용 및 비즈니스 결과는 일치 할 수 있습니다. AI가 그 일을 완료 할 수 있음을 입증 한 단계; 단계 II는 비용이 가치가 없다는 것을 응답했습니다。

다음은 원본 텍스트입니다:

BUSINESS AI는 "USE 또는 NOT"에서 "DISTRIBUTION"로 이동했습니다。

회사의 상단에 새로운 통화는 투자에 AI 수익을 할당 할 수있는 능력입니다. 각 함수는 동일한 질문을 했습니다: 당신은 무엇을 생산 했습니까? 비용은 얼마입니까? 지난 2 년 동안 CEO는 CNBC (#bearish)에서 Jim Cramer를보고 경쟁사 생산성을 발표하고 AI를 사용하도록 회사를 요청하면서 아침에 근무했습니다. 이제 압력 아래에서 실제로 오는 것은 후속 질문입니다 : 값을 증명합니다。

Claude는 2026 년 대부분의 비즈니스의 연간 예산이 잠겨있을 때 11 월 2025에서 출시되었습니다. 첫 번째 분기에, 기업의 실제 사용은 계획 된 것보다 잘 사라졌다. 그 이유는 더 이상 실험에 대한 예산 항목이 아니라 지속적인 운영 비용입니다. 그런 다음 새로운 질문이있다 : AI가 실제로 가치를 창출하는 곳

이 질문은 토큰의 유틸리티가 할당되지 않기 때문에 응답하기 어렵습니다. 이 지출이 노동, 생성 된 소득, 감소 된 위험, 프로세스를 가속화, 또는 토큰 (#metames)에서 mad 한 엔지니어의 그룹을 의미하지 않습니다. 수천 달러를 지출하면 여전히 실험처럼 보입니다. 그러나 일곱 자리에 도달과 같은 특정 임계 값을 넘어, 그것은 인프라가된다. 기술 차이는 소득 진술에 대한 재료 영향을 갖기 시작합니다 : 동일한 워크플로우, 동일한 입력 그룹, 두 토큰을 실행하는 비용은 명백한 문제없이 5 ~ 10 배가 될 수 있습니다. 실험적인 규모에서, 이 변동성은 이미 매우 비쌉니다. 그러나 일단 인프라 규모를 입력하면 CFO가 CEO에 설명해야 할 수 있습니다。

그것은 "marginal 토큰 유틸리티"라고 할 수 있습니다 : 모든 달러의 비용의 상업적 가치. 이것은 규모 단계에서 정말 중요한 인물이며 현재 대부분의 회사에 접근 할 수 있습니다。

보드에 대한 질문은 "Ai는 유용하지 않습니다"에서 "Ai는 정말 레버리지입니다." 그래서-called 토큰 예산 투쟁은 토큰 배포에 대해 필수적입니다。

그리고 토큰 소유권의 경쟁은 30 년 동안 지속 된 높은 관리 중단을 타격하기 때문에 빠르게 상승했습니다. 큰 팀은 큰 일자리, 큰 일자리 및 더 큰 힘을 의미합니다. 과거에 수석 관리자의 성공은 관리 된 팀의 크기에 의해 표시되었다 - 하위 좌표의 수, 하위 좌표의 수 및 조직 구조의 사람들。

그러나 인텔리전스가 무서운 자원이 될 때, 새로운 기호가된다 : 얼마나 많은 지능을 배포 할 수 있습니까。

AI EXPENDITURES는 노동비와 경쟁하는 본질에 있습니다。

대부분의 AI 예산 응용 프로그램은 근본적으로 3 가지 유형의 배치 중 하나입니다 : 아웃소싱 노동, 내부 노동 교체, 또는 새로운 소득 생성。

직원은 지불했다. ONE BPO 아웃소싱 계약은 작업 주문, 결제, 송장 또는 감사를 기반으로 가격이 있습니다. 인간은 이러한 조치를 이해할 수 있습니다. 그러나, REASONING의 비용은 더 복잡합니다, 임무의 마지막 완료 비용으로 시스템이 구현 중에 작동하는 방법에 따라 달라집니다. 3개의 재 시험, 수동 개정 및 앞으로 모형을 요구하는 주장 관리 임무는 대체하기 위하여 예정된 OUTSOURCED 인력 보다는 더 비쌉니다. 그것은 왜 토론이 진행되고있다 : 어떻게 결과를 완료하는 비용입니까? 예를 들어, 각 처리 된 워크 시트의 경우, 각 처리 된 청구에 대한, 각 청구서에 대해 완료, 각 추가 게시물에 대한, 각 고객 유지에 대한, 또는 각 달러 기반 소득 변환과 관련된 비용。

임원은 BPO가 벤치 마크를 설정하기 위해 가장 쉬운 장소가 있음을 깨달았습니다. 내부 직원과 AI의 비교에 따라 직원은 점심 브레이크 브러시, TikTok을 포함하여 매일 많은 작업을 수행하기 때문에 훨씬 어렵습니다. 생산성 이득은 종종 용량의 채용 또는 분산 방출을 피하기 위해 반영됩니다. 관리자는 부분 자동화에 따라 팀 번호를 감소시킵니다. BPO는 사업 팀을 위한 quantifiable 지선을 제공합니다。

이것은 SaaS의 논리와 다릅니다. SaaS는 가치의 프록시 지표로 양을 사용하는 기업을 훈련했습니다。

그러나 AI는 이것을 끊었다. 동일한 작업 흐름에 의해 소비되는 몇 가지 이유가 힌트, 컨텍스트, 선택된 모델, 도구가 호출 될 수 있습니다, retries 수, 그리고 angent가 붙어 있는지 여부. 청구서의 단위 - 토큰 - 안정적이지만 불안정한 워크로드를 나타냅니다。

더 정확하게: 신호와 소음은 측정의 동일한 단위를 이용합니다. token bill increase may mean that real work is being done; but they may also mean that computing is being wasted on bad hints, 불확실한 context, 불필요한 도구 호출, 반복적인 reasoning and overcapacity model. 두 사업에 대한 토큰 청구는 동일 할 수 있지만, 하단의 사업은 매우 다릅니다. 하나는 결과에 대한 이유를 번역했다, 반면 다른은 비효율에 대한 청구서를 구입, 모두는 정확히 같은 청구서 항목에보고。

SaaS의 사용은 소프트웨어가 이미 사용 중임을 알려줍니다. AI 사용은 미터가 실행된다는 것을 말합니다. 회사가 정말로 실행되면 알려지지 않습니다。

왜 마진 토큰이 보이지 않는가

3개의 주점이 있습니다。

첫 번째는 다시 시도합니다. 개인이 첫 번째 시간 동안의 흐름을 올바르게 수행 할 확률이 높을 경우, 해결 된 스트림 당 예상 토큰 소비는 T / p에 의해 대략 증가 될 것입니다, 어느 T는 기본 비용입니다. 완료율이 90 %에서 70 %로 떨어지면 실패가 화합물 효과가 있기 때문에 20 % 대신 약 28%의 문제 증가를 해결하는 효과적인 비용. 비즈니스 스트림에서, 입력은 혼란스럽고 동종이 중요합니다. 실패는 정확도 비율을 감소뿐만 아니라 경제적 계정을 변경합니다。

두 번째는 컨텍스트의 확장입니다. 주의 메커니즘에 의존하는 작업의 경우, 원인의 비용은 O(n2)에 의해 컨텍스트 길이로 증가합니다. 결과적으로, 문맥의 길이는 두 배이고 이유의 비용은 대략 4fold입니다. 모든 사람이 충분한 정보를 가지고 모델을 원한다, 그래서 시스템은 oversupply 경향이 : 원본 다섯 문서는 충분하고 50은 retrieved; 커넥터는 전체 메일 라인에 똑바로 간다; 그리고 angent는 대화의 outdated 역사와 함께 계속。

세 번째는 노선입니다. 그리고 팀이 모델이 충분히 좋을지 모른다면 기본적으로 가장 강력한 모델을 사용합니다. 기본 분류 작업은 원래 복잡한 이유에 사용 된 동일한 모델에 실행할 수 있습니다. 통화 수가 수백만에 도달 할 때, 간단한 작업이 작은 모델에 주어지거나 모든 작업이 앞으로 모델에 주어지는 것은 종종 관리 가능한 청구서와 보드 레벨 문제의 차이입니다。

비 소프트웨어 산업은 "변환"의 형태로이 고통을 느낄 것입니다. 소프트웨어 회사는 최적화 된 작업으로이 문제를 볼 수있는 첫 번째입니다 이미 완전히 계측되었습니다. 엔지니어링 팀은 PR, 제출, 배포, 사고, 사이클 타임, 평균 복구 시간 및 이러한 지표와 같은 지표를 가지고 있습니다. 완벽하지 않지만 이러한 작업은 쉽게 측정됩니다。

Non-software 기업은 그들의 일이 가동이기 때문에 더 깊은 문제를 느낄 것입니다. 예를 들어, 합의, 보험 적용, 여객 서비스 주문, 규정 준수 리뷰, 공급망 승인, 지불 분쟁을 주장합니다. 또는, 실제 세계 자산을 가진 회사는 동일한 문제를 직면할 것입니다. 과거에는 이러한 흐름은 종종 노동, 정기적 인, SLA 성과 및 오류율의 관점에서 측정했으며 종종 더 까다로운 요구가 있었고, 감사에서 지속되기 위해서는 평균 감각이 아닙니다. 작업 단위 및 비용 단위는 동일한 언어를 말하지 않으며 동일한 조직에 없습니다. 기술 팀은 토큰 소비를 볼 수 있으며 비즈니스 부문은 워크플로우에서 변경할 수 있지만, 두 가지를 연결하기 위해 여러 팀이 측정하는 것에 동의합니다。

나는 소프트웨어 회사가 이전에 발생한 많은 "AI layoffs"에 대응하는 생산력 측정 문제로 토큰 예산 경쟁을 경험할 것이라고 생각합니다. 소프트웨어 회사가 전환 문제로 경험하지는 않습니다。

누락된 층은 토큰에서 결과에 기여합니다. 기업은 작업을 수행하고 생성 된 사업 결과에 대한 이유의 지출을 연결하는 변환 층을 필요로한다. 이 층은 세 가지 질문에 대답해야합니다. 이 스트림의 실제 비용은 재 테스트 및 종료를 포함하여입니까? 실행 trajectories의 어느 부분이 진짜로 중요하고, 단지 실질적인? 이 작업은 비즈니스 모델을 변경합니다. 예를 들어, 각 여객 서비스는 몇 가지 작업 주문, 단축 해상도 사이클, 작은 BPO 예산, 지연된 채용을 처리 할 수 있습니까? 다음 계층은 비즈니스 언어의 결과의 본질입니다. 단순히 말하기 대신, "이 작업 스트림 비용 $2.13", 그것은 말한다, "이 종류의 합의는 BPO보다 처리하는 데 더 싼, 그러나 정책이 여분의 특정 문서를 필요로하는 경우, 그것은 다시 시도하여 경제를 파괴。

측정은 기억이 됩니다. 토큰을 하나의 결과에 연결하기 위해, 기업은 중간에 무슨 일이 있었는지 캡처해야합니다. 무엇 angent 톱, 그가 사용 한 도구, 그가 무시 한, 그가 다시 시도 할 때, 그는 수동으로 덮었을 때, 규칙이 적용되었을 때, 미리 일하고, 왜 하나의 경로가 작동하고 또 다른 실패. 측정 층은 의사 결정의 trajectory를 기록해야하며, 이는 기업이 과거에 결코 정말로 가지고 있지 않다. 기록 시스템은 무슨 일이 있었는지 캡처 할 수 있지만 거의 왜. CRM, 예를 들어, 거래가 연기되었는지 말해 줄 수 있지만, 판매 예측 뒤에 불확실한 판단을 말할 수 없습니다。

의사 결정에 대한 합리적 인 것은 Slack 스레드, 메일 체인, 업그레이드 된 회의 및 인간의 마음에 존재하는 것처럼 회사에 가장 손상되고 사라지는 자산 중 하나입니다. 그러나 문제는 사람들이 떠나고 프로세스가 변경된다는 것입니다。

AI는 angent가 trajectory를 창조하기 때문에 이것을 바꿨습니다. 모든 검색, 도구 통화, 재시험, 업그레이드, 수동 교정 및 최종 결정은 context에서 동작하는 경로의 일부입니다. 처음에는, 회사는 expenditure를 justify하기 위하여 궤도를 붙잡을 것입니다. 그러나 이러한 트랙이 캡처되면 그들은 조직이 실제로 결정을 내릴 수있는 영구적 인 기록이되기 때문에 비용보고보다 더 가치가 있습니다. (코칭, CONTEXT GRAPH) 정말 말을 늦게 들었지만

유통 수준은 실제 상품입니다. 이유는 클라이언트의 운영 모델에서 측정 된 비용 자원이되는 경우, 각 달러는 지출의 자체를 증명해야합니다. 토큰이 변환될 때 어떤 공급자가 설명할 수 있습니까

사업은 그것을 밖으로 파악하지 않습니다. 그들은 변환으로 그것을 살 것입니다. Fortune 500 회사는이 반복적으로 수행했습니다. 좌석 벨트를 고정하고 McKenzie를 고용하고 시장의 Palantir의 모든 직원을 가져 와서 CEO의 최고에서 바닥으로 변경하십시오. 토큰의 결과에 대한 기여는 ERP, BI 및 디지털 변환과 같은 방식으로 올 것입니다: "프로젝트"로 경영 종료, 인프라의 하단 설정은 결국 새로운 소스가 될 것입니다. 이렇게 할 수 있는 창의자는 발견 팀의 다른 유형을 형성하고 기업가의 전통적인 시제품에서 다를 것입니다。

누구든지 토큰이 무엇을 할지 알고, 그는 배포 결정을 할 수 있습니다 : 작업은 더 많은 신용을받을 자격이, 제한된, 이는 더 싼 모델로 전환되어야, 이는 사람들이 계속되고 BPO를 대체 할 수 있어야합니다. 그리고 이러한 결정을 한 번, 당신은 기업 내에서 AI 지출의 흐름을 제어하고 당신은이 리소스를 할당 할 필요가 신뢰를 얻을。

ENTERPRISE AI의 첫 단계는 모델이 완료 될 수 있음을 증명했습니다. 다음 단계는 얼마나 많은이 지불 가치가 있는지 결정합니다. CHARLIE MANGER는 다음과 같이 말했습니다. 인센티브를 보여주고 결과를 알려 줄 수 있습니다。

원본 링크

QQlink

No crypto backdoors, no compromises. A decentralized social and financial platform based on blockchain technology, returning privacy and freedom to users.

© 2024 QQlink R&D Team. All Rights Reserved.