Litecoin

クラウドコードは、空きスペースで蒸発して20回、公式は「保存する」と言います

2026/04/04 02:29
👤ODAILY
🌐ja

Claudeコードは全てのバグレコードをキャッシュします

クラウドコードは、空きスペースで蒸発して20回、公式は「保存する」と言います

1セントあたり4-17。 過去の月のクロードコードの読み取り速度です。 通常のレベルは97-99%です。

つまり、以前のセッションに戻すと、Claude Code は既に処理されたコンテキストに戻りませんが、毎回全体のコンテンツを扱い、通常の値が 10 から 20 回の間消費します。 会話を続けていて、常に新しい会話が始まります。

この図は、独立した開発者 ArkNill によるプロキシ監視に基づいています。 Claude Code と Anthropic API の全てのリクエストを透明エージェントの設定で記録し、API サーバーがキャッシュされたダイアログのプレフィックスにマッチできないバグを見つけたので、各ラウンドを強制して完全なトークン再構築を行います。

上記の図は、キャッシュ読み取り速度の3段階の比較を示しています。 期間 v2.1.69 から v.2.1.89 (つまりバグの寿命) の間、Bandalone バージョンでは、キャッシュアクセス率の 4-17 だけが利用可能です。 v2.1.90の特長 キーバグの1つを修復した後、コールドスタートしたキャッシュ読み取り速度が47-99.7に1セントで返されます。 v2.1.91 では、安定したキャッシュ読み取り速度が 97-99% に返されます。

グラフの細部に注意する価値があります: v2.1.90 の範囲は非常に広い (47 から 99.7 パーセント)、会話が再開するときに「予熱」する必要があるので、, 前のラウンドで低ヒット, しかし、すぐに正常なレベルに戻ります. バグバージョンでは、この予熱は決して起こりません。 キャッシュ読み取りは、常にシステムヒントの14,500トークンにとどまり、すべての会話履歴は常に完全に価格設定されます。


28日間、20バージョン

このバグは、アップデートと次のいずれかで導入されたものの種類ではありません。 npmレジストリのリリースレコードによると、バグで導入されたv2.1.69は3月4日に公開され、修復バグのv2.1.90は4月1日に公開されました。 20バージョン間の28日。

タイムラインは興味深い詳細を明らかにします。 バグが3月4日に導入されたとき、ユーザーはすぐに大量の苦情を提出しなかった。 3月23日(火)までは、クレームが故障し、3週間ほどの間隔で終了した。 この理由は、GitHub の問題 #41930 によると、3 月 13 日から 28 日まで、Anthropic はオンラインからダブル セールス (twice off-peak 時間) に行き、バグの影響を客観的に隠しました。 プロモーションが完了すると、キャッシュのバグの消費は、ユーザの金額を「蒸発させる」瞬間に、通常のコストベースラインに戻ります。

Anthropic の応答は速く来ませんでした。 3月26日、ユーザの苦情の発生後3日間、エンジニアのTariq Shihipar氏は、ピーク時間(午前5時〜午前11時PT)の天井が締まりました。 3月30日には、「ユーザーが期待よりもはるかに速い速度で限界に達した」とRedditでAnthropicが認められ、それは最高のチーム優先順位を与えられたと述べました。 ライディア・ハリーが正式に発表したのは、4月1日まででした。

プロセスを経て、Anthropicはブログ投稿を公開せず、メールを送らず、ステータスページを更新しなかった。 すべての公式コミュニケーションは、エンジニアの「パーソナルソーシャルメディア投稿」と、少数のRedditコメントを通じて行われます。


お支払いはいくらですか? どのくらいの時間

GitHub の問題 #41930 は何百ものユーザーレポートをまとめました。 最も極端なケースは、最大20xの加入者($200 /月)で、5時間のスクロールウィンドウが完全に19分で枯れていることです。 最大5倍のユーザー($100/月)は、90分で実行する5時間ウィンドウを報告します。 手紙2によると、セッションクォータの13%を消費する簡単な「hello」が使用されます。 1人のプロユーザー($ 20 /月)は、彼のクォータが「月曜日に使用し、土曜日に置き換えられた」と30日で12日のみであったことをDiscordで述べた。

ArkNillのベンチマークテストによると、バグバージョンv2.1.89では、最大20xプログラムの100%クォータが約70分で排出されます。 また、システムが完全にリセットされるため、約0.15で500Kトークンコンテクストセッションの単列操作のコストを計算しました。


「間違っていた」

Lydia Hallieの調査結果は、2つのポイントを確認します。そのうちの1つは、最大時間制限が確かに締まり、会話の消費量が増加した1,000,000のトークンコンテキストのもう1つです。 チームはバグを修復したと主張していますが、「追加の手数料が発生したバグの1つではない」と強調しています。

それから4つの推薦をしました:

1。 Opusの代わりにSonnet 4.6の使用(マイナス消費率約2倍)

2. 徹底的な推論が要求されないときの推論またはシャットダウンを減らして下さい

3. 1時間以上アイドル状態の長いセッションを再開し、セッションを再開しないでください

環境変数 CLADE CODE AUTO COMPACT WINDOW=200000 を設定し、コンテキストウィンドウのサイズを制限します。

引用語句の取り替えか補償のあらゆる形態に参照はなされませんでした。

AI podcast ホストの Alex Volkov は、応答を「あなたはそれを間違って保持している」とまとめ、Anthropic 自体がデフォルトで 1 万トークンのコンテキストを設定し、Opus を旗艦モデルとして宣伝し、販売ポイントとして販売し、今、これらの関数を使用しないことを支払ったことを指摘しました。

「手数料なし」の請求は、Claude Code の更新されたレコードとの緊張にもなっています。 Lydiaがその応答を発行する直前の1日だけ、v2.1.90はv2.1.69から返されたキャッシュを修復しました。 --resumeを使用してセッションを再開するとき、キャッシュに当たるリクエストは、フルプライスで完全なプロンプトキャッシュミスをトリガーします。 これは、Lydiaの応答では、この確認された費用の異常は述べられませんでした。

対照的に、OpenAIのCodexは、以前に同様の異常な消費問題がありました。 OpenAIのアプローチは、ユーザークォータをリセットし、クレジット番号を再発行し、Codexの天井が削除される3月に発表することです。 Anthropic ' s アプローチは、ユーザーがモデルをダウングレードしたり、関数をシャットダウンしたり、コンテキストを制限したり、ユーザーの s モードに対する属性の責任を制限したりすることを推奨することです。

Anthropicは、月額$ 20と$ 200の間で "Strength Model + Max Context + Max Logic Capability" にサブスクリプションを販売しています。 バグの28日間のキャッシュにより、ユーザーは10〜20回の速度で蒸発し、正式な応答が保存されます。

QQlink

無加密後門,無妥協。基於區塊鏈技術的去中心化社交和金融平台,讓私隱與自由回歸用戶手中。

© 2024 QQlink 研發團隊. 保留所有權利.