OpenAI自研芯片落地|Rewire新闻早报
OpenAI 联合博通发布自研推理芯片,直指 AI 成本压力
1|OpenAI 与博通发布 Jalapeño 推理芯片,TSMC 同日宣布先进制程全线涨价
OpenAI 与博通联合发布 Jalapeño Intelligence Processor,专为大模型推理设计的光罩满尺寸 ASIC,从立项到发布 9 个月,开发过程使用了 OpenAI 自己的模型加速。推理成本较 GPU 削减约 50%,首批部署目标 2026 年底,配合微软 gigawatt 级数据中心落地。
时机不是巧合。TSMC 同日宣布对所有先进制程节点涨价,覆盖约 74% 的晶圆业务,英伟达、AMD、苹果等主要客户全部受波及。高通同日以 39 亿美元收购 Modular(Mojo 语言 + MAX 推理平台),从软件层绕开 CUDA 生态。两家公司在同一天从软硬件两端冲击英伟达护城河,自研芯片不是技术展示,是被成本结构逼出来的防御动作。
(来源:Tom's Hardware / CNBC / VentureBeat / Reuters / OpenAI 官方博客)
2|Anthropic 指控阿里巴巴 2880 万次窃取 Claude 能力,同日 Amodei 被白宫踢出谈判桌
Anthropic 向参议员和白宫递交公开信,指控阿里巴巴 Qwen 团队在 4 月 22 日至 6 月 5 日间用约 25,000 个虚假账号对 Claude 发起 2,880 万次请求,系统性提取推理模式与知识结构,称这是「迄今规模最大的蒸馏攻击」。中国公司 360 同日声称已开发出与 Anthropic 最新模型 Mythos 性能相当的工具。
但 Anthropic 当天还有另一条战线失守。Wired 报道,联合创始人 Tom Brown 已取代 Dario Amodei 出席白宫 AI 安全谈判。白宫消息人士原话:「Tom Brown 不会像 Dario 那样搞得很奇怪。」起因是 Mythos 越狱漏洞的披露策略分歧,主动向国会披露政府系统脆弱性的 Anthropic 反被行政部门边缘化。同日两名 Google DeepMind 研究员宣布加入 Anthropic,人才虹吸加速,但这家公司正在商业、政治、安全三条战线同时消耗。
(来源:Reuters / CNBC / Wired / TechCrunch)
3|美光利润翻 15 倍成存储芯片之王,SK 海力士冲刺 290 亿美元 Nasdaq 史上最大科技 IPO
美光公布 FY2026 Q3 财报:营收 414.6 亿美元同比翻四倍,净利润 282.4 亿美元,毛利率 84.6%。Q4 指引营收 500 亿美元,毛利率升至约 86%,股价盘后涨超 10%。AI 训练和推理对高带宽存储器的需求让美光的利润率超过了英伟达。
同日 SK 海力士提交 Nasdaq ADR 上市申请,计划募资 294.65 亿美元,目标 7 月 10 日开始交易。如果完成将超越阿里巴巴 2014 年 250 亿美元纪录,成为科技史上最大 IPO。所有募集资金指向 HBM 产能扩张。但 Cerebras 同日首份财报后暴跌近 20%,毛利率指引 38%-41% 远低于预期。AI 供应链的超额利润正从计算加速器向存储端集中。
(来源:CNBC / TechCrunch / Tom's Hardware / Investing.com)
4|参议院首次通过限制对伊动武权力,同日 Trump 要求 876 亿美元战争拨款
美国参议院以 50 比 48 通过战争权力决议案,要求总统在未经国会批准的情况下停止针对伊朗的军事行动。四名共和党人(Murkowski、Collins、Cassidy、Paul)跨党投票,这是参议院历史上第十次尝试此类表决,首次通过。决议不具法律约束力,但政治信号明确。
同日白宫预算管理局提交 876 亿美元追加拨款申请,明确包含伊朗战争支出。Trump 还威胁拒签住房法案,要求先通过选举法案 SAVE Act,午餐会上与共和党参议员爆发冲突。达利欧(Ray Dalio)结束十天中国行后发表长文,核心判断:美国处理伊朗与霍尔木兹海峡的方式「很像英国处理苏伊士运河国有化,那标志了大英帝国的终结」。行政扩权和国会限权在同一天碰撞,达利欧在外部提供了一个跨帝国周期的历史框架。
(来源:Al Jazeera / Fortune / Axios / NPR / CNN)
5|企业 AI 预算全面失控,Uber 四月烧完全年额度,「token 配给」时代开始
Uber 到 4 月就烧完了全年 AI 预算,现在每人每月限额 1,500 美元。沃尔玛内部 vibe-coding 平台「Code Puppy」被强制限流。Meta 30 天消耗 73.7 万亿 tokens,内部追踪系统被命名为「Claudeonomics」。触发点是 Anthropic 和 OpenAI 今年从订阅制切换到 token 计量计费,企业才发现员工用量完全不可控。
这跟今天第一条形成因果链。OpenAI 急着自研芯片省 50% 推理成本,一半原因是英伟达贵,一半是自家客户的消耗速度远超预期。AWS CEO 同日称「AI 不会消灭白领工作」,但企业面对的现实是:不是用不用 AI 的问题,是员工用太多导致成本失控。推理需求从可预测的企业采购变成不可控的员工行为,整条供应链的产能假设都要重写。
(来源:TechCrunch / Fortune)
也值得知道 ↓
Bitcoin 跌至 60,000 美元创 20 个月新低。 Rainbow Chart 首次进入标注为「BTC is dead」的色带区间,分析师预测短期可能下探至 55,000 美元。(来源:CoinDesk)
Kalshi 瞄准 400 亿美元估值,领先 Polymarket 数倍。 预测市场平台正与投资者洽谈新一轮融资,同日起诉伊利诺伊州监管机构为全国扩张清障。(来源:CoinDesk)
AI 数据中心遭遇人才瓶颈,熟练劳动力短缺拖慢部署。 设备调试和冷却系统安装依赖经验丰富的技工,培训周期 12-18 个月,算力扩张可能因此减速。(来源:Tom's Hardware)
Agility Robotics 通过 SPAC 上市,估值 25 亿美元。 亚马逊旗下机器人公司,主要产品 Digit 已在仓储场景规模部署。(来源:TechCrunch)
亚洲防务产业链正在重构。 韩日澳印防务预算 2026 年均创新高,弹药和无人机产能从欧洲承包商转向亚太本地供应链。(来源:Fortune)
欧洲极端热浪迫使多座电厂停运。 法国录得 1947 年以来最高气温,AI 数据中心夏季散热问题首次进入欧洲政策讨论。(来源:MIT Technology Review)
