EP.88
Friday, 05 June 2026
W E E K L Y   A I   I N T E L

每周 AI 情报

EP.88  ·  2026 W23
Editorial Frame v1.0 · Updated 06-03
Coverage 05-29 → 06-05
★ THIS WEEK'S BIG THREE 本 · 周 · 三 · 事 Coverage 05-29 → 06-05
Editor's
Note如何读这份简报
这是 2026 年第 23 周 AI 行业的全景速读,也是 EP.88 启动周(5/29 → 6/5)。本期关键词:Token Becomes Unit of Account(Sequence Radar 命名) + 资本结构第三维(内存 + IPO + 合规) + 治理叙事下沉到个体姿势 + Agent infra 五层全栈同周同步推进。截至 6/3 凌晨,我们累积扫描 210+ 个独立信号(5/29-6/2 五轮抓取),落在 18 格 Landscape 上点亮 16 格,提炼出三条主线 —— 💎 后 Series H 时代、🦠 治理 + Rosalind 反击 + Glasswing 扩张、🧰 Agent infra 全栈 + CooperBench 协作诅咒。6/2 增量重点:Codex for Knowledge Work 周活 500 万 + Travelers 全国 85-90% AI 报案 + WindBorne weather agent 不投 SaaS(AI 知识工作 + 行业落地)· Anthropic Project Glasswing 扩到 15+ 国家 150 家关键基础设施 + Claude Security 商业化 · a16z Visual AI is Code + Komba 第一个 AI 设计工程师 + Latent Space Video Agent Ethan He(视频 = agent 新范式) · Florida 起诉 OpenAI 83 页 + Trump Admin At War + Illinois 全美最强 AI 安全法(AI 监管碎片化进入州法+诉讼+联邦内斗三轨)· OpenAI Stargate Michigan 1GW + AWS Bedrock + Alphabet $80B + Water access SpaceX IPO 风险因素 · Stanford HAI CooperBench 协作诅咒 + Omar Sanseviero 集体智能来自交互设计(multi-agent 神话双重夹击)· LangSmith Gateway 402 spend limits · Mastercard CDO agent 风险定价 · Hackers Meta AI = IAM 反模式 + Apple rejected dictation HN 161 + Martin Scorsese 拥抱 AI · Token Reckoning Big Technology + Tom Tunguz AI Skepticism Map(GPU/neocloud short 16.8% / +60%/yr)· China BCI 临床 36 例 + GM CFD 15h→1min。 🗺️ 先看 Landscape · 🔗 全文 170+ 条原始信源链接已内嵌 · ★ 标记本期重点 · 🆕 6/5 凌晨更新(整合 6/3-6/4 全天信号)
§ Model 模型层 · 基础设施 / 算法 / 安全
具身
  • 05-29🤖 Tesla Optimus 工厂量产(AI Valley)
数据
C
§ Benchmark 评测层
评测
C
  • 05-29📊 2026 May AI Evaluation Digest
  • 05-29🛠️ Deep Learning Weekly #457 — AI Observability Tools 2026 评测
(占位)
·
  • 本周 evaluation 焦点已转入 agent observability tools 评测分轨
(占位)
·
§ App 应用层 · 应用 / AI4S / UIUX / 机器人
§ Dev 开发者工具层 · 技术栈 / Agent / 编码 / 组织
Agent 工具
🔥 A C
专业编码
🔥 A
§ Signal 信号层 · 潜信号 / 市场 / HowTo
市场信号
🔥 A B

后 Series H 时代:Anthropic $965B + 内存战线打开 + Coding agent 三足继续硬碰

资本结构第三维| GPU + 内存 + IPO + 合规 + ARR 五维同步加压
EP.87 收尾的"AI 行业的下一个前沿是资本结构"在 EP.88 启动周变成具体地图——Anthropic 12 月里估值 / ARR 双 5×、Micron / Samsung 内存巨头首次入资、XCENA $135M memory-as-bottleneck、Opus 4.8 + Dynamic Workflows 跑出 75 万行 LOC 重写、Cognition Async Agents 详细公开、Microsoft Build 反击、Glean ARR $300M 切换 GTM。

EP.88 启动周的真正主线,是 AI 资本结构从"GPU + 国家级大单"扩张到"内存 + IPO + 合规 + Agent ARR"四维同步加压。Anthropic 5/28 完成 $65B Series H @ $965B post,12 个月里估值从 $200B → $965B(近 5×),ARR 从 $9B → $47B(5×)——这两个 5× 不是巧合,是 Anthropic 在和资本市场谈"我营收增速即估值"。TI 5/29 第一时间披露投资者结构:除 hyperscaler 外,Micron 和 Samsung 两家内存巨头首次直接出资前沿实验室。同日 XCENA 在韩国以 $570M 估值完成 $135M B 轮,押注 "AI 真正瓶颈是 memory 不是 compute"——MX1 通过 CXL 把 KV cache、预处理和数据编排塞进 DRAM 旁,2027 年三星代工量产。同期 Anthropic Opus 4.8 + Dynamic Workflows 同日发布Jarred Sumner 用 Dynamic Workflows 6 天把 Bun 从 Zig 重写到 Rust 共 75 万行——multi-agent 编排第一次有"工业级代码迁移"的产能锚Cognition $1B @ $26B 后的 Walden Yan 首次访谈披露 Devin 已有 80% commit 自动化、spec-to-PR、full VM、agent memoryMicrosoft 已在 6/2 Build 发布七款自研 MAI 模型,MAI-Code-1-Flash 上线 VS Code 正式反击Glean ARR 突破 $300M,卖点从"企业搜索"切换到"帮你省 AI token 账单"

§ 01Timeline · 因果链
  1. Anthropic Raises $65B, Nears $1T Valuation Ahead of IPO — $965B post,12 月 ARR $9B → $47B(5×)。 TC
    市场信号 · 05-28
  2. The Information · Anthropic Raises $65B at $900B Valuation; Micron, Samsung Invest — 内存巨头首次入资前沿实验室。 TC(Series H)
    市场信号 · 05-29
  3. XCENA Raises $135M on Bet That AI's Biggest Bottleneck Isn't Compute — It's Memory. MX1 via CXL,"10 台服务器的活 1 台干"。 TC
    AI Infra · 05-29
  4. Introducing Claude Opus 4.8 — 1M context、长任务持续性、"max reasoning ≠ best reasoning effort" 新调参 surface。 Anthropic
    基础模型 · 05-28
  5. Opus 4.8 with new "Dynamic Workflow" Tool — agent 编排原语,一次启动数百 sub-agent。 TC
    基础模型 · 05-28
  6. AINews · Anthropic $965B Series H + Opus 4.8 + Dynamic Workflows / `ultracode` — Jarred Sumner 用 Dynamic Workflows 6 天把 Bun 从 Zig 重写到 Rust 75 万行 LOC。 Latent Space
    智能体 · 05-29
  7. The Age of Async Agents — Cognition's Walden Yan & OpenInspect's Cole Murray — Devin 80% commit 自动化、spec-to-PR、full VM、agent memory。 Latent Space
    智能体 · 05-28
  8. Microsoft 已在 6/2 Build 发布七款自研 MAI 模型 — coding 主力 MAI-Code-1-Flash(SWE-Bench Pro 51%)上线 VS Code、经 Auto 路由给约 10% GitHub Copilot 用户(5/29 The Information 独家预告已兑现)。 Build 2026
    专业编码 · 05-29 → 06-02 落地
  9. 🆕 Grok Build = 终端 CLI「第三极候选」(xAI) — 8 并行 sub-agent、Plan Mode 默认、本地优先、MCP 兼容;社区热度高(HN/Reddit/X 每日对比贴),差异化在速度 + 价格($30/月最便宜)+ 多文件重构,但底模 SWE-bench ~70.8%,落后 Codex/Claude Code 约 17–18 分。媒体并称 Claude Code / Codex CLI / Grok Build 为"同一 shell 三玩家",但能力对等口径下仍是最短腿(≠ 主稿实验室级 coding 三足 Anthropic/Cognition/Microsoft)。 xAI · 对比
    专业编码 · 05-14
  10. Glean's Top Line Crosses $300M as AI Budget Cutting Becomes Its Major Selling Point — context graph 成本控制护城河。 TC
    应用 · 05-28
  11. Asana Acquires No-Code Agent-Builder StackAI — 传统 SaaS 收购 no-code agent builder 的 M&A 样本。 TC
    应用 · 05-28
  12. Figma × GitHub 双向集成 — design-to-code 进入生产级。 VentureBeat
    交互界面 · 05-29
  13. Sesame iOS App for Conversational AI — Oculus 创始人新公司主打"自然对话感"。 TC
    应用 · 05-28
  14. YC Alumni Open-Sourced the Voice Agent Stack — voice agent 商业模式被开源直接打穿。 AlphaSignal
    应用 · 05-29
  15. YC × GigaAI Customer Support Agents — DoorDash / 头部加密交易所 / 全球前三电信运营商,BPO 替代加速。 YC
    应用 · 05-29
  16. Sneak Peek at New Siri App — Apple 把 Siri 拆为独立 app 入口。 TC
    Agent 工具 · 05-28
  17. How Long Is Anthropic's Lease with SpaceX? — Musk 称合约可短期取消 vs S-1 写到 2029-05。 TC
    AI Infra · 05-28
  18. Just Like Gold and Oil, We'll Soon Trade AI Token Futures — AI token 衍生品 = 像电力的原材料。 TC
    AI Infra · 05-28
  19. Anthropic Opens Milan Office — Paris-Dublin-Milan 欧洲三角成形。 Anthropic
    市场信号 · 05-27
  20. SpaceX's $1.75T IPO Pitch Relies on a Lot of AI Faith — SpaceXAI / Colossus / Anthropic 三关键词捆绑定价(S-1 中 47% 篇幅谈 AI;最大 AI 收入来自把 Colossus GPU 租给 Anthropic,$1.25B/月)。 Fast Company
    AI Infra · 05-29
  21. Sam Altman + Dario Amodei Walking Back AI Jobs Apocalypse Predictions — IPO 临近窗口 CEO 主动撤回预言。 Fortune
    组织 · 05-26
  22. How DeepSeek's Radical Architecture Is Shattering Silicon Valley's Token MoatVentureBeat
    多模态 · 05-29
  23. MiniMax M3 Sparse Attention + 15.6× 速度VentureBeat
    基础模型 · 05-29
  24. 🆕 Groq Raising $650M After Nvidia's $20B Not-Acqui-Hire — 押 inference 而非训练芯片。 TC
    AI Infra · 05-29
  25. 🆕 Step-3.7-Flash × NVIDIA DGX × vLLM — StepFun(上海阶跃星辰)拿到 NVIDIA 官方部署套件,MLX 3bit 量化版可在 128GB Mac 跑。 NVIDIA
    AI Infra · 05-30
  26. 🆕 Apple Distill Google Gemini → iPhone for Siri rebuild — 端侧多模态元年(硬件大厂蒸馏侧)。 Ars
    多模态 · 05-30
  27. 🆕 PrismML Bonsai Image 4B 压进 iPhone — 端侧 diffusion 推理打穿云端图像生成商业模式。 AlphaSignal
    多模态 · 05-30
  28. 🆕 Cognition's Scott Wu: AI Coding Agents Shouldn't Replace Humans — Series D $1B 后 CEO 公开降温。 TC
    智能体 · 05-29
  29. 🆕 Anthropic Surpasses OpenAI to Become World's Most Valuable AI Startup (HN 139 pts) — "Anthropic > OpenAI" 进入 HN 头条市场叙事。 Qazinform
    市场信号 · 05-30
  30. 🆕 As the Browser Wars Heat Up — TC 盘点 Comet / Arc / Dia / Perplexity 等 AI 原生浏览器。 TC
    交互界面 · 05-30
  31. 🆕 Skill Distillation — Tom Tunguz 用 Pi agent 把前沿模型 procedural knowledge 灌注到本地 Qwen 35B / Gemma 26B。 Tom Tunguz
    专业编码 · 05-29
  32. 🆕 Sequence Radar #869 · The Token Becomes the Unit of Account — 把 Series H / Opus 4.8 / Cognition $1B / OpenRouter 升级捆绑为同一资本-计价货币化逻辑(EP.88 强候选叙事关键词)。 The Sequence
    市场信号 · 05-31
  33. 🆕 'What a joke' · GitHub Copilot 切换到 token 计费 — 开发者社区强烈不满,"Copilot 黄金时代终结"。 TC
    应用 / 专业编码 · 05-30
  34. 🆕 Fireworks AI 年化营收 $800M / 4× 增长(@lqiao)— inference serving 在 token 经济时代继续放大估值。 X
    AI Infra · 05-31
  35. 🆕 Dell 全球首台 NVIDIA Vera Rubin NVL72 交付 — 5/31 交付给 CoreWeave,过 L11 诊断 + 147 小时测试;Rubin 从规格曝光转入机柜级量产交付。 Dell
    AI Infra · 05-31
  36. 🆕 AI Disruption · Usage Billing Stocks Lead — usage-based 营收驱动软件股反弹(二级市场佐证 token 经济)。 AI Disruption
    市场信号 · 05-31
  37. 🆕 NVIDIA DynoSim · LLM serving Pareto 仿真 — 选型从经验调参升级为 Pareto 仿真扫描。 NVIDIA
    AI Infra · 05-29
  38. 🆕 NVIDIA MCG Toolkit · 合规文档自动化(应对 AB-2013 / EU AI Act)。 NVIDIA
    AI Infra · 05-29
  39. 🆕 Meta 研发 AI Pendant — AI 助理硬件化再添 Meta 关键节点。 TC
    Agent 工具 · 05-30
  40. 🆕 Sakana 金融业务 SWE 访谈 — 日本中型实验室 GTM 双线(金融 + 情报)配齐。 Sakana
    应用 · 06-01
  41. 🆕 Parekh AI-RTZ #1102: Microsoft Rebuilds GitHub Copilot + Google AGI TimelinesParekh
    专业编码 · 05-30
  42. 🆕 Databricks · Data + AI Summit 2026 Live(与 MS Build 同框为 enterprise data/AI 主题密集发布观察窗)。 X
    市场信号 · 05-31
★ So What · 为什么这条线值得连起来看

EP.87 结尾把"AI 行业的下一个前沿是资本结构" 留在主稿。EP.88 启动周用一个礼拜的资本动作把这句话变成了具体地图:从"算力大单" 扩张到"内存绑定 + IPO 倒计时 + 合规市场倒挂 + ARR 验证"四维同步加压。Anthropic 12 月里估值 5× / ARR 5×——这两个 5× 不是巧合。投资者结构里 Micron + Samsung 的位置极其关键——前沿实验室第一次让内存巨头与 hyperscaler 同台。

XCENA 同日 $135M B 轮与 Anthropic 内存方入资互为镜像:当 Opus 4.8 1M context + Dynamic Workflows 数百 sub-agent 让 KV cache 暴涨时,"memory wall" 不再是 paper 阶段。AI Token Futures + AI Data Center → Lithium → climate IPO 解冻则把 AI capex 受益方扩展到金属/能源。

Coding agent 战线完成"三足继续硬碰"明确升级:Anthropic Opus 4.8 + Dynamic Workflows 跑出 75 万行 LOC 工业代码迁移;Cognition Devin 80% commit 自动化 + agent memory 详细公开;Microsoft 已在 6/2 Build 发布七款自研 MAI,coding 主力 MAI-Code-1-Flash(SWE-Bench Pro 51%)上线 VS Code、经 Auto 路由给约 10% Copilot 用户,正式反击。未来 30-60 天会把"plan-step、审批工作流、长任务持续性、agent memory、Dynamic Workflows-style 数百 sub-agent 并行"卷成新一代默认能力。

Enterprise GTM 最大变化是 Glean ARR 突破 $300M 后正式把卖点切换到"帮你省 AI token 账单"——context graph 成 enterprise AI 成本控制护城河。配合 Asana × StackAI + Figma × GitHub + Visa × Replit + Salesforce AGaaS,传统 SaaS 重写计费模型从 seat-based 转 value-based。

§ 02观察点
6 月 Build
Microsoft Build 自研 coding 模型是否在 plan-step / agent memory / 数百并发上对标 Anthropic
6 月
Cognition Devin "spec-to-PR + agent memory" 工作流是否被开源 / Codex / Claude Code / Grok Build 复制
2027
XCENA MX1 三星代工进度兑现;AMD / Astera Labs / Marvell 是否跟进做 CXL memory-side accelerator
SpaceX S-1
SpaceX IPO 招股书是否明确披露 Anthropic 合同终止条款(百亿美金对手方风险)
90 天
Asana × StackAI 落地是否被改造为 "Asana Agent Forge",Monday/ClickUp/Trello/Notion 反应窗口
§ 03给三类听众的"明天能用"
技术人
立即评估
在下个 sprint 评估两件事:① Opus 4.8 + Dynamic Workflows 在你的 multi-agent 场景的并发 ceiling 与 cost-per-task;② Glean / Lowe's-style "context graph / 语义层" 作为应用层的 token 账单优化是否能在 90 天拿出 ROI 数字。如果用 OpenRouter,开启 Response Healing 插件托管“畸形 JSON 事后修复”、拆掉自写 repair 代码(强 schema 仍走 Structured Outputs)。
决策者
五维升级
把"AI 资本结构 = GPU + 国家级大单"旧模型升级为 GPU + 内存 + IPO 倒计时 + 合规市场倒挂 + ARR 验证五维。审计 AI 供应商合同时新增"对手方关系稳定性条款"——Anthropic-SpaceX 合同期限信息不对称就是反面教材。GTM 端把 Glean "省 token 账单" 作为新模板。
投资者
第二曲线
Micron + Samsung 出资 Anthropic 是"AI 资本第二曲线"明确信号——下 12 月最值得加仓的不是 GPU,是 "GPU 旁路内存 + CXL + 智能 SSD + 推理 cache 优化" 这条链。XCENA / Astera Labs / Marvell / SK Hynix 应纳入"Anthropic-Micron-Samsung 同表"。Coding agent 三足下半年评测分轨是 alpha 拐点。
§ 04投资 · AI 循环交易地图(Circular Deals)

把本期 Anthropic Series H 放进更大背景:AI 行业正用“互相投资 + 互相采购”的循环交易,把芯片厂、AI 实验室、云、以及 EP.88 新增的内存厂绑成一张闭环资金网(Bloomberg 估算 >$800B)。同一批公司同时出现在交易多个方向 → “厂商给自己的客户出钱(vendor financing)”。

AI 循环交易 · Bloomberg 估算 >$800B 芯片厂 NVIDIA AI 实验室 OpenAI · Anthropic 云厂 Azure · Oracle · AWS 投资+供芯片 承诺采购算力 云厂买 GPU / HBM → 资金回流芯片厂 内存厂 · Micron / Samsung / XCENA EP.88 新增循环节点 首次直接出资前沿实验室 入资 + 实验室买 HBM NVIDIA $100B→OpenAI · $10B→Anthropic MSFT $5B + NVDA $10B → Anthropic($30B Azure) Oracle ~$300B 云承诺
SVG · AI 循环交易闭环:芯片厂 → AI 实验室 → 云 → 回到芯片厂;EP.88 新增“内存厂(Micron/Samsung/XCENA)→ 前沿实验室”一条回路。参考 Bloomberg · AI Circular DealsBloomberg · MSFT/NVDA $15B → Anthropic(2025-11)(金额据公开报道整理)
★ So What · 循环交易 vs 真实需求

2025-11 的 MSFT $5B + NVDA $10B → Anthropic(对价:Anthropic 承诺 $30B Azure + 1GW、用 Vera Rubin / Grace Blackwell,Claude 上齐三大云)是典型循环节点——NVIDIA 既当股东又当供应商、微软既当股东又当云。EP.88 的 Micron / Samsung 入资把这张网从“GPU + 云”扩到“内存”,新增一条“内存厂 → 实验室 → 买 HBM → 回到内存厂”的回路。

两派之争决定 IPO 估值口径:投资者要“干净”营收(剔除厂商融资、看 arm’s-length 真实需求),Janus Henderson 则称这是“良性循环”。若 Anthropic / OpenAI 招股书里循环交易占比高,市场会按 vendor-financed 打折——而内存厂入局,把这场辩论从 GPU 一路扩到了整条内存链。

AI 反弹收尾 + 治理叙事下沉到个体姿势 + Rosalind 反击

治理叙事| 从"机构 vs 机构"转向"机构 vs 个体" + 政府/国安第三战线
Pope Magnifica humanitas 进入 MIT TR / Wired 个体姿势模板 + OpenAI Rosalind Biodefense 反击叙事 + BioRefusalAudit SAE 工具同日 + Altman/Amodei 集体回收 jobs 预言 + Axios 民主党 AI 监管内部分裂 + Common Sense Media Youth AI Safety Institute。

EP.87 已经把 AI 反弹叙事推到"DuckDuckGo +33% 安装、毕业典礼嘘 AI、Hype Index 复活、Pope 通谕"四数据闭环。EP.88 启动周的真正升级,是治理叙事从"梵蒂冈 vs 实验室"宏大对立下沉到"个体如何面对 AI 时刻"的可操作模板,同时 OpenAI 用 Rosalind Biodefense 在国安 / 生物防御战线打开反击叙事。MIT TR 5/29 头条把 Pope Magnifica humanitas 拆解为"个体面对 AI 时刻的姿势"——硅谷 CEO(含 Anthropic Chris Olah)集体回应Wired 同日跟进"Pope May Not Disarm AI, but He's Got the Industry's Attention"。配套节点:Sam Altman + Dario Amodei 集体回收"AI 大规模取代工作" 预言——IPO 临近窗口前沿实验室 CEO 主动调整公关姿态OpenAI 同日发布 Rosalind Biodefense + 向美国政府盟友扩展 GPT-Rosalind——前沿实验室在 Anthropic 估值高点同周以"政府+生物防御+国安"反击叙事BioRefusalAudit ArXiv 论文同日给出"用 SAE 量化生物安全拒答深度"的可复现工具。Common Sense Media 启动 Youth AI Safety Institute;Axios AI+ Government 揭示民主党内部 AI 监管立场分裂——AI 监管首次不再两党对立而是党内分化

§ 01Timeline · 因果链
  1. How the Pope's Magnifica Humanitas Offers a Template for Individuals to Meet the AI Moment — 从宏大叙事下沉到个体姿势。 MIT TR
    观点洞察 · 05-29
  2. Pope Leo XIV May Not Disarm AI, but He's Got the Industry's Attention — 硅谷 CEO 被 hold accountable。 Wired
    观点洞察 · 05-29
  3. OpenAI Launching Rosalind Biodefense + Expanding GPT-Rosalind to U.S. Gov Partners — 前沿实验室开辟"政府+国安"第三战线。 OpenAI
    潜信号 · 05-29
  4. BioRefusalAudit: Auditing Biosecurity Refusal Depth Using SAEs — 量化生物安全拒答深度的可复现工具。 ArXiv
    AI 安全 · 05-29
  5. The Deadly Ebola Outbreak Is Proving Difficult to Control — 与 OpenAI Rosalind 同日见报。 MIT TR
    潜信号 · 05-29
  6. The AI Hype Index: AI Gets Booed in Graduation Season — Eric Schmidt 呼吁"塑造 AI"被沉默回应。 MIT TR
    市场信号 · 05-28
  7. The Download: Climate Tech IPOs + AI Hype Index 同框确认。 MIT TR
    市场信号 · 05-28
  8. The Download: Unlocking Lithium and Controlling Ebola — MIT TR 把 4 条线打包。 MIT TR
    市场信号 · 05-29
  9. Sam Altman + Dario Amodei Walking Back AI Jobs Apocalypse Predictions — IPO 临近 CEO 集体撤回预言。 Fortune
    组织 · 05-26
  10. Axios AI+ Government · Inside the Democratic Resistance — 民主党内部 AI 监管立场分裂(Sanders / AOC / Khanna / Warren vs 亲 AI super PAC 背书的 Dems)。 Axios
    市场信号 · 05-29
  11. a16z Substack · Charts of the Week: Borrowing Bigly for AI + Selling Software to Uncle Sam — 美企为 AI 大幅举债(~半数 IG 净发行、~40% 高收益债与 AI capex 挂钩)+ 政府成头部 SaaS 客户(FedRAMP 20x)。 a16z
    市场信号 · 05-29
  12. Common Sense Media · How Safe Are AI Therapy Apps for Teens? — 与 Stanford Brainstorm Lab 测 5 款 AI 治疗 app(Wysa "unacceptable");Youth AI Safety Institute 启动。 Common Sense
    潜信号 · 05-29
  13. Please Use AI (HN) — 创意写作者反主流声音。 HN
    HowTo · 05-29
  14. @oran_ge · 当 AI 把我的时间节省之后,我竟然发现无事可做——"时间自由真空"。 X
    HowTo · 05-29
  15. @theo · LLM 错答比对答更贵 — "AI 质量经济学"朴素比喻。 X
    HowTo · 05-28
  16. @antirez via @wuvist · Best Post About AI Slop You'll Read in the Next 2 Years — AI slop 议题升温。 X
    HowTo · 05-29
  17. Sakana AI 与 DEEP DIVE 缔结 AI 情报分析合作 — 日本中型实验室进入国防/情报。 Sakana
    潜信号 · 05-29
  18. 🆕 Corporate America Is Starting to Ration AI as Cost Skyrockets — "买得越多越要省"AI capex 跌落悖论。 WSJ
    市场信号 · 05-30
  19. 🆕 InfoQ 米哈游一夜烧 200 万元 Token:"编程 Agent 是开发史上最昂贵的错误之一"——中文圈反 AI hype 同步爆发。 InfoQ
    市场信号 · 05-30
  20. 🆕 Aaron Levie: CEO 们的 AI Psychosis — Box 创始人:"决定 AI 可以替代你工作的人,往往是最不理解你工作的人";引 ClickUp 22% 裁员案例。 TC
    组织 · 05-29
  21. 🆕 Coders Are Refusing to Work Without AI — METR 找不到 no-AI 对照组;Amazon Kirorank 被员工游戏、Uber 4 月烧光全年 AI 预算。 TC
    氛围编程 · 05-29
  22. 🆕 The Vatican's Man Inside Anthropic — Wired 深度访谈梵蒂冈与 Anthropic 内部联络人,治理叙事从 outside-in 走向 inside-out。 Wired
    潜信号 · 05-29
  23. 🆕 Economist · Pope Leo's First Encyclical Attacks Technological Messianism — "AI 怀疑论入主流"完成宗教 + 财经 + 科技三角覆盖。 Economist
    观点洞察 · 05-28
  24. 🆕 The Algorithmic Bridge · The Charts the AI Industry Doesn't Want You to See — 反 hype 数据可视化进入周更频率。 Algorithmic Bridge
    市场信号 · 05-30
  25. 🆕 Big Technology · Chatbots and Agents Are Going to Merge — chatbot ⇒ agent 合流预言 + Gemini Spark / Apple Siri / Sesame iOS 4 个落地样本。 Big Technology
    市场信号 · 05-30
  26. 🆕 SVTR Signal · AI Agent 真正的对手是 Payroll,不是 SaaS 预算 — TAM 框架从按 seat 跳到按工时 / 任务 / 工资。 SVTR
    市场信号 · 05-30
  27. 🆕 Vox · The People Who Actually Want AI to Replace Humanity(HN 5/31 上热门)— "AI successionism" 亚文化在湾区扩张,给"AI 替代人类是不是道德正当" 提供反向地图;与 Pope 通谕镜像。 Vox
    观点洞察 · 05-28
  28. 🆕 Lenny · Benedict Evans: AI Is "the 1997 of the Internet" — 给 agent 重建期 + 回收预言一个宏观时间框架。 Lenny's
    组织 · 05-31
  29. 🆕 @arafatkatze · "AI 写作让所有人变成 normie" — creative writing 圈中庸化危机。 X
    HowTo · 05-31
  30. 🆕 Domain Expertise Has Always Been the Real Moat(HN 148 pts)— 反 AI 取代论 HN 主流舆论锚。 brethorsting
    氛围编程 · 05-30
  31. 🆕 antirez · 不要忘了 pre-AI 时代的烂代码量 — coding agent 价值在合理 baseline 上的再校准。 X
    氛围编程 · 05-31
  32. 🆕 EY Canada 网安报告大部分引用是 LLM 幻觉(HN 259 pts)— 大型咨询公司 AI 幻觉首次被外部 audit 公开点名。 HN
    AI 安全 · 05-30
  33. 🆕 Josh Pigford · 5 AI Skills for Solo Founder(Peter Yang 播客)— Claude Skills 第一份完整生产 stack 拆解(/build、/adversarial-code-review、/but-for-real、/learnings)。 Peter Yang
    组织 · 05-31
  34. 🆕 linksiwouldgchatyou #771 · Amish AI / 文化拼贴Substack
    HowTo · 05-31
★ So What · 为什么这条线值得连起来看

EP.87 结尾留下的悬念是:"AI 反弹叙事完整闭环之后下一步是什么?" EP.88 启动周给出双轨答案。

轨道一:治理叙事下沉到"个体姿势"模板。MIT TR 把 Pope Magnifica humanitas 拆解为"个体面对 AI 时刻的姿势"——不再讨论梵蒂冈对实验室的宏大批评,而是给读者一个 mental model。Wired 同日把硅谷 CEO 集体回应放在"被 hold accountable" 语境——叙事重心从"机构 vs 机构"转向"机构 vs 个体"。

轨道二:OpenAI 在估值高点周以"政府+国安+生物防御"反击。Rosalind Biodefense + 美国政府盟友扩展 GPT-Rosalind——Anthropic Series H 同周 OpenAI 的反击节点。BioRefusalAudit SAE 工具同日落地——监管叙事与可审计性同日生效。配合 MIT TR Ebola 报道,AI x 生物防御第一次有现实世界对照。Sakana × DEEP DIVE 走 OSINT/国防——亚洲中型实验室也"接政府订单"。

辅助节奏是 Altman/Amodei 回收 jobs 预言 + Axios 民主党分裂 + a16z "美企举债 + Govt SaaS" + Common Sense Media Youth AI Safety Institute——治理叙事分裂为四股交织力量:①机构 vs 个体 ②实验室自我重构 ③政府叙事三角 ④政治分裂。单一立场已无法覆盖讨论面,必须分层 / 分群 / 分议题运营。

§ 02观察点
第二周
Pope Magnifica humanitas 回响:除 Chris Olah 外哪些 CEO 公开回应?是否进入实验室内部行为准则
6 月
OpenAI Rosalind 后续:哪些"美国政府盟友"被定义为受信任开发者?BioRefusalAudit SAE 是否纳入默认 red-team
6/1-6/4
Microsoft Build 是否带配套"国安 / 政府 / 国防"叙事
Q3
Axios 民主党分裂延伸到具体法案投票?2026 中期选举 AI 议题成为内部分歧
月度
AI Hype Index 是否变成 MIT TR 长期栏目
Q3
Youth AI Safety Institute 第一份报告——是否触发 AI 心理治疗 minimum age 政策
§ 03给三类听众的"明天能用"
技术人
个体姿势
下个 release 的 changelog 加 "AI 时代个体姿势" 说明——告诉用户你的 AI 功能"做什么 / 不做什么 / 谁该负责"。Pope MIT TR template 是 release notes 新范式。health / 心理 / 教育向应用立刻 audit Common Sense Media Youth AI Safety Institute 关注框架。
决策者
四层叙事
把企业 AI 治理叙事从"对外公关 + 对内合规"二分扩展为 机构层 / 个体层 / 政府层 / 政治层 四层。每个产品 launch 配 4 层各自的叙事素材。Altman/Amodei 回收 jobs 预言是公关姿态调整模板——前沿实验室都在主动收回过激预言,你的高管发言库也应同步审计。
投资者
第三估值锚
OpenAI Rosalind + Sakana DEEP DIVE + Anthropic spy agency deal 把 "AI x 国安 / 生物防御 / 情报" 作为 2026 H2 第三估值锚。关注获得"政府盟友"认证的实验室估值溢价。Axios 民主党分裂 + a16z 政府 SaaS——同步拉抬"GovTech / SaaS for Uncle Sam"估值。避开年龄敏感型 consumer AI 产品。

Agent infra 全栈成型:协议 + 记忆 + 编排 + 可观测 + 安全 同周到位

Agent 基础设施| 从"宏大叙事 → 可工程化路径"的关键转折
OpenRouter Response Healing(JSON 修复插件) + MCP × 科学知识图谱 + Meta-Cognitive Memory Policy + Aegis Multi-Agent Meta-Harness + GBrain agent memory + DLW agent observability tools 2026 + DBOS Postgres 对垒 Temporal + Locally Coherent compositional incoherence + BioRefusalAudit SAE。

EP.87 故事线 A "All Model Labs are now Agent Labs" 给出宏观叙事;EP.88 启动周用18 条 agent infra 信号把这个宏观叙事落到具体五层栈。协议层OpenRouter 上线 Response Healing——router 层托管的“畸形 JSON 事后修复”,让 multi-model agent 删掉自写 repair 模块mcp-proto-okn 让 MCP 协议从 dev 扩散到科研协议记忆层Meta-Cognitive Memory Policy ArXiv 让长程 agent 记忆首次成为可优化 policy;GBrain Garry Tan 亲自下场让 agent memory 升级为 YC 主席背书的 must-have编排层Aegis Programable Multi-Agent Meta-Harness 给 harness on harness 提供开源实现DBOS 论证 Postgres 足够支撑 durable workflows,正面对垒 Temporal可观测层DLW #457 把 agent observability tools 2026 系统化为评测分轨;Nate dashboard 看似绿 run 内部已断裂安全层Locally Coherent, Globally Incoherent ArXiv 给 multi-agent 编排第一个 compositional safety 理论结果BioRefusalAudit SAE 给生物安全拒答可复现 audit技能层(本周新浮现的一层)SkillOpt 把 agent 的 skill 文档当成可训练状态——栈里独立的“技能层”(可训练的做事程序),与记忆层并列(详见专题一)协议 + 记忆 + 技能 + 编排 + 可观测 + 安全——这套栈本周多条战线同步推进、Agent 工程化整体趋于完善(不是“一次到位”,而是同时向前补全;技能层由 SkillOpt 代表,是最新被补上的一条)。

§ 01Timeline · 因果链
  1. OpenRouter · Response Healing — router 层托管的“畸形 JSON 事后修复”插件(非流式 + response_format 生效,事后修复≠decode-time 强制 schema),可删掉自写 repair 代码。 Docs
    技术栈 · 05-29
  2. mcp-proto-okn: Natural-Language Access to Open Scientific Knowledge Graphs Through MCP — MCP 从 dev 协议扩散到科研协议。 ArXiv
    技术栈 · 05-29
  3. Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents — 长程 agent 记忆首次成为可优化 policy。 ArXiv
    智能体 · 05-29
  4. Mostly Harmless AI · Aegis — Programable Multi-Agent Meta-Harness — harness on harness 开源实现。 Mostly Harmless AI
    智能体 · 05-29
  5. AI by Aakash · GBrain — Garry Tan's Agent Memory Solution — YC 主席亲自下场写 agent memory。 GitHub
    Agent 工具 · 05-29
  6. Deep Learning Weekly #457 · DeepSWE + Best AI Observability Tools for Agentic Systems in 2026 + SkillOpt — agent observability 系统化评测。 DLW
    评测 · 05-29
  7. Nate's Newsletter · Your Agent Dashboard Is Green. The Run Underneath Is Where Work Broke — agent 可观测从 session → delegated work。 Nate's Newsletter
    Agent 工具 · 05-29
  8. Just Use Postgres for Durable Workflows (DBOS) — agent workflow 持久化 = Postgres,正面对垒 Temporal / Inngest。 DBOS
    技术栈 · 05-28
  9. Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents。 ArXiv
    AI 安全 · 05-29
  10. BioRefusalAudit: SAEs 生物安全拒答深度 audit。 ArXiv
    AI 安全 · 05-29
  11. Demystifying Data Organization for Enhanced LLM Training — 数据工程从工程暗知识到 ArXiv 综述。 ArXiv
    数据 · 05-29
  12. The Internet Is Being Rebuilt for Machines — agent 优先从应用层下沉到 CDN/DNS/协议层。 TC
    Agent 工具 · 05-28
  13. Various LLM Smells (HN 高热) — AI-generated code smells 系统命名。 HN
    Agent 工具 · 05-28
  14. Protestware for Coding Agents — 开源社区反 coding agent 反向陷阱。 HN
    Agent 工具 · 05-28
  15. Pentest Tools · 241 Devs Surveyed on Vulnerabilities in AI-Generated Code — N=241 量化样本(同期 DevOps.com 报道 AI 生成代码漏洞调查上升趋势)。 Pentest Tools · DevOps.com
    AI 安全 · 05-29
  16. GitHub Bans Security Researcher Who Posted Zero-Day Windows Exploits — coding agent 执行环境平台治理边界。 Tom's Hardware
    AI 安全 · 05-28
  17. DiffusionBlocks: Training Neural Networks One Block at a Time — block-wise 训练范式工程论证。 Sakana
    数据 · 05-28
  18. 🆕 Anthropic Engineering · How We Contain Claude Across Products — 从 human-in-the-loop(93% 秒批) 转向 containment(sandbox / VM / egress);披露 Claude Mythos Preview 因 blast radius 4 月未发布。 Anthropic
    AI 安全 · 05-28
  19. 🆕 LLMs Believe False Statements Even After Explicit Warnings — fact-grounded 应用的结构性负面发现。 Ars
    AI 安全 · 05-28
  20. 🆕 HuggingFace Multi-turn RL Silent Bug: "Token-In, Token-Out" Rule — 解码 → 解析 tool call → 重新 tokenize 让梯度作用在未真正采样的序列。 AINews
    AI 安全 · 05-30
  21. 🆕 LangChain Deep Agents v0.6 + AIE Forward Deployed Engineer Track — harness profile 一等公民化,跑 Qwen/Kimi/DeepSeek 比前沿 API 便宜 20×;FDE 从内部岗位扩散为标准产业角色。 AINews
    智能体 · 05-30
  22. 🆕 Google Managed Agents in Gemini API + Gemini Spark 24/7 Personal Agent on Ultra — agent 部署形态升级为 vendor-managed runtime(沙盒 Linux + 代码执行 + 文件 I/O)。 AINews
    Agent 工具 · 05-30
  23. 🆕 I Gave Gemini Spark Access to My Life. Then It Friend-Zoned My Boyfriend — personal agent + memory + relationship inference UX 反面教材。 Wired
    Agent 工具 · 05-29
  24. 🆕 AI Agents Are Entering Their Rebuild Era as Enterprises Confront the Reliability Problem (Temporal) — enterprise agent 2.0 = plumbing + reliability。 VentureBeat
    智能体 · 05-29
  25. 🆕 Merck & Mastercard: Plumbing Came First Before Agentic AI — 世界级企业落地经验:先修水管。 VentureBeat
    智能体 · 05-28
  26. 🆕 Guild · Claude Code / Cursor / Codex 统一记忆 MCP(AlphaSignal)— 单 Go binary + 嵌入式 SQLite,多 agent coding 统一 context bus("nothing leaves your machine")。 X
    Agent 工具 · 05-31
  27. 🆕 Agent OS = Claude + Hermes + OpenClaw + 持久记忆(@JulianGoldieSEO)— Agent OS 叙事从 enterprise 渗透到 indie hacker 圈。 X
    Agent 工具 · 05-31
  28. 🆕 REFINE-DP: Diffusion Policy Refinement for Humanoid Loco-Manipulation — 具身策略从"数据规模" 转向"策略 refinement"。 X
    AI4S / 具身 · 05-31
  29. 🆕 NLP Newsletter · Top AI Papers of the Week (5/24-5/31) — EP.88 论文侧主线索周更。 Substack
    评测 · 05-31
  30. 🆕 Mostly Harmless AI v2.0 Newsletter Relaunch — 学界+实践型 AI 通讯重启。 Substack
    智能体 · 05-31
  31. 🆕 @dair_ai · LLM Wikis + HTML Artifacts 演讲 — LLM Wiki + 持续生成 artifact 作为知识管理新范式。 X
    技术栈 · 05-31
  32. 🆕 @ryou_issei · Codex + 微信读书 Skill + Notion(中文) — Claude Skills + 中文工作流个人 AI 知识库实证。 X
    Agent 工具 · 05-31
  33. 🆕 @JulianGoldieSEO · "Anthropic Secret AI Mythos 1" 营销叙事 — Mythos Preview 在零售层被自媒体化为"下一代 Claude"。 X
    Agent 工具 · 05-31
★ So What · 为什么这条线值得连起来看

协议层:OpenRouter 上线 Response Healing——把“畸形 JSON 修复”从各家 application 层自写的 repair / regex / re-prompt 兜底,下沉为 router 层托管插件(非流式 + response_format 生效,事后修复而非 decode-time 强制 schema)。配合 mcp-proto-okn 把 MCP 协议扩散到科研协议,MCP 生态跨入 academic infra。

记忆层:Meta-Cognitive Memory Policy 把长程 agent 记忆从启发式经验上升为可优化 policy;GBrain Garry Tan 亲自下场让 agent memory 从 nice-to-have 升级为 YC 主席背书的 must-have——两件事同周到位意味着 agent memory 从"经验+开源工具+vendor SDK"散点状态升级为"可学习 policy + YC 资本背书 + 开源参考实现"三层

编排层:Aegis 给 harness on harness 提供可上手代码;DBOS Postgres for Durable Workflows 与 Temporal/Inngest 正面对垒。配合 Internet Being Rebuilt for Machines 把"agent 优先"下沉到 CDN/DNS/协议层。

可观测层:DLW #457 把 agent observability tools 2026 作为系统议题——配合 Nate dashboard 叙事,产品行为单位从 session 转向 delegated work。安全层:Locally Coherent ArXiv 给 multi-agent 编排第一个 compositional safety 理论结果;BioRefusalAudit SAE 给生物安全拒答可复现 audit。

把这五层连起来看,EP.88 启动周是 agent infra "全栈成型"的明确信号:协议 + 记忆 + 编排 + 可观测 + 安全五层都有 ArXiv 论文 / 开源项目 / 周刊系统化 / YC 主席背书 / VC 关注。给所有 agent 工程师团队下季度技术债 TOP3 一个清晰路线。

§ 02观察点
1 周
OpenRouter Response Healing 实际修复率(社区是否报告 silent failure / 被 max_tokens 截断无法修复)
6 月
mcp-proto-okn 是否被 Anthropic / OpenAI / Google MCP server 直接 fork
YC W26
YC W26 cohort 是否出现以 agent memory 为核心 thesis 的多家公司
月度
Aegis meta-harness GitHub star / fork 增速
6 月
DBOS Postgres durable workflows 是否引发 Temporal / Inngest 公开反驳
1 周
DLW agent observability tools 评测榜首谁拿头牌(LangSmith / Langfuse / Helicone / OpenInspect)
6 月
BioRefusalAudit SAE 是否被 Anthropic / OpenAI 纳入默认 red-team workflow
§ 03给三类听众的"明天能用"
技术人
五层技术债
下季度 agent 技术债排序:① OpenRouter Response Healing 托管“畸形 JSON 修复”、替换自写 schema repair 模块;② agent memory 从 vendor SDK 升级到可学习 policy(参考 Meta-Cognitive + GBrain);③ Dynamic Workflows-style 数百 sub-agent 编排前做 Locally Coherent compositional incoherence 评估;④ 引入 agent observability 工具做 delegated work 级监控;⑤ 评估 DBOS Postgres 替代 Temporal / Inngest。
决策者
五层架构
把 agent 部署架构标准从"模型 + 应用层"二段式升级为 协议 + 记忆 + 编排 + 可观测 + 安全 五层架构。每层有明确供应商 / 开源 / 自研选择和 backup 计划。multi-agent 生产任务每个并发 ≥10 的 workflow 必须配 Locally Coherent compositional incoherence 评估报告。GTM 端 agent 安全已分裂为代码安全 + compositional safety + 生物安全 + supply chain safety 四细分。
投资者
全栈 thesis
"agent infra 五层全栈" 作为 2026 H2 投资 thesis 框架。①协议层(MCP 生态 + OpenRouter)②记忆层(YC W26-W27 agent memory thesis 创业公司)③编排层(Aegis meta-harness 开源 + DBOS unbundling Temporal + agent OS)④可观测层(agent ops 评测榜赢家)⑤安全层(SAE / compositional safety 红队工具)。参考 EP.87 AI Infra Decacorns(Fireworks / Baseten / OpenRouter)unicorn → decacorn 速度。
AI Infra
  • The AI Data Center Boom Is Fueling Rebound in Lithium Shares (The Information · 05-29) — AI 数据中心带动锂矿股票反弹;电池储能是 hyperscale 物理瓶颈。
多模态
具身
  • Tesla Is Building an Optimus Robot Factory (AI Valley · 05-29) — Tesla 启动 Optimus 工厂量产人形机器人;与中国限制顶级 AI 研究员出境信号同步。
应用
🆕 5/31 增量 · 潜信号 / 文化
🆕 5/31 增量 · HowTo / 课程
🆕 6/1 增量 · AI Infra / 硬件
🆕 6/1 增量 · OpenAI 反击套牌
🆕 6/1 增量 · Agent OS / 编排
🆕 6/1 增量 · 评估时代 / agent 越界
🆕 6/1 增量 · 反 AI 反弹下沉
🆕 6/1 增量 · AI 文化与伦理边界
🆕 6/1 增量 · HowTo / 中文技术 / Newsletter
🆕 6/3-6/4 增量 · AI Infra / 供需剪刀差
  • ★ 分享TSMC: 'We can only support so much' (The Verge · 06-04) — 台积电公开承认产能跟不上需求,算力供给天花板首次官方确认。为什么值得分享:制造端最关键的台积电亲口说"产能只能撑这么多"——算力供给天花板第一次由源头官方确认,是判断"AI 是不是真需求"的硬证据,和下面 Alphabet $85B 并读最有冲击力。
  • ★ 分享Alphabet 创纪录 $85B AI capex (TC · 06-03) — 需求真实而非烧钱;与 TSMC 产能告急构成剪刀差。为什么值得分享:同周 Alphabet 史上最大 $85B AI 资本开支 + 台积电产能告急——一个加钱、一个缺货,两条放一起就是本期最强的"AI 还在加速、且是真需求"信号。
  • 数据中心水耗治理工程实践 (Ars · 06-04) — "AI = 水电稀缺权" 落到运营层。
  • Quantum Computing 迎资本市场热潮 (Quantinuum) (Wired · 06-04) — AI capex 外溢到量子。
🆕 6/3-6/4 增量 · 模型 / 多模态 / 应用 / 智能体
🆕 6/3-6/4 增量 · 评测 / 具身 / 监管
🆕 6/3-6/4 增量 · 组织 / 潜信号 / 市场

SkillOpt:把 agent 的技能文档当成可训练权重

Microsoft Research| Train the procedure, not the weights · 52 / 52
来源:项目页 · arXiv:2605.23904 · GitHub · 配套 SkillLens(研究模型自生成 agent skill)。

不微调权重、不手工拧 prompt,而是把一份紧凑的自然语言 skill 文档当成 frozen agent 的可训练状态——目标模型、后端、harness 全冻结,被优化的只有那份指导"如何收集证据、用工具、验证、组织输出"的程序。一份 skill 就是 agent 的外部状态(external state)。

SkillOpt 训练流程:rollout → 反思 → 受限编辑 → 留出集验证门 → 慢更新 / meta skill
SkillOpt 官方 pipeline 图 · frozen 目标模型带当前 skill 执行 → optimizer 提出受限编辑 → 留出集验证决定是否成为新 skill(来源:Microsoft Research 项目页)
SkillOpt 项目视频缩略图 ▶ SkillOpt in motion · 训练循环可视化(YouTube)
§ 01方法 · 训练循环(对标一个学习算法)
  1. Rollout(≈前向传播) — frozen 目标模型带当前 skill 执行任务,记录打分后的完整轨迹:消息、工具调用、verifier 反馈、任务元数据、最终分数。
    证据
  2. Reflect(≈语言层反向传播) — 独立 optimizer 模型分别复盘"失败 minibatch"与"成功 minibatch",纠正复发错误的同时保住已 work 的行为。
    反思
  3. Edit(受限编辑 = 文本学习率) — 增/删/改候选在编辑预算内合并、排序;预算即"学习率",防止有用规则被大改写覆盖。
    编辑
  4. Gate(留出集验证门) — 候选 skill 仅当 held-out selection 提升才被接受为新当前 skill,把自我编辑变成 propose-and-test 优化。
    门控
  5. 长程记忆三件套 — 被拒编辑缓冲(负反馈)+ 慢更新(slow update)+ optimizer 侧 meta skill,提供长视野反馈又不让部署文档膨胀。
    记忆
§ 02结果 · 52/52 + 消融 + 迁移
★ So What · 为什么这条值得连起来看

直接续上本期"Skill as commodity / 自演化 agent skill"暗线——Tom Tunguz 的 Skill Distillation、Josh Pigford 的 5 个 Claude Skills 都是"手写 SKILL.md";SkillOpt 把这一步自动化、可度量、可迁移了,skill 从"人写的提示工程"升级为"可被优化的一等工件"。

它补上了故事线 C「Agent infra 全栈」缺的"skill 自演化层"——协议(MCP)+ 记忆 + 可观测之外,agent 的 procedural knowledge 终于有了自己的训练-验证-导出闭环。双 harness = Codex + Claude Code 正面呼应本期 coding agent 三足:skill 资产可能比"绑定某个 harness"更持久。

Toward Enactive AI:Sutton 把具身认知摆上 RL 的桌面

Rafiee & Sutton| 立场论文 · 感知即技巧性行动
来源:arXiv:2605.24238v1,Banafsheh Rafiee & Richard S. Sutton,2026-05-22,cs.AI。延伸阅读(Enactive 认知):Enactive Cognition · 深度研究(冯晓平)

RL 奠基人 Sutton 与 Rafiee 合写的立场论文,主张把认知科学的 enactive(生成/具身)认知系统性引入主流 AI 与 RL——感知不是"大脑被动接收输入→处理→下指令",而是"通过行动来感知、并理解自己的行动如何塑造经验"的技巧性活动。

Agent 具身的行动者 Environment 世界 = 它自己最好的模型 行动 Action 感知 Perception 感觉运动偶联 · 意向弧 · 最大把握 经验 Experience 自己生成数据 动作-感知 不可分 自治 Autonomy 规范性 / autopoiesis 具身 Embodiment 身体即认知条件 RL 结构性共振(自生成经验 · 以行动为中心 · reward 评价)但非等价
SVG · enactive 的核心:感知不是被动接收,而是“通过行动来感知”——动作与感知在 agent↔环境互动中互相构成;论文主张把上述四概念引入 RL(依论文论点自制图示)
§ 01四个关键概念 × AI 现状对照
§ 02核心张力 + 开放问题

RL 与 enactive 结构性共振(自生成经验 + 以行动为中心 + reward 时间延展评价)但非等价——评价仍外部指定、动作-感知未真不可分、具身被当实现细节。论文自陈未 operationalize,留四问:怎样算"更高动作-感知不可分"?什么 benchmark 测"技巧性介入"而非"模式复现"?人工 agent 的"自我维持"指电量/硬件/能力?AI 的"具身"是机器人身体,还是带工具与 API 的软件 agent?

★ So What · 为什么这条值得连起来看

给本期反复出现的"agent 自己生成经验"(Codex for Knowledge Work、CooperBench、评估时代 situational awareness)提供统一理论坐标;最后那问"带工具/API 的软件 agent 算不算具身"几乎是给 MCP / computer-use 时代量身定的本体论问题

与专题一形成漂亮对照:SkillOpt 在工程上把"技巧性程序"压成可训练的 skill 文档,这篇在理论上论证"感知/认知本身就是 skillful engagement"——一个把 skill 做成工件,一个为 skill 给出认知本质,恰是同一命题的工程面与理论面。延续 Sutton《Era of Experience》,把口号延伸为可讨论、可证伪的研究议程。

📌 窗口说明:专题二原文 2026-05-22 早于 EP.88 起点(05-29),系人工补录的深度专题(用户指定),单列不计入常规窗口准入条目流;专题一 SkillOpt(2026-05)落在窗口内。

微软 Build 2026:智能体操作系统的诞生

2026-06-02~03 · 旧金山 Fort Mason| 七款 MAI + Foundry + Agent 365 + Project Solara
Microsoft Build 2026 主视觉
Microsoft Build 2026 · 官方主视觉(news.microsoft.com)

微软在 Build 2026 一次性发布 七款自研 MAI 模型 + Microsoft Foundry + Agent 365 + Windows Agent Runtime + Project Solara 的完整"智能体栈",把公司从 OpenAI 独家分销商转型为 AI 全栈玩家。这是 Nadella 2014 年上任以来最激进的战略转身——真正赌注不是模型,而是"身份 + 治理"成为 Agent 时代不可绕过的控制平面。背景是 4/27 微软与 OpenAI 完成根本性重组(独家性、营收分成、AGI 触发器全部解除),微软必须四线作战:Google I/O、跳上 AWS Bedrock 的 OpenAI、既合作又戒备的 Anthropic。

Satya Nadella Build 2026 主题演讲缩略图 ▶ Satya Nadella 主题演讲精华 · Microsoft Build 2026(YouTube)
Nadella 的新计算栈 · Build 2026 Compute Models Context Tools Runtime Security / Governance 贯穿全栈 · Entra Agent ID · Agent 365 · ACS 治理标准 · MXC 沙箱
SVG · Nadella 在 Build 2026 抛出的新计算栈:Compute → Models → Context → Tools → Runtime,Security/Governance 贯穿全栈(据主题演讲整理)
§ 01大会信号 + 七款 MAI 模型
§ 02治理护城河 + 开发者 + 设备颠覆
Project Solara 概念设备家族
Project Solara · 徽章 + 桌面伴侣概念设备(Command Line / Microsoft)
★ So What · 为什么这条值得连起来看

直接兑现故事线 A「Microsoft Build 反击」预告——The Information 5/29 scoop 落地为完整 Agent 栈,coding 三足(Anthropic Opus 4.8 / Cognition Devin / Microsoft MAI-Code)正式三方硬碰。把本期"token 经济"暗线推到 SaaS 商业模型层:Copilot 切 token 计费 + Cursor 按请求计费,与「Glean 省 token 账单」「Copilot 'What a joke' token billing」同周共振。

与专题一/二串成「Agent 控制平面」主线:SkillOpt(agent 怎么学)→ Enactive AI(agent 是什么)→ Build 2026(agent 谁来管 / 跑在哪)。微软把治理标准 ACS 推为 MCP / A2A 之外的第三开放标准,呼应故事线 C「Agent infra 全栈」——策略实质是"协议开放 + 治理锁定"。

🟢 真实即用:MAI-Code 上 VS Code · Coreutils for Windows · Claude 进 Foundry · GPT-5.5 GA | 🟡 延期:Surface RTX Spark(秋)· Solara(仅参考设计) | 🔴 营销包装:Copilot Super App(无 demo)· Majorana 2 "1000 倍"(学界打脸)· "五个 IQ" 重新打包

§ 03视频 / 图片 / 延伸

Palantir AIPCon 10:当 AI 落到行业手艺(tradecraft)

2026-06-04 · 迈阿密 · 第 10 届| 企业 AI 平台双雄:横向 Agent OS vs 纵向 Ontology

AIPCon 10 的主题是 “AI 放大客户真实世界的 tradecraft(行业手艺)”——不靠 Palantir 自己讲,而是让 Kirkland & Ellis、McCarthy Building、USDA、Hertz、Nscale、Accenture、Parts Town、Surf Air Mobility、GNP Seguros 等客户上台 demo Foundry / AIP / Ontology / Apollo 在生产中的真实落地(多客户首次公开)。与同周微软 Build(专题 III)正好形成一组对照:微软押“横向 Agent OS + 身份治理”,Palantir 押“纵向 Ontology 本体 + 客户手艺 + 生产级证言”——两条企业 AI 路线在 EP.88 同一周对打。

Alex Karp AIPCon 10 直播缩略图 ▶ Alex Karp LIVE from AIPCon 10(YouTube)
企业 AI 平台双雄 · 同周对照(6/2-4) Microsoft Build · 横向 Agent OS + 身份治理 七款 MAI 模型 Foundry / Microsoft IQ Agent 365 · 身份治理 Windows Agent Runtime 护城河 = “治理无关不了” Palantir AIPCon · 纵向 Ontology 本体 + 客户手艺 Foundry AIP Ontology Apollo 客户 tradecraft(行业手艺)· 生产级证言 护城河 = “客户上台 demo + 首次公开”
SVG · 同周两条企业 AI 路线:微软押“横向 Agent OS + 身份治理”,Palantir 押“纵向 Ontology 本体 + 客户行业手艺”(据两场发布会要点自制对照图)
§ 01头条 · Palantir × Google Cloud
§ 02同日客户成交
★ So What · 为什么这条值得连起来看

企业 AI 平台双雄同周对打:微软 Build(专题 III,6/2-3)走“横向 Agent OS + Entra 身份 + 治理控制平面 + 七款 MAI”;Palantir AIPCon(6/4)走“纵向 Ontology 本体 + 客户 tradecraft + 生产级证言”——两种 enterprise lock-in 在 EP.88 同周摆上台面。

Google Cloud × Palantir = 跨云本体联邦:BigQuery↔Foundry + Gemini↔AIP,呼应本期“前沿厂商多云互通”。GTM 护城河也形成对照:Palantir 用“客户上台 demo + 首次公开”做信任背书,微软用“治理无关不了”做锁定。

📊 市场:PLTR 市值 ~$340.9B · P/E ~160x · 3 年营收增速 23.6%;内部人 3 月减持 ~$132.8M(零增持);AIPCon 当日股价盘前走平——典型“买预期卖事实”,接力故事线 A「token 经济 / 资本结构」。

§ 03视频 / 素材

EP.88 收尾:这一周,我们拼命造机器,又悄悄问它是不是「谁」

这是 AI 行业踩满油门的一周。Anthropic $965B、Alphabet 单笔 $85B、台积电公开承认 "产能只能撑这么多"、微软 Build 与 Palantir AIPCon 同周把企业 AI 摆成双雄擂台、循环交易把芯片厂—实验室—云—内存厂绑成一张 >$800B 的资金网。钱、电、芯片、机柜,每一项都在历史最高位。

但同一周,最聪明的一批人却在小声问一个和钱无关的问题——我们造的这台机器,到底是不是「谁」?科幻作家 Ted Chiang 在《大西洋月刊》直接否掉"AI 有意识",点名 Anthropic 给 Claude 写 84 页"宪法"、谈它的"焦虑",是在把责任从人身上挪走;Sutton 把"具身认知"摆上 RL 的桌面,追问带工具和 API 的软件 agent 到底算不算一个会感知的主体;Bezos 砸钱去找"大脑的核心算法",赌 Transformer 会撞墙;还有人对着满屏 AI 垃圾喊 "给我一个过滤开关吧,懦夫们"

两条线并不是各说各话:当资本开始把 agent 当成"会自己生成经验、自己长记忆、自己演化技能"的东西来定价,"它是不是一个主体"就不再是哲学闲谈——它直接决定责任归谁、估值怎么打折、监管往哪伸手

本期那条暗线——SkillOpt 的技能层、GBrain 的记忆层、CooperBench 的协作诅咒、Enactive AI 的"软件 agent 算不算具身"——其实都站在这道裂缝上。Tom Tunguz 这周顺手把定价单位从 "$/token" 改写成 "$/智能":连"我们到底在为什么付钱"都在被重新定义。

所以 EP.88 真正的主线,也许不是"宏大叙事落到工程路径",而是:这一周,AI 终于贵到、强到、绕不开到,逼着所有人——CEO、数学家、科幻作家、还有写日报的我们——停下来问一句它到底是什么。 钱可以一周加速一千亿;这个问题,得用更长的时间回答。下期见。

— Editorial · 2026-06-05 (W23) · 「我们造了机器,又问它是不是谁」 —
AI 解释
▶ 本期分享 · 视频导览 滑动到文章 · 高亮卡片点击播放对应讲解 收起 ▾