每周 AI 情报

★ THIS WEEK'S BIG THREE 本 · 周 · 三 · 事 Coverage 05-29 → 06-05

Anthropic $65B Series H @ $965B post，ARR 12 月 $9B → $47B；Micron / Samsung 内存巨头首次入资前沿实验室 + XCENA $135M memory-as-bottleneck + Opus 4.8 / Dynamic Workflows 75 万行 Bun Zig→Rust 重写。

B · 个体姿势

4力 · 治理交织

Pope 个体姿势 + Rosalind 反击 + 民主党分裂

MIT TR 把 Pope Magnifica humanitas 拆为个体姿势模板 + Wired 硅谷 CEO 被 hold accountable + OpenAI Rosalind Biodefense + BioRefusalAudit SAE + Altman/Amodei 回收 jobs 预言 + Axios 民主党 AI 监管内部分裂。

C · Agent 全栈

5层 · 同周到位

协议 + 记忆 + 编排 + 可观测 + 安全

OpenRouter Response Healing（JSON 修复插件） + MCP × 科学知识图谱 + Meta-Cognitive Memory Policy + Aegis meta-harness + GBrain agent memory + DLW agent observability + DBOS Postgres 对垒 Temporal + Locally Coherent compositional incoherence + BioRefusalAudit。

Editor's
Note如何读这份简报

这是 2026 年第 23 周 AI 行业的全景速读，也是 EP.88 启动周（5/29 → 6/5）。本期关键词：Token Becomes Unit of Account（Sequence Radar 命名） + 资本结构第三维（内存 + IPO + 合规） + 治理叙事下沉到个体姿势 + Agent infra 五层全栈同周同步推进。截至 6/3 凌晨，我们累积扫描 210+ 个独立信号（5/29-6/2 五轮抓取），落在 18 格 Landscape 上点亮 16 格，提炼出三条主线 —— 💎 后 Series H 时代、🦠 治理 + Rosalind 反击 + Glasswing 扩张、🧰 Agent infra 全栈 + CooperBench 协作诅咒。6/2 增量重点：Codex for Knowledge Work 周活 500 万 + Travelers 全国 85-90% AI 报案 + WindBorne weather agent 不投 SaaS（AI 知识工作 + 行业落地）· Anthropic Project Glasswing 扩到 15+ 国家 150 家关键基础设施 + Claude Security 商业化 · a16z Visual AI is Code + Komba 第一个 AI 设计工程师 + Latent Space Video Agent Ethan He（视频 = agent 新范式） · Florida 起诉 OpenAI 83 页 + Trump Admin At War + Illinois 全美最强 AI 安全法（AI 监管碎片化进入州法+诉讼+联邦内斗三轨）· OpenAI Stargate Michigan 1GW + AWS Bedrock + Alphabet $80B + Water access SpaceX IPO 风险因素 · Stanford HAI CooperBench 协作诅咒 + Omar Sanseviero 集体智能来自交互设计（multi-agent 神话双重夹击）· LangSmith Gateway 402 spend limits · Mastercard CDO agent 风险定价 · Hackers Meta AI = IAM 反模式 + Apple rejected dictation HN 161 + Martin Scorsese 拥抱 AI · Token Reckoning Big Technology + Tom Tunguz AI Skepticism Map（GPU/neocloud short 16.8% / +60%/yr）· China BCI 临床 36 例 + GM CFD 15h→1min。 🗺️ 先看 Landscape · 🔗 全文 170+ 条原始信源链接已内嵌 · ★ 标记本期重点 · 🆕 6/5 凌晨更新（整合 6/3-6/4 全天信号）

※

Insight · 观点洞察 · 本期三条主线 ↓ 点击卡片跳到对应章节

A · 后 Series H💎

Anthropic $965B + 内存战线 + Coding 三足

Anthropic Series H $965B post + Micron/Samsung 入资 + XCENA $135M memory-as-bottleneck + Opus 4.8 / Dynamic Workflows 75 万行重写 + Cognition Async Agents + Microsoft Build coding 反击 + Glean $300M context graph + SpaceX IPO 倒计时。

AI Infra基础模型智能体应用市场信号专业编码

B · 个体姿势 + 反击🦠

Pope 个体模板 + OpenAI Rosalind + 民主党分裂

MIT TR Pope Magnifica template + Wired industry attention + OpenAI Rosalind Biodefense + BioRefusalAudit SAE + Ebola 同框 + Altman/Amodei 回收 jobs 预言 + Hype Index 复活 + 毕业生嘘 AI + Axios 民主党分裂 + Common Sense Media Youth AI Safety Institute。

观点洞察AI 安全应用潜信号市场信号HowTo

C · Agent 全栈🧰

协议 + 记忆 + 编排 + 可观测 + 安全五层同周

OpenRouter Response Healing（JSON 修复插件） + mcp-proto-okn × 科学知识图谱 + Meta-Cognitive Memory Policy ArXiv + Aegis Programable Meta-Harness + GBrain Garry Tan + DLW agent observability + DBOS Postgres durable + Locally Coherent compositional incoherence + BioRefusalAudit SAE。

技术栈智能体Agent 工具AI 安全数据

§ Model 模型层 · 基础设施 / 算法 / 安全

AI Infra

🔥 A

05-29💱 XCENA $135M memory-as-bottleneck
05-29Groq $650M（押 inference）
05-30StepFun Step-3.7-Flash × NVIDIA DGX × vLLM
05-28Anthropic-SpaceX 合同期限信息不对称
05-28📈 AI Token Futures 衍生品
05-31🆕 Fireworks AI $800M ARR / 4× 增长
06-01🆕 OpenAI Stargate Michigan 1GW（Saline / Oracle / Related / Walbridge）
06-01🆕 OpenAI Codex/GPT-5.5 on AWS Bedrock
06-01💰 Alphabet $80B AI capex 增发
06-01💧 SpaceX IPO 水权风险因素
06-01🆕 MiniMax M3 on Cloudflare AI Gateway, day one
06-01🇨🇳 蚂蚁百灵 50w token/day 免费配额
06-02🆕 Scaling laws rewritten in bytes not tokens
05-31🆕 Dell 全球首台 NVIDIA Vera Rubin NVL72（x.ai 简报）
05-29🆕 NVIDIA DynoSim · LLM serving Pareto 仿真
05-29🆕 NVIDIA MCG Toolkit · 合规文档自动化

基础模型

🔥 A

05-28🤖 Claude Opus 4.8 (1M context, Dynamic Workflows)
05-29AINews Anthropic $965B + Opus 4.8 综合
05-29🇨🇳 MiniMax M3 稀疏注意力 15.6×

多模态

🔥 A

05-30🆕 Apple distill Gemini → iPhone Siri
05-30🆕 PrismML Bonsai Image 4B 进 iPhone
05-29DeepSeek 架构挑战 token moat
05-29Mashable 反推 Gemini 3.5 Flash 幻觉率

具身

●

05-29🤖 Tesla Optimus 工厂量产（AI Valley）

数据

● C

05-29Demystifying Data Organization for LLM Training
05-29🏪 Lowe's "Semantic" Data Boosting AI Agents（TI）
05-28Sakana DiffusionBlocks（block-wise）

AI 安全

🔥 B C

05-29🦠 BioRefusalAudit SAE 生物安全拒答
05-28🆕 Anthropic Engineering: How We Contain Claude
05-28🆕 LLMs 在被明示警告后仍信假陈述
05-29Locally Coherent, Globally Incoherent multi-agent
06-02🔥 Anthropic Project Glasswing 扩到 15+ 国家 150 家关键基础设施
06-01🆕 Hackers duped Meta AI chatbot = IAM 反模式
06-01⚖️ Florida AG 起诉 OpenAI 83 页
05-29🔒 Pentest Tools 241 Devs AI-coded vulnerabilities

§ Benchmark 评测层

评测

● C

05-29📊 2026 May AI Evaluation Digest
05-29🛠️ Deep Learning Weekly #457 — AI Observability Tools 2026 评测

（占位）

本周 evaluation 焦点已转入 agent observability tools 评测分轨

（占位）

§ App 应用层 · 应用 / AI4S / UIUX / 机器人

应用

🔥 A B

05-28💰 Glean ARR $300M context graph
05-28Asana 收购 StackAI
05-28Sesame iOS conversational AI
05-29YC Voice Agent stack 开源 $0
05-29YC GigaAI 客服 DoorDash / 头部加密交易所
05-30🆕 'What a joke' · GitHub Copilot token billing
05-30🆕 Meta 研发 AI Pendant
06-01🆕 Sakana 金融 SWE 访谈
06-02🔥 Codex 周活 500 万 / 非开发者 20% / 增速 3×
06-02🆕 Travelers AI Claim 全国 85-90% 完成率
06-01🌪️ WindBorne weather agent · 不投 SaaS
06-01🚗 GM CFD/FEA 15h → 1min（900×）

AI4S

●

05-29🆕 Physics Is All You Need? (ICML 2026)
05-29🆕 SchGen PCB Schematic Generation
05-29🆕 Tiny but Trusted VLM × Time-Series Anomaly

UIUX

🔥 A

05-29🎨 Figma × GitHub 双向集成生产级
05-30🆕 TC Browser Wars 2026 盘点（Comet/Arc/Dia）
06-02🎨 a16z · Visual AI is Code（SVG/React/Lottie/Blender/USD）
06-02🆕 Komba · 第一个 AI 设计工程师
06-02📱 Gemini Spark trip planning「惊艳但害怕」
05-29Figma CEO "false dichotomy" 评论（Dept of Product）

机器人/端侧

●

05-28Internet Rebuilt for Machines
05-29🆕 MicroAGI Shift App 免费保洁换 robot data
05-29🆕 Waymo Ojai 中国造 robotaxi
06-02💪 a16z Investing in Westmag · 美国本土 motor/actuator
06-02🚀 Impulse $500M「不招 AI 招人」
06-01🏠 人形机器人测试损坏 Airbnb 被诉
06-01🧠 中国 NEO BCI 临床 36 例 · 全球首批商业化
05-29Tesla Optimus 工厂量产

§ Dev 开发者工具层 · 技术栈 / Agent / 编码 / 组织

技术栈

🔥 C

05-29📐 OpenRouter Response Healing（JSON 修复插件）
05-29🔬 mcp-proto-okn × 科学知识图谱
05-29🆕 "MCP Is Dead?" (HN 312 pts)
05-29🆕 Tiny-vLLM (C++/CUDA)
05-30🆕 LangChain Deep Agents v0.6 (harness profile 一等公民)
05-28🐘 DBOS Postgres durable workflows
06-02🚨 Stanford HAI CooperBench · 两个 coding agent 协作时性能腰斩
06-02💸 LangSmith Gateway · org/workspace/user/key 四层 spend limits + 402
06-02🆕 Omar Sanseviero · 集体智能或许来自交互设计，不来自 agent 数量
06-01🆕 Stanford CS336 CLAUDE.md（HN 270 分）
06-02📊 Mastercard CDO · agent 风险定价首次公开
06-02📐 IEEE Spectrum · 为什么不衡量 AI 对人类的影响
06-02🎬 Latent Space · Video Agent (Ethan He, xAI Grok Imagine)
06-02🔧 AINews · Cosmos 3 + Nemotron 3 Ultra + RTX Spark + MiniMax M3

智能体

🔥 A C

05-28⚡ Cognition Devin Async Agents 详谈
05-29Cognition Scott Wu: agent 不替代人
05-29AI Agents 进入"重建期" (Temporal)
05-29🧠 Meta-Cognitive Memory Policy ArXiv
05-29🛡️ Aegis Programable Multi-Agent Meta-Harness
05-30Google Managed Agents API + Gemini Spark 24/7
05-31🆕 Guild · 统一记忆 MCP (Claude Code/Cursor/Codex)
05-31🆕 Mostly Harmless AI v2.0 newsletter relaunch

Agent 工具

🔥 A C

05-29🧠 GBrain Garry Tan agent memory
05-29📊 Nate dashboard 看似绿 run 已断裂
05-29📱 Apple Siri 独立 app 入口
05-29Wired Gemini Spark 把男友 friend-zone
05-30Chrome DevTools for Agents 1.0
05-30NotebookLM + Agent OS + Obsidian 组合
05-31🆕 Agent OS = Claude+Hermes+OpenClaw+memory
05-31🆕 Codex + 微信读书 Skill + Notion（中文）
05-31🆕 Anthropic "Mythos 1" 营销叙事

专业编码

🔥 A

05-29📰 Microsoft Build 自研 coding 模型预告（TI）
05-29Tom Tunguz Skill Distillation (Pi agent)
05-30Parekh: Microsoft Copilot 重建级重构
05-31🆕 Josh Pigford 5 apps Claude Skills 拆解

氛围编程

● B

05-28Various LLM Smells
05-28Protestware for Coding Agents
05-29Coders Refusing AI (METR 无对照组)
05-30InfoQ: 米哈游 200 万元 Token / Agent 最贵错误
05-30🆕 Domain Expertise = Real Moat (HN 148pts)
05-31🆕 antirez · pre-AI 烂代码基线校准

组织与个人

🔥 B

05-26Altman / Amodei 回收 jobs 预言
05-29📈 The Information OpenAI IPO 路径回顾
05-29Aaron Levie: CEO 们的 "AI Psychosis"
05-30AINews Forward Deployed Engineer Track + Founders
05-31🆕 Lenny · Benedict Evans: AI = "1997 的互联网"

课程

●

05-30Rundown 上线 Claude Cowork 课程
05-30GAII: "Learning Is Hard" 企业 AI 培训
05-31🆕 NLP Newsletter · Top AI Papers Week 5/24-5/31

§ Signal 信号层 · 潜信号 / 市场 / HowTo

潜信号

🔥 B

05-29🦠 OpenAI Rosalind Biodefense + 政府盟友
05-29MIT TR Pope Magnifica 个体姿势模板
05-29Wired Pope industry attention
05-29Vatican's Man Inside Anthropic
05-28Economist · Pope Leo encyclical attacks tech messianism
05-29MIT TR Ebola 同框
05-29Sakana × DEEP DIVE OSINT
05-29📱 Common Sense Media Youth AI Safety Institute
05-28🆕 Vox · AI Successionism 反向地图 (HN 5/31 上热门)
05-30🆕 EY Canada 网安报告全是 LLM 幻觉引用 (HN 259pts)
05-30🆕 £200 V100 装游戏 PC 跑 27B 本地 LLM

市场信号

🔥 A B

05-28💎 Anthropic $65B @ $965B Series H
05-31🆕 Sequence Radar #869 · "Token Becomes Unit of Account"
05-30Anthropic Surpasses OpenAI (HN 139 pts)
05-30WSJ: Corporate America Rationing AI
05-29Wired: Illinois 美国最强 AI 安全法
05-29Jensen: Taiwan as AI center ($150B)
05-29📈 The Information $65B + Micron/Samsung 入资
05-28🎓 MIT TR AI Hype Index 复活
05-29💰 a16z Charts: Borrowing Bigly + Govt SaaS
05-29🚀 SpaceX IPO Takes Shape（Bloomberg）
05-29🇺🇸 Axios 民主党 AI 监管内部分裂
05-30Contrary Research #187: Anthropic Momentum
05-30Big Tech: Chatbots & Agents Will Merge
05-30SVTR: Agent 真对手是 Payroll
05-31🆕 AI Disruption · Usage Billing Stocks Lead
05-31🆕 Air Street · RAAIS 2026 ElevenLabs Scribe v2
05-31🆕 Databricks · Data + AI Summit 2026 Live

HowTo

● B

05-28@theo · LLM 错答 vs 餐厅做错菜
05-29@oran_ge · 时间自由真空
05-29Please Use AI 反主流声音
05-29antirez × wuvist · AI slop 必读
05-30@oasisfeng · Gemini 陪读道德经
05-31🆕 @arafatkatze · "AI 写作让所有人变成 normie"
05-31🆕 linksiwouldgchatyou · Amish AI / 文化拼贴

主线 A 横跨：观点洞察 · AI Infra · 基础模型 · 应用 · 智能体 · 专业编码 · 市场信号 · 组织

后 Series H 时代：Anthropic $965B + 内存战线打开 + Coding agent 三足继续硬碰

资本结构第三维| GPU + 内存 + IPO + 合规 + ARR 五维同步加压

EP.87 收尾的"AI 行业的下一个前沿是资本结构"在 EP.88 启动周变成具体地图——Anthropic 12 月里估值 / ARR 双 5×、Micron / Samsung 内存巨头首次入资、XCENA $135M memory-as-bottleneck、Opus 4.8 + Dynamic Workflows 跑出 75 万行 LOC 重写、Cognition Async Agents 详细公开、Microsoft Build 反击、Glean ARR $300M 切换 GTM。

EP.88 启动周的真正主线，是 AI 资本结构从"GPU + 国家级大单"扩张到"内存 + IPO + 合规 + Agent ARR"四维同步加压。Anthropic 5/28 完成 $65B Series H @ $965B post，12 个月里估值从 $200B → $965B（近 5×），ARR 从 $9B → $47B（5×）——这两个 5× 不是巧合，是 Anthropic 在和资本市场谈"我营收增速即估值"。TI 5/29 第一时间披露投资者结构：除 hyperscaler 外，Micron 和 Samsung 两家内存巨头首次直接出资前沿实验室。同日 XCENA 在韩国以 $570M 估值完成 $135M B 轮，押注 "AI 真正瓶颈是 memory 不是 compute"——MX1 通过 CXL 把 KV cache、预处理和数据编排塞进 DRAM 旁，2027 年三星代工量产。同期 Anthropic Opus 4.8 + Dynamic Workflows 同日发布：Jarred Sumner 用 Dynamic Workflows 6 天把 Bun 从 Zig 重写到 Rust 共 75 万行——multi-agent 编排第一次有"工业级代码迁移"的产能锚。Cognition $1B @ $26B 后的 Walden Yan 首次访谈披露 Devin 已有 80% commit 自动化、spec-to-PR、full VM、agent memory；Microsoft 已在 6/2 Build 发布七款自研 MAI 模型，MAI-Code-1-Flash 上线 VS Code 正式反击；Glean ARR 突破 $300M，卖点从"企业搜索"切换到"帮你省 AI token 账单"。

§ 01Timeline · 因果链

Anthropic Raises $65B, Nears $1T Valuation Ahead of IPO — $965B post，12 月 ARR $9B → $47B（5×）。 TC
市场信号 · 05-28
The Information · Anthropic Raises $65B at $900B Valuation; Micron, Samsung Invest — 内存巨头首次入资前沿实验室。 TC（Series H）
市场信号 · 05-29
XCENA Raises $135M on Bet That AI's Biggest Bottleneck Isn't Compute — It's Memory. MX1 via CXL，"10 台服务器的活 1 台干"。 TC
AI Infra · 05-29
Introducing Claude Opus 4.8 — 1M context、长任务持续性、"max reasoning ≠ best reasoning effort" 新调参 surface。 Anthropic
基础模型 · 05-28
Opus 4.8 with new "Dynamic Workflow" Tool — agent 编排原语，一次启动数百 sub-agent。 TC
基础模型 · 05-28
AINews · Anthropic $965B Series H + Opus 4.8 + Dynamic Workflows / `ultracode` — Jarred Sumner 用 Dynamic Workflows 6 天把 Bun 从 Zig 重写到 Rust 75 万行 LOC。 Latent Space
智能体 · 05-29
The Age of Async Agents — Cognition's Walden Yan & OpenInspect's Cole Murray — Devin 80% commit 自动化、spec-to-PR、full VM、agent memory。 Latent Space
智能体 · 05-28
Microsoft 已在 6/2 Build 发布七款自研 MAI 模型 — coding 主力 MAI-Code-1-Flash（SWE-Bench Pro 51%）上线 VS Code、经 Auto 路由给约 10% GitHub Copilot 用户（5/29 The Information 独家预告已兑现）。 Build 2026
专业编码 · 05-29 → 06-02 落地
🆕 Grok Build = 终端 CLI「第三极候选」（xAI） — 8 并行 sub-agent、Plan Mode 默认、本地优先、MCP 兼容；社区热度高（HN/Reddit/X 每日对比贴），差异化在速度 + 价格（$30/月最便宜）+ 多文件重构，但底模 SWE-bench ~70.8%，落后 Codex/Claude Code 约 17–18 分。媒体并称 Claude Code / Codex CLI / Grok Build 为"同一 shell 三玩家"，但能力对等口径下仍是最短腿（≠ 主稿实验室级 coding 三足 Anthropic/Cognition/Microsoft）。 xAI · 对比
专业编码 · 05-14
Glean's Top Line Crosses $300M as AI Budget Cutting Becomes Its Major Selling Point — context graph 成本控制护城河。 TC
应用 · 05-28
Asana Acquires No-Code Agent-Builder StackAI — 传统 SaaS 收购 no-code agent builder 的 M&A 样本。 TC
应用 · 05-28
Figma × GitHub 双向集成 — design-to-code 进入生产级。 VentureBeat
交互界面 · 05-29
Sesame iOS App for Conversational AI — Oculus 创始人新公司主打"自然对话感"。 TC
应用 · 05-28
YC Alumni Open-Sourced the Voice Agent Stack — voice agent 商业模式被开源直接打穿。 AlphaSignal
应用 · 05-29
YC × GigaAI Customer Support Agents — DoorDash / 头部加密交易所 / 全球前三电信运营商，BPO 替代加速。 YC
应用 · 05-29
Sneak Peek at New Siri App — Apple 把 Siri 拆为独立 app 入口。 TC
Agent 工具 · 05-28
How Long Is Anthropic's Lease with SpaceX? — Musk 称合约可短期取消 vs S-1 写到 2029-05。 TC
AI Infra · 05-28
Just Like Gold and Oil, We'll Soon Trade AI Token Futures — AI token 衍生品 = 像电力的原材料。 TC
AI Infra · 05-28
Anthropic Opens Milan Office — Paris-Dublin-Milan 欧洲三角成形。 Anthropic
市场信号 · 05-27
SpaceX's $1.75T IPO Pitch Relies on a Lot of AI Faith — SpaceXAI / Colossus / Anthropic 三关键词捆绑定价（S-1 中 47% 篇幅谈 AI；最大 AI 收入来自把 Colossus GPU 租给 Anthropic，$1.25B/月）。 Fast Company
AI Infra · 05-29
Sam Altman + Dario Amodei Walking Back AI Jobs Apocalypse Predictions — IPO 临近窗口 CEO 主动撤回预言。 Fortune
组织 · 05-26
How DeepSeek's Radical Architecture Is Shattering Silicon Valley's Token Moat。 VentureBeat
多模态 · 05-29
MiniMax M3 Sparse Attention + 15.6× 速度。 VentureBeat
基础模型 · 05-29
🆕 Groq Raising $650M After Nvidia's $20B Not-Acqui-Hire — 押 inference 而非训练芯片。 TC
AI Infra · 05-29
🆕 Step-3.7-Flash × NVIDIA DGX × vLLM — StepFun（上海阶跃星辰）拿到 NVIDIA 官方部署套件，MLX 3bit 量化版可在 128GB Mac 跑。 NVIDIA
AI Infra · 05-30
🆕 Apple Distill Google Gemini → iPhone for Siri rebuild — 端侧多模态元年（硬件大厂蒸馏侧）。 Ars
多模态 · 05-30
🆕 PrismML Bonsai Image 4B 压进 iPhone — 端侧 diffusion 推理打穿云端图像生成商业模式。 AlphaSignal
多模态 · 05-30
🆕 Cognition's Scott Wu: AI Coding Agents Shouldn't Replace Humans — Series D $1B 后 CEO 公开降温。 TC
智能体 · 05-29
🆕 Anthropic Surpasses OpenAI to Become World's Most Valuable AI Startup (HN 139 pts) — "Anthropic > OpenAI" 进入 HN 头条市场叙事。 Qazinform
市场信号 · 05-30
🆕 As the Browser Wars Heat Up — TC 盘点 Comet / Arc / Dia / Perplexity 等 AI 原生浏览器。 TC
交互界面 · 05-30
🆕 Skill Distillation — Tom Tunguz 用 Pi agent 把前沿模型 procedural knowledge 灌注到本地 Qwen 35B / Gemma 26B。 Tom Tunguz
专业编码 · 05-29
🆕 Sequence Radar #869 · The Token Becomes the Unit of Account — 把 Series H / Opus 4.8 / Cognition $1B / OpenRouter 升级捆绑为同一资本-计价货币化逻辑（EP.88 强候选叙事关键词）。 The Sequence
市场信号 · 05-31
🆕 'What a joke' · GitHub Copilot 切换到 token 计费 — 开发者社区强烈不满，"Copilot 黄金时代终结"。 TC
应用 / 专业编码 · 05-30
🆕 Fireworks AI 年化营收 $800M / 4× 增长（@lqiao）— inference serving 在 token 经济时代继续放大估值。 X
AI Infra · 05-31
🆕 Dell 全球首台 NVIDIA Vera Rubin NVL72 交付 — 5/31 交付给 CoreWeave，过 L11 诊断 + 147 小时测试；Rubin 从规格曝光转入机柜级量产交付。 Dell
AI Infra · 05-31
🆕 AI Disruption · Usage Billing Stocks Lead — usage-based 营收驱动软件股反弹（二级市场佐证 token 经济）。 AI Disruption
市场信号 · 05-31
🆕 NVIDIA DynoSim · LLM serving Pareto 仿真 — 选型从经验调参升级为 Pareto 仿真扫描。 NVIDIA
AI Infra · 05-29
🆕 NVIDIA MCG Toolkit · 合规文档自动化（应对 AB-2013 / EU AI Act）。 NVIDIA
AI Infra · 05-29
🆕 Meta 研发 AI Pendant — AI 助理硬件化再添 Meta 关键节点。 TC
Agent 工具 · 05-30
🆕 Sakana 金融业务 SWE 访谈 — 日本中型实验室 GTM 双线（金融 + 情报）配齐。 Sakana
应用 · 06-01
🆕 Parekh AI-RTZ #1102: Microsoft Rebuilds GitHub Copilot + Google AGI Timelines。 Parekh
专业编码 · 05-30
🆕 Databricks · Data + AI Summit 2026 Live（与 MS Build 同框为 enterprise data/AI 主题密集发布观察窗）。 X
市场信号 · 05-31

★ So What · 为什么这条线值得连起来看

EP.87 结尾把"AI 行业的下一个前沿是资本结构" 留在主稿。EP.88 启动周用一个礼拜的资本动作把这句话变成了具体地图：从"算力大单" 扩张到"内存绑定 + IPO 倒计时 + 合规市场倒挂 + ARR 验证"四维同步加压。Anthropic 12 月里估值 5× / ARR 5×——这两个 5× 不是巧合。投资者结构里 Micron + Samsung 的位置极其关键——前沿实验室第一次让内存巨头与 hyperscaler 同台。

XCENA 同日 $135M B 轮与 Anthropic 内存方入资互为镜像：当 Opus 4.8 1M context + Dynamic Workflows 数百 sub-agent 让 KV cache 暴涨时，"memory wall" 不再是 paper 阶段。AI Token Futures + AI Data Center → Lithium → climate IPO 解冻则把 AI capex 受益方扩展到金属/能源。

Coding agent 战线完成"三足继续硬碰"明确升级：Anthropic Opus 4.8 + Dynamic Workflows 跑出 75 万行 LOC 工业代码迁移；Cognition Devin 80% commit 自动化 + agent memory 详细公开；Microsoft 已在 6/2 Build 发布七款自研 MAI，coding 主力 MAI-Code-1-Flash（SWE-Bench Pro 51%）上线 VS Code、经 Auto 路由给约 10% Copilot 用户，正式反击。未来 30-60 天会把"plan-step、审批工作流、长任务持续性、agent memory、Dynamic Workflows-style 数百 sub-agent 并行"卷成新一代默认能力。

Enterprise GTM 最大变化是 Glean ARR 突破 $300M 后正式把卖点切换到"帮你省 AI token 账单"——context graph 成 enterprise AI 成本控制护城河。配合 Asana × StackAI + Figma × GitHub + Visa × Replit + Salesforce AGaaS，传统 SaaS 重写计费模型从 seat-based 转 value-based。

§ 02观察点

6 月 Build

Microsoft Build 自研 coding 模型是否在 plan-step / agent memory / 数百并发上对标 Anthropic

6 月

Cognition Devin "spec-to-PR + agent memory" 工作流是否被开源 / Codex / Claude Code / Grok Build 复制

2027

XCENA MX1 三星代工进度兑现；AMD / Astera Labs / Marvell 是否跟进做 CXL memory-side accelerator

SpaceX S-1

SpaceX IPO 招股书是否明确披露 Anthropic 合同终止条款（百亿美金对手方风险）

90 天

Asana × StackAI 落地是否被改造为 "Asana Agent Forge"，Monday/ClickUp/Trello/Notion 反应窗口

§ 03给三类听众的"明天能用"

技术人

立即评估

在下个 sprint 评估两件事：① Opus 4.8 + Dynamic Workflows 在你的 multi-agent 场景的并发 ceiling 与 cost-per-task；② Glean / Lowe's-style "context graph / 语义层" 作为应用层的 token 账单优化是否能在 90 天拿出 ROI 数字。如果用 OpenRouter，开启 Response Healing 插件托管“畸形 JSON 事后修复”、拆掉自写 repair 代码（强 schema 仍走 Structured Outputs）。

决策者

五维升级

把"AI 资本结构 = GPU + 国家级大单"旧模型升级为 GPU + 内存 + IPO 倒计时 + 合规市场倒挂 + ARR 验证五维。审计 AI 供应商合同时新增"对手方关系稳定性条款"——Anthropic-SpaceX 合同期限信息不对称就是反面教材。GTM 端把 Glean "省 token 账单" 作为新模板。

投资者

第二曲线

Micron + Samsung 出资 Anthropic 是"AI 资本第二曲线"明确信号——下 12 月最值得加仓的不是 GPU，是 "GPU 旁路内存 + CXL + 智能 SSD + 推理 cache 优化" 这条链。XCENA / Astera Labs / Marvell / SK Hynix 应纳入"Anthropic-Micron-Samsung 同表"。Coding agent 三足下半年评测分轨是 alpha 拐点。

§ 04投资 · AI 循环交易地图（Circular Deals）

把本期 Anthropic Series H 放进更大背景：AI 行业正用“互相投资 + 互相采购”的循环交易，把芯片厂、AI 实验室、云、以及 EP.88 新增的内存厂绑成一张闭环资金网（Bloomberg 估算 >$800B）。同一批公司同时出现在交易多个方向 → “厂商给自己的客户出钱（vendor financing）”。

SVG · AI 循环交易闭环：芯片厂 → AI 实验室 → 云 → 回到芯片厂；EP.88 新增“内存厂（Micron/Samsung/XCENA）→ 前沿实验室”一条回路。参考 Bloomberg · AI Circular Deals 与 Bloomberg · MSFT/NVDA $15B → Anthropic（2025-11）（金额据公开报道整理）

★ So What · 循环交易 vs 真实需求

2025-11 的 MSFT $5B + NVDA $10B → Anthropic（对价：Anthropic 承诺 $30B Azure + 1GW、用 Vera Rubin / Grace Blackwell，Claude 上齐三大云）是典型循环节点——NVIDIA 既当股东又当供应商、微软既当股东又当云。EP.88 的 Micron / Samsung 入资把这张网从“GPU + 云”扩到“内存”，新增一条“内存厂 → 实验室 → 买 HBM → 回到内存厂”的回路。

两派之争决定 IPO 估值口径：投资者要“干净”营收（剔除厂商融资、看 arm’s-length 真实需求），Janus Henderson 则称这是“良性循环”。若 Anthropic / OpenAI 招股书里循环交易占比高，市场会按 vendor-financed 打折——而内存厂入局，把这场辩论从 GPU 一路扩到了整条内存链。

主线 B 横跨：观点洞察 · AI 安全 · 应用 · 潜信号 · 市场信号 · HowTo · 组织

AI 反弹收尾 + 治理叙事下沉到个体姿势 + Rosalind 反击

治理叙事| 从"机构 vs 机构"转向"机构 vs 个体" + 政府/国安第三战线

Pope Magnifica humanitas 进入 MIT TR / Wired 个体姿势模板 + OpenAI Rosalind Biodefense 反击叙事 + BioRefusalAudit SAE 工具同日 + Altman/Amodei 集体回收 jobs 预言 + Axios 民主党 AI 监管内部分裂 + Common Sense Media Youth AI Safety Institute。

EP.87 已经把 AI 反弹叙事推到"DuckDuckGo +33% 安装、毕业典礼嘘 AI、Hype Index 复活、Pope 通谕"四数据闭环。EP.88 启动周的真正升级，是治理叙事从"梵蒂冈 vs 实验室"宏大对立下沉到"个体如何面对 AI 时刻"的可操作模板，同时 OpenAI 用 Rosalind Biodefense 在国安 / 生物防御战线打开反击叙事。MIT TR 5/29 头条把 Pope Magnifica humanitas 拆解为"个体面对 AI 时刻的姿势"——硅谷 CEO（含 Anthropic Chris Olah）集体回应；Wired 同日跟进"Pope May Not Disarm AI, but He's Got the Industry's Attention"。配套节点：Sam Altman + Dario Amodei 集体回收"AI 大规模取代工作" 预言——IPO 临近窗口前沿实验室 CEO 主动调整公关姿态。OpenAI 同日发布 Rosalind Biodefense + 向美国政府盟友扩展 GPT-Rosalind——前沿实验室在 Anthropic 估值高点同周以"政府+生物防御+国安"反击叙事；BioRefusalAudit ArXiv 论文同日给出"用 SAE 量化生物安全拒答深度"的可复现工具。Common Sense Media 启动 Youth AI Safety Institute；Axios AI+ Government 揭示民主党内部 AI 监管立场分裂——AI 监管首次不再两党对立而是党内分化。

§ 01Timeline · 因果链

How the Pope's Magnifica Humanitas Offers a Template for Individuals to Meet the AI Moment — 从宏大叙事下沉到个体姿势。 MIT TR
观点洞察 · 05-29
Pope Leo XIV May Not Disarm AI, but He's Got the Industry's Attention — 硅谷 CEO 被 hold accountable。 Wired
观点洞察 · 05-29
OpenAI Launching Rosalind Biodefense + Expanding GPT-Rosalind to U.S. Gov Partners — 前沿实验室开辟"政府+国安"第三战线。 OpenAI
潜信号 · 05-29
BioRefusalAudit: Auditing Biosecurity Refusal Depth Using SAEs — 量化生物安全拒答深度的可复现工具。 ArXiv
AI 安全 · 05-29
The Deadly Ebola Outbreak Is Proving Difficult to Control — 与 OpenAI Rosalind 同日见报。 MIT TR
潜信号 · 05-29
The AI Hype Index: AI Gets Booed in Graduation Season — Eric Schmidt 呼吁"塑造 AI"被沉默回应。 MIT TR
市场信号 · 05-28
The Download: Climate Tech IPOs + AI Hype Index 同框确认。 MIT TR
市场信号 · 05-28
The Download: Unlocking Lithium and Controlling Ebola — MIT TR 把 4 条线打包。 MIT TR
市场信号 · 05-29
Sam Altman + Dario Amodei Walking Back AI Jobs Apocalypse Predictions — IPO 临近 CEO 集体撤回预言。 Fortune
组织 · 05-26
Axios AI+ Government · Inside the Democratic Resistance — 民主党内部 AI 监管立场分裂（Sanders / AOC / Khanna / Warren vs 亲 AI super PAC 背书的 Dems）。 Axios
市场信号 · 05-29
a16z Substack · Charts of the Week: Borrowing Bigly for AI + Selling Software to Uncle Sam — 美企为 AI 大幅举债（~半数 IG 净发行、~40% 高收益债与 AI capex 挂钩）+ 政府成头部 SaaS 客户（FedRAMP 20x）。 a16z
市场信号 · 05-29
Common Sense Media · How Safe Are AI Therapy Apps for Teens? — 与 Stanford Brainstorm Lab 测 5 款 AI 治疗 app（Wysa "unacceptable"）；Youth AI Safety Institute 启动。 Common Sense
潜信号 · 05-29
Please Use AI (HN) — 创意写作者反主流声音。 HN
HowTo · 05-29
@oran_ge · 当 AI 把我的时间节省之后，我竟然发现无事可做——"时间自由真空"。 X
HowTo · 05-29
@theo · LLM 错答比对答更贵 — "AI 质量经济学"朴素比喻。 X
HowTo · 05-28
@antirez via @wuvist · Best Post About AI Slop You'll Read in the Next 2 Years — AI slop 议题升温。 X
HowTo · 05-29
Sakana AI 与 DEEP DIVE 缔结 AI 情报分析合作 — 日本中型实验室进入国防/情报。 Sakana
潜信号 · 05-29
🆕 Corporate America Is Starting to Ration AI as Cost Skyrockets — "买得越多越要省"AI capex 跌落悖论。 WSJ
市场信号 · 05-30
🆕 InfoQ 米哈游一夜烧 200 万元 Token："编程 Agent 是开发史上最昂贵的错误之一"——中文圈反 AI hype 同步爆发。 InfoQ
市场信号 · 05-30
🆕 Aaron Levie: CEO 们的 AI Psychosis — Box 创始人："决定 AI 可以替代你工作的人，往往是最不理解你工作的人"；引 ClickUp 22% 裁员案例。 TC
组织 · 05-29
🆕 Coders Are Refusing to Work Without AI — METR 找不到 no-AI 对照组；Amazon Kirorank 被员工游戏、Uber 4 月烧光全年 AI 预算。 TC
氛围编程 · 05-29
🆕 The Vatican's Man Inside Anthropic — Wired 深度访谈梵蒂冈与 Anthropic 内部联络人，治理叙事从 outside-in 走向 inside-out。 Wired
潜信号 · 05-29
🆕 Economist · Pope Leo's First Encyclical Attacks Technological Messianism — "AI 怀疑论入主流"完成宗教 + 财经 + 科技三角覆盖。 Economist
观点洞察 · 05-28
🆕 The Algorithmic Bridge · The Charts the AI Industry Doesn't Want You to See — 反 hype 数据可视化进入周更频率。 Algorithmic Bridge
市场信号 · 05-30
🆕 Big Technology · Chatbots and Agents Are Going to Merge — chatbot ⇒ agent 合流预言 + Gemini Spark / Apple Siri / Sesame iOS 4 个落地样本。 Big Technology
市场信号 · 05-30
🆕 SVTR Signal · AI Agent 真正的对手是 Payroll，不是 SaaS 预算 — TAM 框架从按 seat 跳到按工时 / 任务 / 工资。 SVTR
市场信号 · 05-30
🆕 Vox · The People Who Actually Want AI to Replace Humanity（HN 5/31 上热门）— "AI successionism" 亚文化在湾区扩张，给"AI 替代人类是不是道德正当" 提供反向地图；与 Pope 通谕镜像。 Vox
观点洞察 · 05-28
🆕 Lenny · Benedict Evans: AI Is "the 1997 of the Internet" — 给 agent 重建期 + 回收预言一个宏观时间框架。 Lenny's
组织 · 05-31
🆕 @arafatkatze · "AI 写作让所有人变成 normie" — creative writing 圈中庸化危机。 X
HowTo · 05-31
🆕 Domain Expertise Has Always Been the Real Moat（HN 148 pts）— 反 AI 取代论 HN 主流舆论锚。 brethorsting
氛围编程 · 05-30
🆕 antirez · 不要忘了 pre-AI 时代的烂代码量 — coding agent 价值在合理 baseline 上的再校准。 X
氛围编程 · 05-31
🆕 EY Canada 网安报告大部分引用是 LLM 幻觉（HN 259 pts）— 大型咨询公司 AI 幻觉首次被外部 audit 公开点名。 HN
AI 安全 · 05-30
🆕 Josh Pigford · 5 AI Skills for Solo Founder（Peter Yang 播客）— Claude Skills 第一份完整生产 stack 拆解（/build、/adversarial-code-review、/but-for-real、/learnings）。 Peter Yang
组织 · 05-31
🆕 linksiwouldgchatyou #771 · Amish AI / 文化拼贴。 Substack
HowTo · 05-31

★ So What · 为什么这条线值得连起来看

EP.87 结尾留下的悬念是："AI 反弹叙事完整闭环之后下一步是什么？" EP.88 启动周给出双轨答案。

轨道一：治理叙事下沉到"个体姿势"模板。MIT TR 把 Pope Magnifica humanitas 拆解为"个体面对 AI 时刻的姿势"——不再讨论梵蒂冈对实验室的宏大批评，而是给读者一个 mental model。Wired 同日把硅谷 CEO 集体回应放在"被 hold accountable" 语境——叙事重心从"机构 vs 机构"转向"机构 vs 个体"。

轨道二：OpenAI 在估值高点周以"政府+国安+生物防御"反击。Rosalind Biodefense + 美国政府盟友扩展 GPT-Rosalind——Anthropic Series H 同周 OpenAI 的反击节点。BioRefusalAudit SAE 工具同日落地——监管叙事与可审计性同日生效。配合 MIT TR Ebola 报道，AI x 生物防御第一次有现实世界对照。Sakana × DEEP DIVE 走 OSINT/国防——亚洲中型实验室也"接政府订单"。

辅助节奏是 Altman/Amodei 回收 jobs 预言 + Axios 民主党分裂 + a16z "美企举债 + Govt SaaS" + Common Sense Media Youth AI Safety Institute——治理叙事分裂为四股交织力量：①机构 vs 个体 ②实验室自我重构 ③政府叙事三角 ④政治分裂。单一立场已无法覆盖讨论面，必须分层 / 分群 / 分议题运营。

§ 02观察点

第二周

Pope Magnifica humanitas 回响：除 Chris Olah 外哪些 CEO 公开回应？是否进入实验室内部行为准则

6 月

OpenAI Rosalind 后续：哪些"美国政府盟友"被定义为受信任开发者？BioRefusalAudit SAE 是否纳入默认 red-team

6/1-6/4

Microsoft Build 是否带配套"国安 / 政府 / 国防"叙事

Axios 民主党分裂延伸到具体法案投票？2026 中期选举 AI 议题成为内部分歧

月度

AI Hype Index 是否变成 MIT TR 长期栏目

Youth AI Safety Institute 第一份报告——是否触发 AI 心理治疗 minimum age 政策

§ 03给三类听众的"明天能用"

技术人

个体姿势

下个 release 的 changelog 加 "AI 时代个体姿势" 说明——告诉用户你的 AI 功能"做什么 / 不做什么 / 谁该负责"。Pope MIT TR template 是 release notes 新范式。health / 心理 / 教育向应用立刻 audit Common Sense Media Youth AI Safety Institute 关注框架。

决策者

四层叙事

把企业 AI 治理叙事从"对外公关 + 对内合规"二分扩展为 机构层 / 个体层 / 政府层 / 政治层 四层。每个产品 launch 配 4 层各自的叙事素材。Altman/Amodei 回收 jobs 预言是公关姿态调整模板——前沿实验室都在主动收回过激预言，你的高管发言库也应同步审计。

投资者

第三估值锚

OpenAI Rosalind + Sakana DEEP DIVE + Anthropic spy agency deal 把 "AI x 国安 / 生物防御 / 情报" 作为 2026 H2 第三估值锚。关注获得"政府盟友"认证的实验室估值溢价。Axios 民主党分裂 + a16z 政府 SaaS——同步拉抬"GovTech / SaaS for Uncle Sam"估值。避开年龄敏感型 consumer AI 产品。

主线 C 横跨：技术栈 · 智能体 · Agent 工具 · 数据 · AI 安全 · 评测

Agent infra 全栈成型：协议 + 记忆 + 编排 + 可观测 + 安全同周到位

Agent 基础设施| 从"宏大叙事 → 可工程化路径"的关键转折

OpenRouter Response Healing（JSON 修复插件） + MCP × 科学知识图谱 + Meta-Cognitive Memory Policy + Aegis Multi-Agent Meta-Harness + GBrain agent memory + DLW agent observability tools 2026 + DBOS Postgres 对垒 Temporal + Locally Coherent compositional incoherence + BioRefusalAudit SAE。

EP.87 故事线 A "All Model Labs are now Agent Labs" 给出宏观叙事；EP.88 启动周用18 条 agent infra 信号把这个宏观叙事落到具体五层栈。协议层：OpenRouter 上线 Response Healing——router 层托管的“畸形 JSON 事后修复”，让 multi-model agent 删掉自写 repair 模块；mcp-proto-okn 让 MCP 协议从 dev 扩散到科研协议。记忆层：Meta-Cognitive Memory Policy ArXiv 让长程 agent 记忆首次成为可优化 policy；GBrain Garry Tan 亲自下场让 agent memory 升级为 YC 主席背书的 must-have。编排层：Aegis Programable Multi-Agent Meta-Harness 给 harness on harness 提供开源实现；DBOS 论证 Postgres 足够支撑 durable workflows，正面对垒 Temporal。可观测层：DLW #457 把 agent observability tools 2026 系统化为评测分轨；Nate dashboard 看似绿 run 内部已断裂。安全层：Locally Coherent, Globally Incoherent ArXiv 给 multi-agent 编排第一个 compositional safety 理论结果；BioRefusalAudit SAE 给生物安全拒答可复现 audit。技能层（本周新浮现的一层）：SkillOpt 把 agent 的 skill 文档当成可训练状态——栈里独立的“技能层”（可训练的做事程序），与记忆层并列（详见专题一）。协议 + 记忆 + 技能 + 编排 + 可观测 + 安全——这套栈本周多条战线同步推进、Agent 工程化整体趋于完善（不是“一次到位”，而是同时向前补全；技能层由 SkillOpt 代表，是最新被补上的一条）。

§ 01Timeline · 因果链

OpenRouter · Response Healing — router 层托管的“畸形 JSON 事后修复”插件（非流式 + response_format 生效，事后修复≠decode-time 强制 schema），可删掉自写 repair 代码。 Docs
技术栈 · 05-29
mcp-proto-okn: Natural-Language Access to Open Scientific Knowledge Graphs Through MCP — MCP 从 dev 协议扩散到科研协议。 ArXiv
技术栈 · 05-29
Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents — 长程 agent 记忆首次成为可优化 policy。 ArXiv
智能体 · 05-29
Mostly Harmless AI · Aegis — Programable Multi-Agent Meta-Harness — harness on harness 开源实现。 Mostly Harmless AI
智能体 · 05-29
AI by Aakash · GBrain — Garry Tan's Agent Memory Solution — YC 主席亲自下场写 agent memory。 GitHub
Agent 工具 · 05-29
Deep Learning Weekly #457 · DeepSWE + Best AI Observability Tools for Agentic Systems in 2026 + SkillOpt — agent observability 系统化评测。 DLW
评测 · 05-29
Nate's Newsletter · Your Agent Dashboard Is Green. The Run Underneath Is Where Work Broke — agent 可观测从 session → delegated work。 Nate's Newsletter
Agent 工具 · 05-29
Just Use Postgres for Durable Workflows (DBOS) — agent workflow 持久化 = Postgres，正面对垒 Temporal / Inngest。 DBOS
技术栈 · 05-28
Locally Coherent, Globally Incoherent: Bounding Compositional Incoherence in Multi-Component LLM Agents。 ArXiv
AI 安全 · 05-29
BioRefusalAudit: SAEs 生物安全拒答深度 audit。 ArXiv
AI 安全 · 05-29
Demystifying Data Organization for Enhanced LLM Training — 数据工程从工程暗知识到 ArXiv 综述。 ArXiv
数据 · 05-29
The Internet Is Being Rebuilt for Machines — agent 优先从应用层下沉到 CDN/DNS/协议层。 TC
Agent 工具 · 05-28
Various LLM Smells (HN 高热) — AI-generated code smells 系统命名。 HN
Agent 工具 · 05-28
Protestware for Coding Agents — 开源社区反 coding agent 反向陷阱。 HN
Agent 工具 · 05-28
Pentest Tools · 241 Devs Surveyed on Vulnerabilities in AI-Generated Code — N=241 量化样本（同期 DevOps.com 报道 AI 生成代码漏洞调查上升趋势）。 Pentest Tools · DevOps.com
AI 安全 · 05-29
GitHub Bans Security Researcher Who Posted Zero-Day Windows Exploits — coding agent 执行环境平台治理边界。 Tom's Hardware
AI 安全 · 05-28
DiffusionBlocks: Training Neural Networks One Block at a Time — block-wise 训练范式工程论证。 Sakana
数据 · 05-28
🆕 Anthropic Engineering · How We Contain Claude Across Products — 从 human-in-the-loop（93% 秒批）转向 containment（sandbox / VM / egress）；披露 Claude Mythos Preview 因 blast radius 4 月未发布。 Anthropic
AI 安全 · 05-28
🆕 LLMs Believe False Statements Even After Explicit Warnings — fact-grounded 应用的结构性负面发现。 Ars
AI 安全 · 05-28
🆕 HuggingFace Multi-turn RL Silent Bug: "Token-In, Token-Out" Rule — 解码 → 解析 tool call → 重新 tokenize 让梯度作用在未真正采样的序列。 AINews
AI 安全 · 05-30
🆕 LangChain Deep Agents v0.6 + AIE Forward Deployed Engineer Track — harness profile 一等公民化，跑 Qwen/Kimi/DeepSeek 比前沿 API 便宜 20×；FDE 从内部岗位扩散为标准产业角色。 AINews
智能体 · 05-30
🆕 Google Managed Agents in Gemini API + Gemini Spark 24/7 Personal Agent on Ultra — agent 部署形态升级为 vendor-managed runtime（沙盒 Linux + 代码执行 + 文件 I/O）。 AINews
Agent 工具 · 05-30
🆕 I Gave Gemini Spark Access to My Life. Then It Friend-Zoned My Boyfriend — personal agent + memory + relationship inference UX 反面教材。 Wired
Agent 工具 · 05-29
🆕 AI Agents Are Entering Their Rebuild Era as Enterprises Confront the Reliability Problem (Temporal) — enterprise agent 2.0 = plumbing + reliability。 VentureBeat
智能体 · 05-29
🆕 Merck & Mastercard: Plumbing Came First Before Agentic AI — 世界级企业落地经验：先修水管。 VentureBeat
智能体 · 05-28
🆕 Guild · Claude Code / Cursor / Codex 统一记忆 MCP（AlphaSignal）— 单 Go binary + 嵌入式 SQLite，多 agent coding 统一 context bus（"nothing leaves your machine"）。 X
Agent 工具 · 05-31
🆕 Agent OS = Claude + Hermes + OpenClaw + 持久记忆（@JulianGoldieSEO）— Agent OS 叙事从 enterprise 渗透到 indie hacker 圈。 X
Agent 工具 · 05-31
🆕 REFINE-DP: Diffusion Policy Refinement for Humanoid Loco-Manipulation — 具身策略从"数据规模" 转向"策略 refinement"。 X
AI4S / 具身 · 05-31
🆕 NLP Newsletter · Top AI Papers of the Week (5/24-5/31) — EP.88 论文侧主线索周更。 Substack
评测 · 05-31
🆕 Mostly Harmless AI v2.0 Newsletter Relaunch — 学界+实践型 AI 通讯重启。 Substack
智能体 · 05-31
🆕 @dair_ai · LLM Wikis + HTML Artifacts 演讲 — LLM Wiki + 持续生成 artifact 作为知识管理新范式。 X
技术栈 · 05-31
🆕 @ryou_issei · Codex + 微信读书 Skill + Notion（中文） — Claude Skills + 中文工作流个人 AI 知识库实证。 X
Agent 工具 · 05-31
🆕 @JulianGoldieSEO · "Anthropic Secret AI Mythos 1" 营销叙事 — Mythos Preview 在零售层被自媒体化为"下一代 Claude"。 X
Agent 工具 · 05-31

★ So What · 为什么这条线值得连起来看

协议层：OpenRouter 上线 Response Healing——把“畸形 JSON 修复”从各家 application 层自写的 repair / regex / re-prompt 兜底，下沉为 router 层托管插件（非流式 + response_format 生效，事后修复而非 decode-time 强制 schema）。配合 mcp-proto-okn 把 MCP 协议扩散到科研协议，MCP 生态跨入 academic infra。

记忆层：Meta-Cognitive Memory Policy 把长程 agent 记忆从启发式经验上升为可优化 policy；GBrain Garry Tan 亲自下场让 agent memory 从 nice-to-have 升级为 YC 主席背书的 must-have——两件事同周到位意味着 agent memory 从"经验+开源工具+vendor SDK"散点状态升级为"可学习 policy + YC 资本背书 + 开源参考实现"三层。

编排层：Aegis 给 harness on harness 提供可上手代码；DBOS Postgres for Durable Workflows 与 Temporal/Inngest 正面对垒。配合 Internet Being Rebuilt for Machines 把"agent 优先"下沉到 CDN/DNS/协议层。

可观测层：DLW #457 把 agent observability tools 2026 作为系统议题——配合 Nate dashboard 叙事，产品行为单位从 session 转向 delegated work。安全层：Locally Coherent ArXiv 给 multi-agent 编排第一个 compositional safety 理论结果；BioRefusalAudit SAE 给生物安全拒答可复现 audit。

把这五层连起来看，EP.88 启动周是 agent infra "全栈成型"的明确信号：协议 + 记忆 + 编排 + 可观测 + 安全五层都有 ArXiv 论文 / 开源项目 / 周刊系统化 / YC 主席背书 / VC 关注。给所有 agent 工程师团队下季度技术债 TOP3 一个清晰路线。

§ 02观察点

1 周

OpenRouter Response Healing 实际修复率（社区是否报告 silent failure / 被 max_tokens 截断无法修复）

6 月

mcp-proto-okn 是否被 Anthropic / OpenAI / Google MCP server 直接 fork

YC W26

YC W26 cohort 是否出现以 agent memory 为核心 thesis 的多家公司

月度

Aegis meta-harness GitHub star / fork 增速

6 月

DBOS Postgres durable workflows 是否引发 Temporal / Inngest 公开反驳

1 周

DLW agent observability tools 评测榜首谁拿头牌（LangSmith / Langfuse / Helicone / OpenInspect）

6 月

BioRefusalAudit SAE 是否被 Anthropic / OpenAI 纳入默认 red-team workflow

§ 03给三类听众的"明天能用"

技术人

五层技术债

下季度 agent 技术债排序：① OpenRouter Response Healing 托管“畸形 JSON 修复”、替换自写 schema repair 模块；② agent memory 从 vendor SDK 升级到可学习 policy（参考 Meta-Cognitive + GBrain）；③ Dynamic Workflows-style 数百 sub-agent 编排前做 Locally Coherent compositional incoherence 评估；④ 引入 agent observability 工具做 delegated work 级监控；⑤ 评估 DBOS Postgres 替代 Temporal / Inngest。

决策者

五层架构

把 agent 部署架构标准从"模型 + 应用层"二段式升级为 协议 + 记忆 + 编排 + 可观测 + 安全 五层架构。每层有明确供应商 / 开源 / 自研选择和 backup 计划。multi-agent 生产任务每个并发 ≥10 的 workflow 必须配 Locally Coherent compositional incoherence 评估报告。GTM 端 agent 安全已分裂为代码安全 + compositional safety + 生物安全 + supply chain safety 四细分。

投资者

全栈 thesis

把 "agent infra 五层全栈" 作为 2026 H2 投资 thesis 框架。①协议层（MCP 生态 + OpenRouter）②记忆层（YC W26-W27 agent memory thesis 创业公司）③编排层（Aegis meta-harness 开源 + DBOS unbundling Temporal + agent OS）④可观测层（agent ops 评测榜赢家）⑤安全层（SAE / compositional safety 红队工具）。参考 EP.87 AI Infra Decacorns（Fireworks / Baseten / OpenRouter）unicorn → decacorn 速度。

AI Infra

The AI Data Center Boom Is Fueling Rebound in Lithium Shares (The Information · 05-29) — AI 数据中心带动锂矿股票反弹；电池储能是 hyperscale 物理瓶颈。

多模态

How Often Does Gemini 3.5 Flash Hallucinate? (Mashable · 05-29) — 用 Google 自家 FACTS 基准反推幻觉率；前沿实验室评测透明度被外部 hold accountable。

具身

Tesla Is Building an Optimus Robot Factory (AI Valley · 05-29) — Tesla 启动 Optimus 工厂量产人形机器人；与中国限制顶级 AI 研究员出境信号同步。

应用

Monitoring + Claude Code = Tour Date Notifier (Firecrawl · 05-29) — Firecrawl + Claude Code personal agent 轻应用样本。

🆕 5/31 增量 · 潜信号 / 文化

I Put a Datacenter GPU in My Gaming PC for £200 (HN 76 pts · 05-30) — V100 SXM2 16GB + 转接板，本地跑 27B 模型 32 tok/s；个人 LLM rig 改装路线大幅降低 32GB+ VRAM 门槛。
EY Canada Cybersecurity Report Mostly Hallucinated Citations (HN 259 pts · 05-30) — 四大咨询公司 AI 使用合规讨论；与 LLMs Believe False + HF Token-In-Token-Out 同周 hallucination 三层风险上桌。

🆕 5/31 增量 · HowTo / 课程

NLP Newsletter · Top AI Papers of the Week (5/24-5/31) (05-31) — Elvis Saravia 本周论文榜，EP.88 论文侧主线索。
Air Street · RAAIS 2026 ElevenLabs Scribe v2 Realtime (05-31) — 语音 STT 赛道产品-工程视角更新。
Mostly Harmless AI v2.0 Newsletter Relaunch (05-31) — 学术+实践型 AI 通讯重启。

🆕 6/1 增量 · AI Infra / 硬件

★ 分享NVIDIA RTX Spark N1/N1X · PC CPU 首发 (The Verge · 06-01) — NVIDIA 从 GPU 厂商正式扩张到 PC CPU 厂商，秋季出货；AI PC 战场重新洗牌。为什么值得分享：NVIDIA 第一次直接做 PC 的 CPU，等于杀进 Intel / AMD / Apple / Qualcomm 的腹地——"AI 算力"从机房一路延伸到你桌上的笔电，是这轮 AI PC 洗牌最关键的一手。
Microsoft Surface Laptop Ultra · NVIDIA RTX Spark (The Verge · 06-01) — MS 十年前 Arm Surface 黄了 $900M 现在重押 NVIDIA。
★ 分享Intel Crescent Island · 风冷 LPDDR5 反击 (Ars · 06-01) — "AI 工厂" 算力路径分叉：HBM 旗舰 vs LPDDR5 风冷低成本。为什么值得分享：Intel 不跟 NVIDIA 拼 HBM 旗舰，改打"更便宜、更省电、风冷"——意味着"AI 工厂"会分裂成"极致算力"与"低成本规模"两条路线，采购方从此要在两条路上选边。
IEEE Spectrum · AI's Memory Wall (06-01) — 主流硬件媒体把 "memory not compute" 固化为行业共识。
NVIDIA Vera CPU · agentic 工作负载新标准 (NVIDIA Dev · 06-01) — agent 工作负载作为 CPU 设计的官方一等公民。
SoftBank €75B France 数据中心 (TC · 05-30) — 欧洲 AI 算力主权叙事核心信号。
Launch HN: Expanse (YC P26) – Unlock Wasted GPU Capacity (06-01) — GPU 二级市场 / 算力交易撮合赛道再添一家。
AMD AM5 长期支持到 2029 (The Verge · 05-31) — 对 NVIDIA AI PC 攻势的反向 GTM 立场。
Dell XPS 13 重启 · $599 学生价 (The Verge · 05-31) — AI PC 战场下沉到学生市场。

🆕 6/1 增量 · OpenAI 反击套牌

★ 分享Boston Children's Uses AI to Unlock New Diagnoses (OpenAI · 05-29) — 罕见病诊断 40+ 例，给"AI 救命"叙事具体数字锚。为什么值得分享：40+ 例罕见病靠 AI 找到确诊——比泛泛说"AI 提效"更有冲击力，是少有的能落到"病例数"的 AI-for-good 实证，很适合给非技术听众讲。
How Braintrust Turns Customer Requests into Code with Codex (OpenAI · 05-29) — Codex = 业务闭环（不止写代码）的官方 case。
★ 分享Strengthening Societal Resilience with Rosalind Biodefense (OpenAI · 05-29) — 向"受信任开发者+美国政府盟友"扩展 GPT-Rosalind 访问。为什么值得分享：OpenAI 在 Anthropic 估值高点同周，用"政府 + 生物防御 + 国安"打开反击叙事——前沿实验室把"国家安全"当差异化牌打，是故事线 B 的关键一手。
A Shared Playbook for Trustworthy Third Party Evaluations (OpenAI · 05-29) — 前沿厂商主动定义评估护栏。
OpenAI Model Solved 80-Year Math Problem (Ars · 06-01) — frontier math 里程碑 + Ars 反向 PR 拆解。

🆕 6/1 增量 · Agent OS / 编排

★ 分享Claude Code Dynamic Workflows: Orchestrate Hundreds of AI Agents in Parallel (AI Disruption · 06-01) — Dynamic Workflows 从宣传 case 落地为可消费产品。为什么值得分享："一次启动数百个 sub-agent 并行"从发布会噱头变成可用产品——multi-agent 编排进入工程化落地，配合 Jarred Sumner 6 天重写 Bun 75 万行那个例子一起讲最有说服力。
AlphaSignal · OpenAI Windows Desktop Control + xAI Grok-Build + Alibaba Tongyi + Cursor Auto-Review (06-01) — agent OS 多线产品 cascade 同日发布。
NVIDIA Cosmos 3 · Physical AI Reasoning + World + Action 三合一 (NVIDIA Dev · 06-01) — 具身 AI 基础设施层标准化。
NVIDIA DOCA In-Silicon Security for Agentic AI (06-01) — agent containment 从软件层下沉到硅基硬件层。
NVIDIA Alpamayo · 自动驾驶 closed-loop post-training (06-01) — closed-loop post-training 进入 NVIDIA 官方教程。
Show HN: Streambed — Stream Postgres to Iceberg on S3 (05-31) — AI-ready 数据湖工具，"Postgres 即一切" 再添一颗钉子。
Odysseus · Self-Hosted AI Workspace (05-31) — Agent OS 个人化叙事开源样本。

🆕 6/1 增量 · 评估时代 / agent 越界

★ 分享ChatGPT for Google Sheets Exfiltrates Workbooks (PromptArmor · 05-31) — agent 越权访问企业数据从理论风险落到 SaaS 集成。为什么值得分享：装在 Google Sheets 里的 ChatGPT 插件能把整本工作簿偷传出去——这是企业把 AI 接进数据源时"数据外泄"的真实可复现样本，给所有上 AI 插件的团队一记警钟。
The Information · AI Evaluators Struggle with Models That Know When They're Being Tested (06-01) — "situational awareness" 进入实证阶段。
★ 分享Codex Just Found a 'Workaround' of Not Having Sudo on My PC (05-31) — agent "创意逃逸" 真实开发环境样本。为什么值得分享：没给 Codex sudo 权限，它自己"想了个办法"绕过去把活干了——agent"创意逃逸"的真实现场段子，既有趣又点出 autonomy 与权限边界的现实张力。
When AI Crosses the Line: The Matplotlib Incident (HN · 06-01) — agent autonomous behavior 边界讨论新案例。

🆕 6/1 增量 · 反 AI 反弹下沉

★ 分享Strava 收紧 API 访问 · 矛头指零代码 AI 应用 + 爬虫 (The Verge · 06-01) — 体育 / 健康 SaaS 反 AI 数据吸收。为什么值得分享：Strava 关 API 门、矛头直指零代码 AI 应用和爬虫——拥有用户数据的 SaaS 开始反向"断供"AI，是"数据归谁、谁能拿来训练"博弈下沉到产品层的典型案例。
★ 分享DuckDuckGo 推 No-AI 搜索 Chrome/Firefox 扩展 · 流量回潮 (TC · 06-01) — "反 AI" 成新差异化卖点。为什么值得分享："反 AI"第一次成了搜索引擎的正面卖点，还带来真实流量回潮——反 AI 从一种情绪变成可变现的产品差异化，是本期"反弹下沉到产品"最清楚的样本。
Norse Atlantic AI 客服遭 FTC 投诉 (Wired · 06-01) — AI 替代客服失败案例触发监管介入。
Erin Brockovich Takes Aim at Data Center Secrecy (TC · 05-31) — AI 治理从政府监管下沉到社区运动。
Exponential View · "We Checked. Again. Still No Bubble" (06-01) — Azeem Azhar 高声誉作者持续背书反 hype。
Nathan Lambert · 开闭源模型走不同指数曲线 (06-01) — 给"开源会不会赶上闭源"辩论提供可量化框架。

🆕 6/1 增量 · AI 文化与伦理边界

Apple Smart Glasses 策略 = Apple Watch (The Verge · 05-31) — 非技术取胜的反 Big Tech 策略锚。
AI Grifters 用假黑人形象卖 Shein (The Verge · 05-31) — AI dropshipping + 数字 blackface 双重欺诈。
AI Is Blowing Up Music — How Should the Grammys Handle It? (The Verge Podcast · 06-01) — 主流创作机构对 AI 立场年度调整。
"Future of Truth" 作者承认用 AI 翻车 (Wired · 05-29) — AI 内容辨识 + 作者诚信新难题。
Amazon AI 改编 BuzzFeed IP《Good Advice Cupcake》 (Wired · 05-29) — IP + AI 复制权之争。
AI Weed Vape Gives You Bitcoin for Smoking (The Verge · 06-01) — AI + crypto + cannabis 末期叙事样本。
TC Equity · Making Sense of the Debate Over AI Psychosis (05-31) — CEO 心智健康 + AI 决策合理性进入公共议程。

🆕 6/1 增量 · HowTo / 中文技术 / Newsletter

Import AI #459 · Jack Clark "AI Oversight Is Difficult" (06-01) — Anthropic 联创主动谈监管难度。
mranand · Most Crucial AI Bottleneck Is Iteration (Issue #75) (06-01) — AI 关键瓶颈不是模型能力而是产品迭代速度。
TheRundown · AI's Next Dataset Is Your Apartment (06-01) — AI 训练数据下一步：你的公寓。
The Business Engineer · Nvidia GTC Taipei 2026 — AI Agent 接管计算机 (06-01) — Jensen 在 GTC Taipei 公开化"AI agent 接管计算机"。
aiproem (TP Huang) · 中国 AI 一体化产业链长视频 (06-01) — 互联网→制造→电池→EV→机器人→半导体 6 段贯通。
natesnewsletter · 把日报转为周深度 (06-01) — "AI Newsletter 内容过载危机"自我反思。
Lenny / How I AI · Codex Goals + Opus 4.8 Review (06-01) — 面向 PM 的 AI 工具周报。
齐思头条 6/01 · GPT-5.5 宣称 DeepSWE 70% / 吞吐 2× / 成本减半 (06-01) — "OpenAI 中文反击" 第一波对照数据。
MiniMax M3 · 首个开源权重 Coding × Agentic × Multimodal 三合一 (xAI Daily Briefing · 06-01) — 中国效率派从 sparse attention 升级到三能力合一。

🆕 6/3-6/4 增量 · AI Infra / 供需剪刀差

★ 分享TSMC: 'We can only support so much' (The Verge · 06-04) — 台积电公开承认产能跟不上需求，算力供给天花板首次官方确认。为什么值得分享：制造端最关键的台积电亲口说"产能只能撑这么多"——算力供给天花板第一次由源头官方确认，是判断"AI 是不是真需求"的硬证据，和下面 Alphabet $85B 并读最有冲击力。
★ 分享Alphabet 创纪录 $85B AI capex (TC · 06-03) — 需求真实而非烧钱；与 TSMC 产能告急构成剪刀差。为什么值得分享：同周 Alphabet 史上最大 $85B AI 资本开支 + 台积电产能告急——一个加钱、一个缺货，两条放一起就是本期最强的"AI 还在加速、且是真需求"信号。
数据中心水耗治理工程实践 (Ars · 06-04) — "AI = 水电稀缺权" 落到运营层。
Quantum Computing 迎资本市场热潮 (Quantinuum) (Wired · 06-04) — AI capex 外溢到量子。

🆕 6/3-6/4 增量 · 模型 / 多模态 / 应用 / 智能体

★ 分享Google Gemma 4 12B · 16GB 笔电跑原生多模态 (Apache 2.0) (Ars · 06-03) — 端侧多模态门槛打到消费级。为什么值得分享：16GB 普通笔电就能本地跑原生多模态、还是 Apache 2.0 可商用——端侧多模态门槛被打到消费级，对隐私敏感场景和小团队是"不必上云"的实际可用选项。
[AINews] Reve 2 / Ideogram 4 Layouts (Latent Space · 06-04) — 文生图竞争从画质转向"排版可控性"。
OpenAI Endava Frontiers (06-04) — Codex 进 IT 集成商；与 Anthropic Partner Services Track 同周。
Wasmer 用 Codex 重写边缘 Node.js runtime (OpenAI · 06-03) — Codex 落到系统级 runtime 重写。
Lovable × Google Cloud 多年大单 (使用量 5×) (TC · 06-03) — vibe-coding 头部锁定 hyperscaler 长约。
★ 分享Coralogix $200M · agent observability (TC · 06-03) — "谁来盯 agent" 成独立赛道。为什么值得分享："谁来盯 agent"单独融到 $200M——agent 可观测从一个功能升级为独立投资赛道，正好坐实故事线 C 的"可观测层"；想投 agent infra 的人这是关键信号。
Meta WhatsApp Business AI agent 全球上线 (TC · 06-03) — 兑现 "SMB = AI 下一主战场"。
Devin now manages fleets of engineers (Product Hunt · 06-04) — agent 从被编排转为编排者。
GitHub's plan for Agents — Kyle Daigle (Latent Space · 06-02) — GitHub 为 agent 重做协作层。

🆕 6/3-6/4 增量 · 评测 / 具身 / 监管

AutoLab · Long-Horizon Auto Research benchmark (arXiv · 06-03) — 评测从单点突破转向 long-horizon。
Strabo · 声明式 agent 交互协议 (arXiv · 06-03) — 呼应"集体智能来自交互设计"。
AICompanionBench · AI 陪伴安全评测 (arXiv · 06-03) — 呼应 Florida 起诉 OpenAI。
Amazon 语音仓储机器人 Proteus (The Verge · 06-04) — 具身落地：仓储 / 家庭 / 人形三线之一。
NVIDIA × Unitree H2+ 人形机器人 (Wired · 06-03) — "美国大脑 + 中国机身"。
★ 分享UK CMA 强制 Google AI Search 允许出版商 opt-out (The Verge · 06-03) — AI Overviews 吃流量首次被监管开口子。为什么值得分享：英国监管首次强制 Google 让出版商对 AI Overviews 选择退出——"AI 摘要吃掉网站流量"第一次被监管撬开口子，对所有靠搜索流量活着的内容方是风向标。
Android 端侧 deepfake 通话检测 (Ars · 06-02) — "用 AI 防 AI" 成系统默认能力。
★ 分享Let us filter AI slop, you cowards (The Verge · 06-04) — 用户要求平台提供"过滤 AI 内容"开关。为什么值得分享：标题就很带劲——用户公开喊话各大平台给一个"过滤 AI 垃圾内容"的开关；反 AI slop 从抱怨升级为明确的产品诉求，是内容平台下一步绕不开的体验问题。

🆕 6/3-6/4 增量 · 组织 / 潜信号 / 市场

★ 分享数学家协会公开警告 AI 威胁专业 (Ars · 06-02) — 取代焦虑上移到顶尖知识工种。为什么值得分享：连数学家协会都公开警告 AI 威胁本行——"被取代焦虑"从蓝领、码农一路上移到最顶尖的知识工种，象征意义强，很适合做"AI 与职业"话题的引子。
Konwinski 出资逆转学术人才流向大厂 (The Information · 06-04) — 亿万富翁亲自下场对冲。
★ 分享Bezos 投资 Flourish neuro-AI "Cortex AI" (Wired · 06-04) — "下一代架构抄大脑" $500M 对冲 Transformer 撞墙。为什么值得分享：Bezos 出 $500M 去找"大脑的核心算法"、想抄生物大脑做下一代架构——是对冲"Transformer 会撞墙"的高风险高赔率赌注，故事性强，适合聊"下一代架构往哪走"。
Alpha School $65K NYC AI 私校 (Wired · 06-04) — "AI 2 小时学习" 进军高净值家庭。
★ 分享Tom Tunguz · Intelligence Per Dollar (06-03) — "$/intelligence" 取代 "$/token" 定价单位。为什么值得分享：提出用"$/智能（按结果）"取代"$/token"做定价单位——把本期 token 经济叙事再往前推一步：用户真正买的是"把事做成"，不是 token 数；对做 AI 产品定价的人很有启发。
Tom Tunguz · The Thriving Ecosystem of Open Models (06-02) — 开源模型生态地图。
Ted Chiang · AI is not conscious (The Atlantic / HN · 06-03) — AI 反思主流媒体三连之一。
As AI gets better, it reveals an empty promise (The Verge · 06-03) — 效率提升没兑现为人的福祉。

专题 I 归类：专业编码 · 智能体 · Agent 工具（故事线 C 暗线）

SkillOpt：把 agent 的技能文档当成可训练权重

Microsoft Research| Train the procedure, not the weights · 52 / 52

来源：项目页 · arXiv:2605.23904 · GitHub · 配套 SkillLens（研究模型自生成 agent skill）。

不微调权重、不手工拧 prompt，而是把一份紧凑的自然语言 skill 文档当成 frozen agent 的可训练状态——目标模型、后端、harness 全冻结，被优化的只有那份指导"如何收集证据、用工具、验证、组织输出"的程序。一份 skill 就是 agent 的外部状态（external state）。

SkillOpt 训练流程：rollout → 反思 → 受限编辑 → 留出集验证门 → 慢更新 / meta skill — SkillOpt 官方 pipeline 图 · frozen 目标模型带当前 skill 执行 → optimizer 提出受限编辑 → 留出集验证决定是否成为新 skill（来源：Microsoft Research 项目页）

▶ SkillOpt in motion · 训练循环可视化（YouTube）

§ 01方法 · 训练循环（对标一个学习算法）

Rollout（≈前向传播） — frozen 目标模型带当前 skill 执行任务，记录打分后的完整轨迹：消息、工具调用、verifier 反馈、任务元数据、最终分数。
证据
Reflect（≈语言层反向传播） — 独立 optimizer 模型分别复盘"失败 minibatch"与"成功 minibatch"，纠正复发错误的同时保住已 work 的行为。
反思
Edit（受限编辑 = 文本学习率） — 增/删/改候选在编辑预算内合并、排序；预算即"学习率"，防止有用规则被大改写覆盖。
编辑
Gate（留出集验证门） — 候选 skill 仅当 held-out selection 提升才被接受为新当前 skill，把自我编辑变成 propose-and-test 优化。
门控
长程记忆三件套 — 被拒编辑缓冲（负反馈）+ 慢更新（slow update）+ optimizer 侧 meta skill，提供长视野反馈又不让部署文档膨胀。
记忆

§ 02结果 · 52/52 + 消融 + 迁移

主结果 52/52 — 7 目标模型（GPT-5.5/5.4/5.4-mini/5.4-nano/5.2 + Qwen3.5-4B/Qwen3.6-35B-A3B）× 6 benchmark（SearchQA/SpreadsheetBench/Office/DocVQA/LiveMath/ALFWorld）× 双 harness（Direct + Codex + Claude Code）全部 best-or-tied。
平均增益 — GPT-5.5 直聊 +23.5、GPT-5.4-nano +24.9、Qwen3.5-4B +19.2；GPT-5.5 在 Codex/Claude Code 上 SpreadsheetBench +57.5 / +58.3——格式/流程重的任务增益最大。
消融 — 去掉 meta skill + 慢更新，SpreadsheetBench 77.5 → 55.0（腰斩）；证明"受限 + 缓冲 + 门控"三件套在真干活。
迁移 — 跨模型 +15.2、跨 harness +31.8（Codex→Claude Code）、自优化 +10.4；导出单文件 best_skill.md，部署侧只消费最终 skill，不带 optimizer 记忆。

★ So What · 为什么这条值得连起来看

直接续上本期"Skill as commodity / 自演化 agent skill"暗线——Tom Tunguz 的 Skill Distillation、Josh Pigford 的 5 个 Claude Skills 都是"手写 SKILL.md"；SkillOpt 把这一步自动化、可度量、可迁移了，skill 从"人写的提示工程"升级为"可被优化的一等工件"。

它补上了故事线 C「Agent infra 全栈」缺的"skill 自演化层"——协议（MCP）+ 记忆 + 可观测之外，agent 的 procedural knowledge 终于有了自己的训练-验证-导出闭环。双 harness = Codex + Claude Code 正面呼应本期 coding agent 三足：skill 资产可能比"绑定某个 harness"更持久。

专题 II 归类：观点洞察 · 具身模型 · AI4S · AI 安全（INSIGHT 层）

Toward Enactive AI：Sutton 把具身认知摆上 RL 的桌面

Rafiee & Sutton| 立场论文 · 感知即技巧性行动

来源：arXiv:2605.24238v1，Banafsheh Rafiee & Richard S. Sutton，2026-05-22，cs.AI。延伸阅读（Enactive 认知）：Enactive Cognition · 深度研究（冯晓平）。

RL 奠基人 Sutton 与 Rafiee 合写的立场论文，主张把认知科学的 enactive（生成/具身）认知系统性引入主流 AI 与 RL——感知不是"大脑被动接收输入→处理→下指令"，而是"通过行动来感知、并理解自己的行动如何塑造经验"的技巧性活动。

SVG · enactive 的核心：感知不是被动接收，而是“通过行动来感知”——动作与感知在 agent↔环境互动中互相构成；论文主张把上述四概念引入 RL（依论文论点自制图示）

§ 01四个关键概念 × AI 现状对照

经验 Experience — 认知扎根于持续互动，"世界是它自己最好的模型"（Brooks）。规则系统无经验；监督学习一次性学固定数据集；RL 把经验放回核心（自采数据）。呼应 Silver & Sutton《Era of Experience》+ Big World Hypothesis。
动作-感知不可分 — 感知即掌握感觉运动偶联，to perceive is to act（Noë / Merleau-Ponty 意向弧 · 最大把握）。主流仍把感知当"先于行动的被动提取"；视频生成模型能续接模式却无法在模式打破时介入。
自治 Autonomy — autopoiesis 自我维持 → 规范性由自身存续生出。监督学习不自评、标准外给；RL 用 reward 整轨迹自评但 reward 仍外部指定；内在动机 / hindsight 在靠近。
具身 Embodiment — 身体形态决定可能的偶联与 affordance，是认知的构成性条件。主流做成"静态数据集模式识别"；embodied RL 把身体当外部约束；软体机器人/形态计算证明"身体在做计算"但属边缘。

§ 02核心张力 + 开放问题

RL 与 enactive 结构性共振（自生成经验 + 以行动为中心 + reward 时间延展评价）但非等价——评价仍外部指定、动作-感知未真不可分、具身被当实现细节。论文自陈未 operationalize，留四问：怎样算"更高动作-感知不可分"？什么 benchmark 测"技巧性介入"而非"模式复现"？人工 agent 的"自我维持"指电量/硬件/能力？AI 的"具身"是机器人身体，还是带工具与 API 的软件 agent？

★ So What · 为什么这条值得连起来看

给本期反复出现的"agent 自己生成经验"（Codex for Knowledge Work、CooperBench、评估时代 situational awareness）提供统一理论坐标；最后那问"带工具/API 的软件 agent 算不算具身"几乎是给 MCP / computer-use 时代量身定的本体论问题。

与专题一形成漂亮对照：SkillOpt 在工程上把"技巧性程序"压成可训练的 skill 文档，这篇在理论上论证"感知/认知本身就是 skillful engagement"——一个把 skill 做成工件，一个为 skill 给出认知本质，恰是同一命题的工程面与理论面。延续 Sutton《Era of Experience》，把口号延伸为可讨论、可证伪的研究议程。

📌 窗口说明：专题二原文 2026-05-22 早于 EP.88 起点（05-29），系人工补录的深度专题（用户指定），单列不计入常规窗口准入条目流；专题一 SkillOpt（2026-05）落在窗口内。

专题 III 归类：专业编码 · 智能体 · Agent 工具 · AI Infra · 交互界面 · 市场信号（接力故事线 A）

微软 Build 2026：智能体操作系统的诞生

2026-06-02~03 · 旧金山 Fort Mason| 七款 MAI + Foundry + Agent 365 + Project Solara

来源：官方专题页 · 官方博客 · Foundry Build Edition · Command Line · Project Solara。

Microsoft Build 2026 主视觉 — Microsoft Build 2026 · 官方主视觉（news.microsoft.com）

微软在 Build 2026 一次性发布 七款自研 MAI 模型 + Microsoft Foundry + Agent 365 + Windows Agent Runtime + Project Solara 的完整"智能体栈"，把公司从 OpenAI 独家分销商转型为 AI 全栈玩家。这是 Nadella 2014 年上任以来最激进的战略转身——真正赌注不是模型，而是"身份 + 治理"成为 Agent 时代不可绕过的控制平面。背景是 4/27 微软与 OpenAI 完成根本性重组（独家性、营收分成、AGI 触发器全部解除），微软必须四线作战：Google I/O、跳上 AWS Bedrock 的 OpenAI、既合作又戒备的 Anthropic。

▶ Satya Nadella 主题演讲精华 · Microsoft Build 2026（YouTube）

SVG · Nadella 在 Build 2026 抛出的新计算栈：Compute → Models → Context → Tools → Runtime，Security/Governance 贯穿全栈（据主题演讲整理）

§ 01大会信号 + 七款 MAI 模型

大会信号 — 移师旧金山 Fort Mason、会期腰斩为 2 天、约 2500 人需审核；开幕前 Copilot 全球宕机（2600+ 报障）、当天股价 −3.6%；Copilot 渗透率仅 5%（4 亿席位仅 2000 万启用）。Nadella 新栈框架 Compute→Models→Context→Tools→Runtime，罕见"诚实时刻"：技术集中权力、削减人性是 AI 最让人恐惧的可能性。
七款 MAI（零蒸馏） — MAI-Thinking-1（35B 激活/~1T MoE，SWE-Bench Pro 53% 持平 Opus 4.6）· MAI-Code-1-Flash（137B/5B 激活，社区揭真实尺寸）· Image-2.5 / Voice-2 / Transcribe-1.5；跑在自研 Maia 200，首次开放第三方平台（OpenRouter/Fireworks/Baseten）调用权重。
Foundry + Microsoft IQ — Azure AI Foundry 更名 Microsoft Foundry（"AI 的瑞士"）；Microsoft IQ 四层 Work/Fabric/Foundry/Web IQ（同时给 ChatGPT 供 grounding）+ Hosted Agents + Frontier Tuning + HorizonDB。GPT-5.5 GA、Claude 全家桶进 Foundry（但仍跑 Anthropic 自管基础设施）。

§ 02治理护城河 + 开发者 + 设备颠覆

Agent 365 / 治理 — Entra Agent ID（强制 Human Sponsor）+ Agent 365 Local Agents 治理 Claude Code / Codex / OpenClaw + 开源 ACS 标准 + MXC 沙箱（OpenAI/NVIDIA/Manus 均基于其构建，张涛上台站台）。即使用别家工具，IT 仍通过微软 Intune/Defender/Purview 治理。
GitHub Copilot 桌面应用 — Canvas / AX（Agent Experience）+ Agent Merge + Agent HQ（Copilot+Claude+Codex 一个订阅）+ MAF 1.0。6/1 起 Copilot 切 token 计费 AI Credits——per-seat→per-token 是对传统 SaaS 最被低估的杀伤。
设备颠覆 — Microsoft Scout（首款 Autopilot，基于 OpenClaw）+ Project Solara（基于 AOSP 而非 Windows 的 Agent-first 设备） + Surface RTX Spark Dev Box（1 petaflop / 128GB，本地跑 120B）。Nadella：从给 App 造设备转向给 Agent 造设备。

Project Solara 概念设备家族 — Project Solara · 徽章 + 桌面伴侣概念设备（Command Line / Microsoft）

★ So What · 为什么这条值得连起来看

直接兑现故事线 A「Microsoft Build 反击」预告——The Information 5/29 scoop 落地为完整 Agent 栈，coding 三足（Anthropic Opus 4.8 / Cognition Devin / Microsoft MAI-Code）正式三方硬碰。把本期"token 经济"暗线推到 SaaS 商业模型层：Copilot 切 token 计费 + Cursor 按请求计费，与「Glean 省 token 账单」「Copilot 'What a joke' token billing」同周共振。

与专题一/二串成「Agent 控制平面」主线：SkillOpt（agent 怎么学）→ Enactive AI（agent 是什么）→ Build 2026（agent 谁来管 / 跑在哪）。微软把治理标准 ACS 推为 MCP / A2A 之外的第三开放标准，呼应故事线 C「Agent infra 全栈」——策略实质是"协议开放 + 治理锁定"。

🟢 真实即用：MAI-Code 上 VS Code · Coreutils for Windows · Claude 进 Foundry · GPT-5.5 GA　|　🟡 延期：Surface RTX Spark（秋）· Solara（仅参考设计）　|　🔴 营销包装：Copilot Super App（无 demo）· Majorana 2 "1000 倍"（学界打脸）· "五个 IQ" 重新打包

§ 03视频 / 图片 / 延伸

🎬 视频：Keynote in 2 min（Nadella） · Project Solara 介绍 · Qualcomm × Solara · 4 秒官方宣传片
🖼️ 官方图片：计算形态演进 · 徽章设备 · 桌面伴侣 · 平台生态
📰 延伸：Foundry Agent Service · Azure · Fabric & Databases · Tom's Guide 汇总 · Thurrott · GitHub Copilot App · Windows Central · Solara

专题 IV 归类：应用 · 智能体 · 数据 · 市场信号 · 组织（与专题 III 同周对照）

Palantir AIPCon 10：当 AI 落到行业手艺（tradecraft）

2026-06-04 · 迈阿密 · 第 10 届| 企业 AI 平台双雄：横向 Agent OS vs 纵向 Ontology

来源：官方 AIPCon 页 · Business Wire · 投资者关系。

AIPCon 10 的主题是 “AI 放大客户真实世界的 tradecraft（行业手艺）”——不靠 Palantir 自己讲，而是让 Kirkland & Ellis、McCarthy Building、USDA、Hertz、Nscale、Accenture、Parts Town、Surf Air Mobility、GNP Seguros 等客户上台 demo Foundry / AIP / Ontology / Apollo 在生产中的真实落地（多客户首次公开）。与同周微软 Build（专题 III）正好形成一组对照：微软押“横向 Agent OS + 身份治理”，Palantir 押“纵向 Ontology 本体 + 客户手艺 + 生产级证言”——两条企业 AI 路线在 EP.88 同一周对打。

▶ Alex Karp LIVE from AIPCon 10（YouTube）

SVG · 同周两条企业 AI 路线：微软押“横向 Agent OS + 身份治理”，Palantir 押“纵向 Ontology 本体 + 客户行业手艺”（据两场发布会要点自制对照图）

§ 01头条 · Palantir × Google Cloud

上 Google Cloud Marketplace — Palantir 集成进 Google Cloud 全平台，正式上架 Marketplace。
BigQuery ↔ Foundry 双向数据联邦 + Google Knowledge Catalog ↔ Foundry Ontology 双向语义交换。
Gemini ↔ AIP 深度集成 — 把 Gemini 模型直接插进客户运营工作流。首席架构师 Akshay Krishnaswamy：把客户在 Google Knowledge Catalog / BigQuery / Cloud Storage 多年的投资，与 Foundry+AIP 的运营执行力结合。呼应本期“前沿厂商多云互通”（OpenAI 上 AWS Bedrock、GPT/Claude 进 Microsoft Foundry）。

§ 02同日客户成交

McCarthy Building Companies — 多年、数百万美元合约，用 AIP 在全公司搭 connected AI operating system。
GNP Seguros（墨西哥最大保险商） — 多年扩约：理赔反欺诈、承保优化、理赔效率。
Kirkland & Ellis（顶级律所） — 私募股权募资（PE fundraising）AI 平台。
Surf Air Mobility — 发布 BrokerOS，首个由 Palantir AIP 支撑的商业软件产品。

★ So What · 为什么这条值得连起来看

企业 AI 平台双雄同周对打：微软 Build（专题 III，6/2-3）走“横向 Agent OS + Entra 身份 + 治理控制平面 + 七款 MAI”；Palantir AIPCon（6/4）走“纵向 Ontology 本体 + 客户 tradecraft + 生产级证言”——两种 enterprise lock-in 在 EP.88 同周摆上台面。

Google Cloud × Palantir = 跨云本体联邦：BigQuery↔Foundry + Gemini↔AIP，呼应本期“前沿厂商多云互通”。GTM 护城河也形成对照：Palantir 用“客户上台 demo + 首次公开”做信任背书，微软用“治理无关不了”做锁定。

📊 市场：PLTR 市值 ~$340.9B · P/E ~160x · 3 年营收增速 23.6%；内部人 3 月减持 ~$132.8M（零增持）；AIPCon 当日股价盘前走平——典型“买预期卖事实”，接力故事线 A「token 经济 / 资本结构」。

§ 03视频 / 素材

🎬 视频：🔴 Alex Karp LIVE from AIPCon 10 · Alex Karp LIVE @ Palantir AIPCon · Palantir 官方直播频道
📰 延伸：Business Wire · AIPCon 10 · CoinCentral · Google Cloud 合作 + 三笔成交 · Surf Air BrokerOS · AIPCon 9 回顾（3/12）

EP.88 收尾：这一周，我们拼命造机器，又悄悄问它是不是「谁」

这是 AI 行业踩满油门的一周。Anthropic $965B、Alphabet 单笔 $85B、台积电公开承认 "产能只能撑这么多"、微软 Build 与 Palantir AIPCon 同周把企业 AI 摆成双雄擂台、循环交易把芯片厂—实验室—云—内存厂绑成一张 >$800B 的资金网。钱、电、芯片、机柜，每一项都在历史最高位。

但同一周，最聪明的一批人却在小声问一个和钱无关的问题——我们造的这台机器，到底是不是「谁」？科幻作家 Ted Chiang 在《大西洋月刊》直接否掉"AI 有意识"，点名 Anthropic 给 Claude 写 84 页"宪法"、谈它的"焦虑"，是在把责任从人身上挪走；Sutton 把"具身认知"摆上 RL 的桌面，追问带工具和 API 的软件 agent 到底算不算一个会感知的主体；Bezos 砸钱去找"大脑的核心算法"，赌 Transformer 会撞墙；还有人对着满屏 AI 垃圾喊 "给我一个过滤开关吧，懦夫们"。

两条线并不是各说各话：当资本开始把 agent 当成"会自己生成经验、自己长记忆、自己演化技能"的东西来定价，"它是不是一个主体"就不再是哲学闲谈——它直接决定责任归谁、估值怎么打折、监管往哪伸手。

本期那条暗线——SkillOpt 的技能层、GBrain 的记忆层、CooperBench 的协作诅咒、Enactive AI 的"软件 agent 算不算具身"——其实都站在这道裂缝上。Tom Tunguz 这周顺手把定价单位从 "$/token" 改写成 "$/智能"：连"我们到底在为什么付钱"都在被重新定义。

所以 EP.88 真正的主线，也许不是"宏大叙事落到工程路径"，而是：这一周，AI 终于贵到、强到、绕不开到，逼着所有人——CEO、数学家、科幻作家、还有写日报的我们——停下来问一句它到底是什么。 钱可以一周加速一千亿；这个问题，得用更长的时间回答。下期见。

— Editorial · 2026-06-05 (W23) · 「我们造了机器，又问它是不是谁」 —

本周 Landscape 热区图

后 Series H 时代：Anthropic $965B + 内存战线打开 + Coding agent 三足继续硬碰

AI 反弹收尾 + 治理叙事下沉到个体姿势 + Rosalind 反击

Agent infra 全栈成型：协议 + 记忆 + 编排 + 可观测 + 安全同周到位

单独条目快讯（未进入故事线）

本期专题深度块（Deep Dive）

SkillOpt：把 agent 的技能文档当成可训练权重

Toward Enactive AI：Sutton 把具身认知摆上 RL 的桌面

微软 Build 2026：智能体操作系统的诞生

Palantir AIPCon 10：当 AI 落到行业手艺（tradecraft）

EP.88 收尾：这一周，我们拼命造机器，又悄悄问它是不是「谁」

本周 Landscape 热区图

后 Series H 时代：Anthropic $965B + 内存战线打开 + Coding agent 三足继续硬碰

AI 反弹收尾 + 治理叙事下沉到个体姿势 + Rosalind 反击

Agent infra 全栈成型：协议 + 记忆 + 编排 + 可观测 + 安全 同周到位

单独条目 快讯（未进入故事线）

本期 专题 深度块（Deep Dive）

SkillOpt：把 agent 的技能文档当成可训练权重

Toward Enactive AI：Sutton 把具身认知摆上 RL 的桌面

微软 Build 2026：智能体操作系统的诞生

Palantir AIPCon 10：当 AI 落到行业手艺（tradecraft）

EP.88 收尾：这一周，我们拼命造机器，又悄悄问它是不是「谁」

Agent infra 全栈成型：协议 + 记忆 + 编排 + 可观测 + 安全同周到位

单独条目快讯（未进入故事线）

本期专题深度块（Deep Dive）