这不是课程作业。这些是 AI 领域工程师和研究员真正在解决的问题。 你不需要全部做完——找到一个让你停不下来的,然后冲进去。
从 Attention 到 KV Cache,理解现代大模型的核心机制。读懂这里,你就读懂了 GPT、Claude、LLaMA 的心脏。
让模型跑得更快、更省显存,同时不(太)损失质量。Speculative Decoding、量化、Paged Attention——这些技术让 ChatGPT 能服务百万用户。
Agent 如何记忆?如何从海量过去经验中检索有用信息?如何在多 Agent 之间共享和同步记忆?这是 AI 从工具变成"伙伴"的核心问题。
o1、DeepSeek-R1 告诉我们:让模型"多想一会儿",它会更聪明。但多思考多少才够?什么问题值得多思考?这些是现在最热的研究方向。
这些挑战没有参考答案,也没有已知的最优解。完成任何一个,就已经接近研究员水平。
不用都读懂。但每做一个挑战,先把对应的论文读一遍——哪怕只读 Abstract 和 Introduction。