
@向度之桥:推荐大家去看一篇红杉资本最新发的博客,是合伙人Pat Grady和Sonya Huang联合写的。
标题很直接:AGI已经来了,就在此刻。
我花了半小时把整篇文章看完之后,发现他们说的可能不是在吹牛,今天就把这篇博客里最核心的几个观点整理出来。
1️⃣第一个观点:AGI的定义其实可以很简单
几年前,红杉的合伙人去请教顶尖AI研究者,问他们怎么定义AGI。
研究者们互相看了看,给出了一个很玄的答案:我们每个人都有自己的定义,但看到它的时候就会知道。
当时他们觉得这个回答有点难以理解,但现在,红杉给出了自己的答案。
Pat和Sonya说,我们是投资人不是技术专家,没资格给AGI下技术定义。
但从功能角度看,AGI就是能把事情搞清楚的能力,就这么简单。
从实用角度想想,你需要一个AI帮你做事的时候,你在乎的是什么?
不就是它能不能把事搞清楚吗。至于它用的什么算法,调了多少参数,这些技术细节远不如它确实把事办成了重要。
他们把这个逻辑拆解得很清楚。
一个能把事情搞清楚的人,需要三样东西:基础知识、推理能力、迭代找答案的能力。
一个能把事情搞清楚的AI,也需要三样东西:预训练带来的知识、推理时计算带来的思考能力、长周期智能体带来的迭代能力。
2022年ChatGPT带来了知识这一块,2024年底o1带来了推理能力,而最近几周Claude Code这样的编程智能体把迭代能力也补上了。
三块拼图都齐了。
2️⃣第二个观点:31分钟完成的猎头工作,没人教它该怎么做
红杉在博客里提到了一个例子,一个创始人给智能体发消息:我需要找个开发者关系负责人,技术要够硬能镇住资深工程师,但又得喜欢玩Twitter,我们客户是平台团队,你去办吧。
智能体接到任务就开始干活了。
它先去LinkedIn搜那些知名公司的DevRel职位,找到几百份简历。
但它很快发现职位头衔说明不了问题,简历上看不出谁干得好谁干得糊弄。
于是它换了个思路,去YouTube找技术大会演讲,找到50多个演讲者之后,开始筛选那些互动数据好的。
接着又把这些人拿到Twitter上交叉比对,结果发现一半人账号不活跃,要么就是转发公司博客的官方账号。
但确实找到了十几个有真实粉丝的人,他们发真实观点,和开发者互动,内容还挺有品味。
智能体继续往下挖,它注意到有三个人最近三个月发帖频率明显下降,这可能意味着对现在工作的倦怠期。
然后它开始深入调研这三个人。
第一个刚宣布了新职位,晚了。
第二个是创业公司创始人刚融完资,肯定不会跳槽。
第三个就很有意思了,她在一家D轮公司做DevRel,这公司刚在市场部门裁了人。
她最近演讲主题正好是平台工程,和这个创业公司方向完全吻合。她有1.4万Twitter粉丝,发的梗图能让真正的工程师互动,LinkedIn两个月没更新了。
智能体最后起草了一封邮件,提到了她最近的演讲,提到了和公司客户画像的重合,还说了说小团队能提供的创作自由。
总耗时:31分钟。
创始人拿到的不是一份岗位描述,而是一份只有一个人的候选名单。
关键是没人告诉智能体该怎么做每一步,它自己推理出来的:形成假设、验证假设、走进死胡同、然后转向,直到找到答案。
这就是红杉说的把事情搞清楚。
3️⃣第三个观点:每7个月翻一番的指数曲线
红杉在博客里给出了一个让人不敢信的预测,他们说长周期智能体的能力大约每7个月翻一番。
这个数据来自METR的追踪,是有实际测量支撑的。
如果沿着这条曲线往下推会发生什么?
2028年,智能体能可靠完成人类专家一整天的工作。
2034年,能完成一整年的工作。
2037年,能完成一个世纪的工作。
换句话说,你原本打算2030年实现的目标,2026年就能干成了。
这个预测引发了不小的争议。
有从业者表示认同,OpenAI的Greg Brockman转发了这篇博客。
但也有人觉得太乐观了,忽略了很多现实问题。
智能体现在还是会犯错,会产生幻觉,会丢失上下文,有时候会信心满满地往完全错误的方向跑。
不过红杉也承认这些问题,他们说趋势是明确的,而且这些失败越来越可以被修复。
判断的关键不在某个时间点的能力水平,而在能力提升的速度。
4️⃣第四个观点:从说话者到行动者,商业模式要重写
2023和2024年的AI应用是说话者,对话能力确实很强,但影响力有限。
2026和2027年的AI应用会是行动者,它们给人的感觉会像同事。
使用频率会从每天几次变成全天候运行,而且是多个实例同时开工。
用户不再是这里省几个小时那里省几个小时,而是从做一个个人贡献者,变成管理一个智能体团队。
红杉那条每7个月翻一番的指数曲线会不会成真,现在谁也说不准。
但有一点很确定,当能力提升的速度本身在加速的时候,我们对未来的预估往往会过于保守。
