查看完整版本: [-- AI要自己造AI了?Anthropic最新暴论,到底有多真?[3P] --]

武当休闲山庄 -> 数码讨论 -> AI要自己造AI了?Anthropic最新暴论,到底有多真?[3P] [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

huozm32831 2026-06-06 16:50

Anthropic又出暴论了。
这次他们发了一篇报告,标题叫《When AI Builds Itself》(AI在构建自己)。
先来几组数字感受一下:
截至今年5月,Anthropic超过80%的代码已经由Claude自己写;工程师人均代码产出翻了8倍;Claude可以连续自主工作超过16小时。
Anthropic给出的判断是,如果按现在的趋势继续下去,AI自己设计、构建下一代AI,是完全可能发生的。
基于这种风险,Anthropic甚至呼吁全球放缓前沿AI研发!
观点一出,社交媒体立刻炸了:"AI要自己造自己了!""递归自我改进(RSI),奇点要来了!"
熟悉的配方,熟悉的味道。
如果你在AI圈混了超过两年,一定认得这个节奏:
每隔几个月,就会有一家头部AI公司抛出一个让人觉得"时代要变了"的论断;
社交媒体集体进入焦虑模式,然后……
日子还是照过。
前几天OpenAI刚说完“AI显现出递归自我改进(RSI)的早期迹象",Anthropic后脚就来一篇"AI正在造下一个自己"。
现在连营销话术都要你追我赶了吗?
今天这篇文章就来拆解一下,Anthropic和OpenAI说的RSI到底是什么?现在到了哪一步?未来AI可能走向哪里?
看完你再决定,到底该不该焦虑。

Anthropic走到了哪一步?
递归自我改进(Recursive Self-Improvement,RSI),是AI圈讨论了近二十年的老话题。
核心逻辑很简单:AI能改进自身,改进后的下一代又能改进再下一代,不需要人类介入,形成自我加速的能力飞轮。
这是AI奇点理论的触发条件。
不过在讨论"目前RSI到了哪一步"之前,你得先搞清楚,RSI不是一个临界点,而是一个阶梯。
这些年关于RSI的研究,共同给出了一把衡量RSI进度的尺子,可以把它大致分成六个阶段:
那么,Anthropic现在在哪儿?先看Anthropic自己怎么说。
Anthropic在报告里也画了一张时间轴,把AI介入AI开发,分成五个阶段:

按他们自己的地图,他们现在已经在第四阶段,离终点只剩一步。
但事实真的如此吗?
对照业界研究的六个阶段,Anthropic的位置更像是处在第3-4阶段之间,也就是半自动研究闭环和自改进Agent阶段。
Anthropic内部有一个公开披露的实验:
Claude Agent全程自主完成一个AI安全研究项目,从提假设到分析结果全部自动,用约800小时、约1.8万美元算力成本,恢复了97%的性能缺口,而两名人类研究员花了整整一周只恢复了23%。
这是一个真实运转的半自动研究闭环,说Anthropic已处在第3阶段不为过。
第4阶段的迹象同样存在。
Anthropic做了一个代码优化实验。
Claude拿到训练小模型的代码,自主运行、计时、修改、再运行,跑出了52倍的速度提升,人类熟练研究员做同样任务只能做到4倍。
这非常接近自改进Agent的逻辑:改工具链、跑benchmark、选更好的版本。
卡住RSI的关键
但值得注意的是,还有一个关键环节没被Anthropic跨越。
Anthropic在文章里提到了一个词,叫做research taste(研究品味),这是判断什么问题值得做的能力。
用他们自己的比喻:
初级员工接到的任务是"这个按钮坏了,去修";
有经验的员工接到的是"网络有时候会变慢,查一下原因";
最资深的人在思考的是"我们下个季度该做什么"。
目前,Claude在第一层已经很强,第二层在快速追赶。
但在第三层,比如“什么问题值得做、哪些结果可信、什么时候该放弃”这些研究品味上,人类仍有比较优势。
只要人类还在主导这个环节,AI就没有实现完全的自改进Agent,更不用说达到完整RSI阶段。
不过,报告里一个数字值得单独拿出来。
在"判断研究下一步该怎么走"这件事上,Claude Mythos Preview已经能在64%的情况下,被另一个Claude judge判定为提出了更好的下一步,五个月前这个数字还是51%。
这表明进化的趋势是对的,但离AI完全自主判断还很远。
更重要的是,这个数据是在问题边界清晰的情况下测量的。在真实环境里,AI能判断到什么程度,其实并无定论。

AI发展的三种结局
Anthropic抛出的数据很亮眼,但是AI未来到底会发展到什么程度,Anthropic也不敢把话说满,在报告里老老实实列出了三种情形。
第一种:趋势停在S曲线上
当AI能力增长遇到天花板——Transformer架构撞墙、算力和能源供应跟不上、地缘政治把全球AI协作切断,指数曲线会弯成S形,然后趋于平缓。
Anthropic认为,这是三种结局里最不可能发生的一种。
但他们也承认,即使是这个最温和的版本,后果也不轻松。
今天已有的模型能力就此冻结,也已经足够让一家百人公司,越来越接近过去千人公司才能完成的工作。
社会结构的震荡不会因为AI停止进步而消失,它只是换了一种形态继续。
第二种:飞轮转起来,人类还在掌舵
AI处理执行,人类负责判断;AI生成选项,人类做最终决策。
听起来是个不错的结局,但Anthropic指出了一个隐藏的麻烦:Amdahl定律,加速一个环节,瓶颈会转移到下一个。
比如代码写得快了,code review变成新的堵点;实验跑得快了,结果分析又慢下来;分析快了,决策链路又开始拖后腿。
Anthropic说他们内部已经在经历这个过程,每一波效率提升之后,下一个瓶颈就浮出水面。
它意味着人类掌舵会越来越费力,要求越来越高,人类需要在更快的节奏里做出更好的判断。
Anthropic认为这是最可能发生的近期情景,而且他们现在已经在这条路上了。
第三种:完整RSI,人类退到验证角色
AI开始自主构建后继模型,进度由算力决定,人类从主导者变成监督者和验证者。
好处在于,可能快速实现医疗突破、科学加速、贫困问题的系统性解法。
但坏的一面是,今天模型训练中,哪怕只有一个微小的目标偏差,在完整RSI的迭代循环里可能以指数速度放大,直到人类完全失去干预能力。
这是最不确定的结局。
讲完三种结局,报告末尾Anthropic开始呼吁,希望建立某种全球协调机制,在风险上升时能够有序放缓甚至暂停前沿AI开发。
翻译一下这段话的意思:AI递归自我改进势头太猛,我们很担心,觉得应该有人出面让大家一起停下来,但Anthropic不会单方面停。
多么熟悉的味道。
这套叙事Anthropic已经用了不止一次,在制造焦虑的同时,把自己定位成"威胁的发现者"和"最有能力应对威胁的公司"。
但看完Anthropic内部真实情况,以及它自己给出的AI未来可能性,你还会感到焦虑吗?

jjybzxw 2026-06-06 17:30
拆解Anthropic《When AI Builds Itself》:数据写实、叙事营销、奇点远未至
一、先厘清核心数据:80%自研代码由Claude完成≠AI自主造AI
1. 80%代码由Claude产出的真实边界
这里的代码集中在工程落地、脚本编写、模型微调配套代码、自动化运维代码,顶层架构设计、新算法范式选型、研发方向立项、训练框架底层重构全部由人类研究员敲定。工程师人均效率翻8倍,本质是AI充当高级代码助手,替代重复编码、调试、测试等体力工作,和AI从零规划下一代大模型是两码事。
2. Claude连续自主16小时、自研优化代码提速52倍,局限在给定明确任务约束:人类划定优化目标、数据集、硬件环境、验收指标,AI在框内试错迭代;脱离人类给定任务边界,AI无法自主定义“要优化什么、为什么优化”。

二、递归自改进RSI分层:当前卡在「半自动辅助研发」,离完整自我迭代还差关键一环
行业通用RSI六阶段,结合Anthropic实测落地现状:
1. 阶段1:AI辅助零散编码(已全面落地):日常写函数、调试bug,当下主流大模型通用能力;
2. 阶段2:AI完成单一模块小项目(普遍落地):给定需求,独立做完小型子任务,Claude主力落在这个区间;
3. 阶段3:半自动闭环研发(Anthropic当前主力位置):固定课题下,AI自主做实验、调参、数据分析,就像文中安全课题、代码提速实验,课题选题、方向取舍仍是人类;
4. 阶段4:自主Agent定向迭代(局部零星迹象,未规模化):Claude能在窄领域自主优化自身小模型,但无法突破原有架构、跳出人类设定的约束条件;
5. 阶段5:全链路自主研发下一代基座模型(未实现):自主发现新算法、设计全新训练范式、规划算力资源;
6. 阶段6:完整RSI奇点,无人类干预持续指数迭代(理论概念,无任何落地迹象)。

核心瓶颈:研究品味(Research Taste)是人类独有的关键壁垒
AI能解决“已知问题”,但无法自主筛选“值得研究的未知问题”:什么方向有科研价值、哪些实验该终止、异常数据是bug还是突破性发现,现阶段Claude仅64%场景能提出更优后续研究思路,且全部限定在封闭数据集、固定课题场景;放到开放真实科研环境,准确率大幅下滑。只要研发顶层选题权在人类手中,就锁死了全自主RSI的发生基础。

三、报告提出的三种未来演化路径,现实倾向性分析
1. 路径一:能力增长触顶、增速放缓(S型收敛,概率中等)
约束条件:Transformer架构瓶颈、全球算力成本、能源、半导体产能、各国AI监管落地。当前大模型靠堆算力堆数据的边际收益持续走低,未来很容易出现投入翻倍、性能微增,自然放缓扩张,Anthropic标注“最不可能”带有明显立场倾向。
2. 路径二:AI做执行、人类握决策(短期最确定,当下正在发生)
契合Amdahl定律:AI不断压缩编码、实验、运算环节成本,瓶颈持续向上游转移——代码快了,人工评审成瓶颈;实验自动化了,科研方向决策成瓶颈。未来长期形态就是人机分工:AI负责海量落地执行,人类聚焦方向把控、价值取舍,也是全球产业正在走的路线。
3. 路径三:全链路RSI自主迭代、人类退居验证(远期低概率)
收益是生物医药、基础科学爆发;风险是目标漂移指数级放大。受物理规律、算力、能源、监管多层枷锁限制,短中期没有落地土壤,更多是远期风险推演。

四、行业套路:“渲染奇点风险+呼吁全球控速”是头部AI厂商经典商业叙事
1. 话术逻辑:一边渲染AI自我进化风险,一边不主动停产前沿研发
Anthropic、OpenAI轮番抛出RSI早期迹象、AI自建AI、呼吁全球管控,本质三层诉求:
- 舆论层面:塑造行业先行者、风险预警者形象,抢占AI安全赛道话语权;
- 政策层面:推动全球统一监管,抬高中小厂商入局门槛,巩固头部算力、技术壁垒;
- 市场层面:奇点焦虑带动企业、资本加大AI安全、定制大模型投入,拓宽自身商业化空间。
2. 对照现实:两家公司均在持续加码下一代模型训练、算力采购,呼吁“全球减速”≠自我减速,是典型行业营销话术。

五、普通人不用恐慌的关键结论
1. 短期3~5年:AI定位永远是人类研发增效工具,替代繁琐重复工作,提升各行各业生产效率,人机协同是主流,不存在AI自主造AI、脱离人类管控;
2. 中长期数十年维度:即便技术持续突破,全球各国立法、算力管控、科技地缘约束会层层设限,完整RSI奇点仍是极小概率事件;
3. 理性看待数据:厂商披露的亮眼实验,全是封闭可控环境下的限定测试,无法复刻到开放无约束的真实研发全流程,媒体“AI即将自我繁衍、奇点降临”属于夸张引流解读。

姜谷粉丝 2026-06-07 11:17
Anthropic近期确实抛出了“AI可能自主构建下一代AI”的核心观点,这一论断并非空穴来风,而是基于大量实测数据和趋势推演,但“暴论”标签背后既有扎实的技术进展支撑,也存在需要理性看待的边界条件。以下是关键信息拆解与真实性分析:

一、核心论断与数据支撑:AI“造AI”已不是遥远猜想
Anthropic在2026年6月发布的报告《When AI Builds Itself》及联合创始人Jack Clark的公开言论中,明确提出了**“递归自我改进(RSI)”**的可能性,并给出了具体数据支撑:

代码生产自主化:截至2026年5月,Anthropic代码库中超80%的合并代码由Claude自主编写(2025年2月该比例仅为个位数),工程师人均代码产出效率提升至2021-2025年的8倍,普通工程师每日合并代码量是2024年的8倍

科研任务自主完成:Claude曾自主完成一项AI安全研究项目,从假设提出到结果分析全程自动化,耗时约800小时、成本1.8万美元,恢复了97%的性能缺口;而人类研究员完成同等任务耗时一周,仅恢复23%

代码优化能力爆发:Claude对训练小模型的代码进行自主优化,11个月内速度提升从2.9倍飙升至52倍,远超人类研究员4-8小时实现4倍提升的效率

研究判断力快速进化:在“判断研究下一步方向”的任务中,Claude Myths Preview能在64%的情况下被另一个Claude判定为提出更优方案(5个月前为51%),虽未完全自主,但进化趋势明确

二、RSI的“阶段论”:Anthropic自认已接近临界点
Anthropic将AI介入AI开发的过程分为5个阶段,认为当前已处于第4阶段(AI可自主完成大部分工程任务,仅需人类设定方向),距离“完全自主构建”仅一步之遥:

阶段1-3:AI辅助人类完成代码编写、任务执行、基础优化;
阶段4:AI自主完成工程闭环(如代码优化、实验复现),人类仅负责目标设定与结果评估;
阶段5:AI完全自主设计、训练、迭代下一代模型,形成“自我加速”的RSI飞轮

Jack Clark进一步量化了这一风险:“2028年底前,AI自主构建自身的可能性为60%”,核心逻辑是AI已能自动化AI研发的99%工程性工作,仅剩下1%的“范式创新”(如Transformer架构)仍依赖人类,但随着AI能力覆盖更广的领域,这一缺口正在缩小


三、真实性分析:趋势真实,但“失控”并非必然
Anthropic的论断基于真实技术进展,但“AI完全自主造AI”并非必然结果,需结合以下维度理性看待:

技术进展是实打实的:AI在代码生成、科研复现、任务优化等领域的效率提升,已验证“AI辅助AI”的可行性,RSI的“工程基础”正在快速搭建

“研究品味”仍是人类优势:Anthropic承认,AI在“判断什么问题值得研究、哪些结果可信”的第三层研究品味上,仍弱于人类。当前Claude仅能在边界清晰的任务中展现判断力,复杂场景下的“科研直觉”尚未成熟

三种未来情形并存:Anthropic在报告中明确列出AI发展的三种可能结局:
温和版:AI能力增长遇天花板(算力、能源、地缘限制),现有模型能力已足够颠覆行业,但不会自我迭代;
协作版:AI负责执行,人类负责决策,形成“人机协同”的高效研发模式;
失控版:AI完全自主构建后继模型,人类仅能监督验证,技术发展脱离人类控制

Anthropic的“自我警示”属性:作为AI安全领域的核心制定方,Anthropic的论断带有“风险预警”色彩,其呼吁“放缓前沿AI研发”的初衷,是为社会配套(伦理、法律、就业)争取调整时间,而非断言RSI必然发生

四、行业背景:头部AI公司的“共识性焦虑”
Anthropic的论断并非孤例,OpenAI近期也提出“AI已显现RSI早期迹象”,这反映了头部AI公司对技术风险的共同关注:

全球AI估值持续攀升(Anthropic拟以超1万亿美元估值IPO),技术竞争与安全风险并存;
社会对AI的就业替代、伦理失控等问题的担忧,倒逼企业主动释放“风险信号”;
RSI是AI奇点理论的核心触发条件,头部公司的论断本质上是行业对“技术临界点”的集体预判

总结:AI“造AI”是趋势,但“何时发生”“是否失控”仍需观察
Anthropic的论断基于真实技术进展,RSI的“工程基础”已初步搭建,但AI完全自主构建自身仍面临“研究品味”“算力瓶颈”“伦理约束”等挑战。短期内(2026-2028年),更可能看到的是**“人机协同的AI研发模式”**,而非“AI完全失控的自我迭代”。这一论断的价值,在于提醒人类:AI技术的“自我加速”能力正在逼近,需提前布局社会配套与风险管控。


查看完整版本: [-- AI要自己造AI了?Anthropic最新暴论,到底有多真?[3P] --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号