武当休闲山庄 - 稳定,和谐,人性化的中文社区

查看完整版本: [-- AI要自己造AI了？Anthropic最新暴论，到底有多真？[3P] --]

武当休闲山庄 -> 数码讨论 -> AI要自己造AI了？Anthropic最新暴论，到底有多真？[3P] [打印本页]

登录 -> 注册 -> 回复主题 -> 发表主题

huozm32831

2026-06-06 16:50

Anthropic又出暴论了。
这次他们发了一篇报告，标题叫《When AI Builds Itself》（AI在构建自己）。
先来几组数字感受一下：
截至今年5月，Anthropic超过80%的代码已经由Claude自己写；工程师人均代码产出翻了8倍；Claude可以连续自主工作超过16小时。
Anthropic给出的判断是，如果按现在的趋势继续下去，AI自己设计、构建下一代AI，是完全可能发生的。
基于这种风险，Anthropic甚至呼吁全球放缓前沿AI研发！
观点一出，社交媒体立刻炸了："AI要自己造自己了！""递归自我改进（RSI），奇点要来了！"
熟悉的配方，熟悉的味道。
如果你在AI圈混了超过两年，一定认得这个节奏：
每隔几个月，就会有一家头部AI公司抛出一个让人觉得"时代要变了"的论断；
社交媒体集体进入焦虑模式，然后……
日子还是照过。
前几天OpenAI刚说完“AI显现出递归自我改进（RSI）的早期迹象"，Anthropic后脚就来一篇"AI正在造下一个自己"。
现在连营销话术都要你追我赶了吗？
今天这篇文章就来拆解一下，Anthropic和OpenAI说的RSI到底是什么？现在到了哪一步？未来AI可能走向哪里？
看完你再决定，到底该不该焦虑。

Anthropic走到了哪一步？
递归自我改进(Recursive Self-Improvement，RSI)，是AI圈讨论了近二十年的老话题。
核心逻辑很简单：AI能改进自身，改进后的下一代又能改进再下一代，不需要人类介入，形成自我加速的能力飞轮。
这是AI奇点理论的触发条件。
不过在讨论"目前RSI到了哪一步"之前，你得先搞清楚，RSI不是一个临界点，而是一个阶梯。
这些年关于RSI的研究，共同给出了一把衡量RSI进度的尺子，可以把它大致分成六个阶段：
那么，Anthropic现在在哪儿？先看Anthropic自己怎么说。
Anthropic在报告里也画了一张时间轴，把AI介入AI开发，分成五个阶段：

按他们自己的地图，他们现在已经在第四阶段，离终点只剩一步。
但事实真的如此吗？
对照业界研究的六个阶段，Anthropic的位置更像是处在第3-4阶段之间，也就是半自动研究闭环和自改进Agent阶段。
Anthropic内部有一个公开披露的实验：
Claude Agent全程自主完成一个AI安全研究项目，从提假设到分析结果全部自动，用约800小时、约1.8万美元算力成本，恢复了97%的性能缺口，而两名人类研究员花了整整一周只恢复了23%。
这是一个真实运转的半自动研究闭环，说Anthropic已处在第3阶段不为过。
第4阶段的迹象同样存在。
Anthropic做了一个代码优化实验。
Claude拿到训练小模型的代码，自主运行、计时、修改、再运行，跑出了52倍的速度提升，人类熟练研究员做同样任务只能做到4倍。
这非常接近自改进Agent的逻辑：改工具链、跑benchmark、选更好的版本。
卡住RSI的关键
但值得注意的是，还有一个关键环节没被Anthropic跨越。
Anthropic在文章里提到了一个词，叫做research taste（研究品味），这是判断什么问题值得做的能力。
用他们自己的比喻：
初级员工接到的任务是"这个按钮坏了，去修"；
有经验的员工接到的是"网络有时候会变慢，查一下原因"；
最资深的人在思考的是"我们下个季度该做什么"。
目前，Claude在第一层已经很强，第二层在快速追赶。
但在第三层，比如“什么问题值得做、哪些结果可信、什么时候该放弃”这些研究品味上，人类仍有比较优势。
只要人类还在主导这个环节，AI就没有实现完全的自改进Agent，更不用说达到完整RSI阶段。
不过，报告里一个数字值得单独拿出来。
在"判断研究下一步该怎么走"这件事上，Claude Mythos Preview已经能在64%的情况下，被另一个Claude judge判定为提出了更好的下一步，五个月前这个数字还是51%。
这表明进化的趋势是对的，但离AI完全自主判断还很远。
更重要的是，这个数据是在问题边界清晰的情况下测量的。在真实环境里，AI能判断到什么程度，其实并无定论。

AI发展的三种结局
Anthropic抛出的数据很亮眼，但是AI未来到底会发展到什么程度，Anthropic也不敢把话说满，在报告里老老实实列出了三种情形。
第一种：趋势停在S曲线上
当AI能力增长遇到天花板——Transformer架构撞墙、算力和能源供应跟不上、地缘政治把全球AI协作切断，指数曲线会弯成S形，然后趋于平缓。
Anthropic认为，这是三种结局里最不可能发生的一种。
但他们也承认，即使是这个最温和的版本，后果也不轻松。
今天已有的模型能力就此冻结，也已经足够让一家百人公司，越来越接近过去千人公司才能完成的工作。
社会结构的震荡不会因为AI停止进步而消失，它只是换了一种形态继续。
第二种：飞轮转起来，人类还在掌舵
AI处理执行，人类负责判断；AI生成选项，人类做最终决策。
听起来是个不错的结局，但Anthropic指出了一个隐藏的麻烦：Amdahl定律，加速一个环节，瓶颈会转移到下一个。
比如代码写得快了，code review变成新的堵点；实验跑得快了，结果分析又慢下来；分析快了，决策链路又开始拖后腿。
Anthropic说他们内部已经在经历这个过程，每一波效率提升之后，下一个瓶颈就浮出水面。
它意味着人类掌舵会越来越费力，要求越来越高，人类需要在更快的节奏里做出更好的判断。
Anthropic认为这是最可能发生的近期情景，而且他们现在已经在这条路上了。
第三种：完整RSI，人类退到验证角色
AI开始自主构建后继模型，进度由算力决定，人类从主导者变成监督者和验证者。
好处在于，可能快速实现医疗突破、科学加速、贫困问题的系统性解法。
但坏的一面是，今天模型训练中，哪怕只有一个微小的目标偏差，在完整RSI的迭代循环里可能以指数速度放大，直到人类完全失去干预能力。
这是最不确定的结局。
讲完三种结局，报告末尾Anthropic开始呼吁，希望建立某种全球协调机制，在风险上升时能够有序放缓甚至暂停前沿AI开发。
翻译一下这段话的意思：AI递归自我改进势头太猛，我们很担心，觉得应该有人出面让大家一起停下来，但Anthropic不会单方面停。
多么熟悉的味道。
这套叙事Anthropic已经用了不止一次，在制造焦虑的同时，把自己定位成"威胁的发现者"和"最有能力应对威胁的公司"。
但看完Anthropic内部真实情况，以及它自己给出的AI未来可能性，你还会感到焦虑吗？

jjybzxw

2026-06-06 17:30

拆解Anthropic《When AI Builds Itself》：数据写实、叙事营销、奇点远未至
一、先厘清核心数据：80%自研代码由Claude完成≠AI自主造AI
1. 80%代码由Claude产出的真实边界
这里的代码集中在工程落地、脚本编写、模型微调配套代码、自动化运维代码，顶层架构设计、新算法范式选型、研发方向立项、训练框架底层重构全部由人类研究员敲定。工程师人均效率翻8倍，本质是AI充当高级代码助手，替代重复编码、调试、测试等体力工作，和AI从零规划下一代大模型是两码事。
2. Claude连续自主16小时、自研优化代码提速52倍，局限在给定明确任务约束：人类划定优化目标、数据集、硬件环境、验收指标，AI在框内试错迭代；脱离人类给定任务边界，AI无法自主定义“要优化什么、为什么优化”。

二、递归自改进RSI分层：当前卡在「半自动辅助研发」，离完整自我迭代还差关键一环
行业通用RSI六阶段，结合Anthropic实测落地现状：
1. 阶段1：AI辅助零散编码（已全面落地）：日常写函数、调试bug，当下主流大模型通用能力；
2. 阶段2：AI完成单一模块小项目（普遍落地）：给定需求，独立做完小型子任务，Claude主力落在这个区间；
3. 阶段3：半自动闭环研发（Anthropic当前主力位置）：固定课题下，AI自主做实验、调参、数据分析，就像文中安全课题、代码提速实验，课题选题、方向取舍仍是人类；
4. 阶段4：自主Agent定向迭代（局部零星迹象，未规模化）：Claude能在窄领域自主优化自身小模型，但无法突破原有架构、跳出人类设定的约束条件；
5. 阶段5：全链路自主研发下一代基座模型（未实现）：自主发现新算法、设计全新训练范式、规划算力资源；
6. 阶段6：完整RSI奇点，无人类干预持续指数迭代（理论概念，无任何落地迹象）。

核心瓶颈：研究品味（Research Taste）是人类独有的关键壁垒
AI能解决“已知问题”，但无法自主筛选“值得研究的未知问题”：什么方向有科研价值、哪些实验该终止、异常数据是bug还是突破性发现，现阶段Claude仅64%场景能提出更优后续研究思路，且全部限定在封闭数据集、固定课题场景；放到开放真实科研环境，准确率大幅下滑。只要研发顶层选题权在人类手中，就锁死了全自主RSI的发生基础。

三、报告提出的三种未来演化路径，现实倾向性分析
1. 路径一：能力增长触顶、增速放缓（S型收敛，概率中等）
约束条件：Transformer架构瓶颈、全球算力成本、能源、半导体产能、各国AI监管落地。当前大模型靠堆算力堆数据的边际收益持续走低，未来很容易出现投入翻倍、性能微增，自然放缓扩张，Anthropic标注“最不可能”带有明显立场倾向。
2. 路径二：AI做执行、人类握决策（短期最确定，当下正在发生）
契合Amdahl定律：AI不断压缩编码、实验、运算环节成本，瓶颈持续向上游转移——代码快了，人工评审成瓶颈；实验自动化了，科研方向决策成瓶颈。未来长期形态就是人机分工：AI负责海量落地执行，人类聚焦方向把控、价值取舍，也是全球产业正在走的路线。
3. 路径三：全链路RSI自主迭代、人类退居验证（远期低概率）
收益是生物医药、基础科学爆发；风险是目标漂移指数级放大。受物理规律、算力、能源、监管多层枷锁限制，短中期没有落地土壤，更多是远期风险推演。

四、行业套路：“渲染奇点风险+呼吁全球控速”是头部AI厂商经典商业叙事
1. 话术逻辑：一边渲染AI自我进化风险，一边不主动停产前沿研发
Anthropic、OpenAI轮番抛出RSI早期迹象、AI自建AI、呼吁全球管控，本质三层诉求：
- 舆论层面：塑造行业先行者、风险预警者形象，抢占AI安全赛道话语权；
- 政策层面：推动全球统一监管，抬高中小厂商入局门槛，巩固头部算力、技术壁垒；
- 市场层面：奇点焦虑带动企业、资本加大AI安全、定制大模型投入，拓宽自身商业化空间。
2. 对照现实：两家公司均在持续加码下一代模型训练、算力采购，呼吁“全球减速”≠自我减速，是典型行业营销话术。

五、普通人不用恐慌的关键结论
1. 短期3～5年：AI定位永远是人类研发增效工具，替代繁琐重复工作，提升各行各业生产效率，人机协同是主流，不存在AI自主造AI、脱离人类管控；
2. 中长期数十年维度：即便技术持续突破，全球各国立法、算力管控、科技地缘约束会层层设限，完整RSI奇点仍是极小概率事件；
3. 理性看待数据：厂商披露的亮眼实验，全是封闭可控环境下的限定测试，无法复刻到开放无约束的真实研发全流程，媒体“AI即将自我繁衍、奇点降临”属于夸张引流解读。

姜谷粉丝

2026-06-07 11:17

Anthropic近期确实抛出了“AI可能自主构建下一代AI”的核心观点，这一论断并非空穴来风，而是基于大量实测数据和趋势推演，但“暴论”标签背后既有扎实的技术进展支撑，也存在需要理性看待的边界条件。以下是关键信息拆解与真实性分析：

一、核心论断与数据支撑：AI“造AI”已不是遥远猜想
Anthropic在2026年6月发布的报告《When AI Builds Itself》及联合创始人Jack Clark的公开言论中，明确提出了**“递归自我改进（RSI）”**的可能性，并给出了具体数据支撑：

代码生产自主化：截至2026年5月，Anthropic代码库中超80%的合并代码由Claude自主编写（2025年2月该比例仅为个位数），工程师人均代码产出效率提升至2021-2025年的8倍，普通工程师每日合并代码量是2024年的8倍
。
科研任务自主完成：Claude曾自主完成一项AI安全研究项目，从假设提出到结果分析全程自动化，耗时约800小时、成本1.8万美元，恢复了97%的性能缺口；而人类研究员完成同等任务耗时一周，仅恢复23%
。
代码优化能力爆发：Claude对训练小模型的代码进行自主优化，11个月内速度提升从2.9倍飙升至52倍，远超人类研究员4-8小时实现4倍提升的效率
。
研究判断力快速进化：在“判断研究下一步方向”的任务中，Claude Myths Preview能在64%的情况下被另一个Claude判定为提出更优方案（5个月前为51%），虽未完全自主，但进化趋势明确
。
二、RSI的“阶段论”：Anthropic自认已接近临界点
Anthropic将AI介入AI开发的过程分为5个阶段，认为当前已处于第4阶段（AI可自主完成大部分工程任务，仅需人类设定方向），距离“完全自主构建”仅一步之遥：

阶段1-3：AI辅助人类完成代码编写、任务执行、基础优化；
阶段4：AI自主完成工程闭环（如代码优化、实验复现），人类仅负责目标设定与结果评估；
阶段5：AI完全自主设计、训练、迭代下一代模型，形成“自我加速”的RSI飞轮
。
Jack Clark进一步量化了这一风险：“2028年底前，AI自主构建自身的可能性为60%”，核心逻辑是AI已能自动化AI研发的99%工程性工作，仅剩下1%的“范式创新”（如Transformer架构）仍依赖人类，但随着AI能力覆盖更广的领域，这一缺口正在缩小
。

三、真实性分析：趋势真实，但“失控”并非必然
Anthropic的论断基于真实技术进展，但“AI完全自主造AI”并非必然结果，需结合以下维度理性看待：

技术进展是实打实的：AI在代码生成、科研复现、任务优化等领域的效率提升，已验证“AI辅助AI”的可行性，RSI的“工程基础”正在快速搭建
。
“研究品味”仍是人类优势：Anthropic承认，AI在“判断什么问题值得研究、哪些结果可信”的第三层研究品味上，仍弱于人类。当前Claude仅能在边界清晰的任务中展现判断力，复杂场景下的“科研直觉”尚未成熟
。
三种未来情形并存：Anthropic在报告中明确列出AI发展的三种可能结局：
温和版：AI能力增长遇天花板（算力、能源、地缘限制），现有模型能力已足够颠覆行业，但不会自我迭代；
协作版：AI负责执行，人类负责决策，形成“人机协同”的高效研发模式；
失控版：AI完全自主构建后继模型，人类仅能监督验证，技术发展脱离人类控制
。
Anthropic的“自我警示”属性：作为AI安全领域的核心制定方，Anthropic的论断带有“风险预警”色彩，其呼吁“放缓前沿AI研发”的初衷，是为社会配套（伦理、法律、就业）争取调整时间，而非断言RSI必然发生
。
四、行业背景：头部AI公司的“共识性焦虑”
Anthropic的论断并非孤例，OpenAI近期也提出“AI已显现RSI早期迹象”，这反映了头部AI公司对技术风险的共同关注：

全球AI估值持续攀升（Anthropic拟以超1万亿美元估值IPO），技术竞争与安全风险并存；
社会对AI的就业替代、伦理失控等问题的担忧，倒逼企业主动释放“风险信号”；
RSI是AI奇点理论的核心触发条件，头部公司的论断本质上是行业对“技术临界点”的集体预判
。
总结：AI“造AI”是趋势，但“何时发生”“是否失控”仍需观察
Anthropic的论断基于真实技术进展，RSI的“工程基础”已初步搭建，但AI完全自主构建自身仍面临“研究品味”“算力瓶颈”“伦理约束”等挑战。短期内（2026-2028年），更可能看到的是**“人机协同的AI研发模式”**，而非“AI完全失控的自我迭代”。这一论断的价值，在于提醒人类：AI技术的“自我加速”能力正在逼近，需提前布局社会配套与风险管控。

查看完整版本: [-- AI要自己造AI了？Anthropic最新暴论，到底有多真？[3P] --] [-- top --]

Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled