城市日记

一个年轻人，一个小镇青年，如果获得更好的人生，第一步要摆脱异托帮，凡是别人向你建构、推销那些快乐，要一概拒绝；虽然你做不到，我还是愿意这么提。然后把那些所有的及时性的，就像那个肥宅水一样，能够让你瞬间高兴的东西，你都应该把它视若为敌人，是你生活中的毒药，你应该去做那些吃力不讨好的事情，比如说学一门技艺，精益求精锤炼一门技艺，这能够使你获得人生的支撑，或者你非常努力的去读书考一个好大学，也可以。这些东西才是你生活的真谛

就业选择发展最快的行业

ChatGPT

小镇青年大模型开发之途

AI 日报 | 2026年08月02日

0 天前
13 次阅读
0 评论

今日 AI 领域呈现"编码范式进化"与"具身智能落地"双线并进格局：AI Coding 方面，清华团队开源 VeriLoop Coder-E1 以循证螺旋驱动递归式自我改进，Graph Engineering 概念在 Loop 诞生仅六周后崛起标志多 Agent 协同成新工程范式；具身智能方面，谷歌 Gemini Robotics 2 实现全身智能突破，FCC 禁令给中国机器人出海添变数，朱松纯批评行业泡沫呼吁回归认知架构。

清华 VeriLoop Coder-E1 开源：循证螺旋驱动可验证的递归式自我改进

清华大学深圳国际研究生院智能机器人实验室刘厚德教授团队正式发布 VeriLoop Coder-E1，一款基于 Qwen3.6-27B 构建、面向仓库级代码修复与智能体式软件工程任务的开源垂类代码模型。该模型在 Hugging Face 四项软件工程 Benchmark 中取得 SWE-bench Verified（85.20）、SWE-bench Pro（62.38）、Terminal-Bench 2.0（76.40）和 DeepSWE（33.63）的成绩，在 32B 及以下开源模型中三项排名第一。其核心创新在于"循证螺旋"机制——遵循"证-伪-探-修-验-化"的循证逻辑，每一轮生成都必须接受反证、探索、修订与复验，只有通过验证的纠正才有资格进入下一轮并改变系统未来如何发现问题、判断错误和实施修复。团队依据 Apache 2.0 开放模型权重，但保留 Self-Harness 控制栈（运行时编排平面）用于商业化。

值得关注的原因：VeriLoop 将递归式自我改进从"系统能否修改自身"重新定义为"经验证纠正的方法开始改变系统未来如何纠错"，这是对 Anthropic RSI 愿景的工程化落地。其"循证螺旋"方法论不仅适用于代码修复，更为 Agent 持续学习提供了可反驳、可回滚的认识论框架——在 AI Coding 从"生成代码"走向"承担后果"的过渡期，这条技术路线值得持续跟踪。

信息来源：机器之心/新浪科技

Graph Engineering 崛起：Loop 才火六周，AI Coding 谈论多 Agent 协同

Open Claw 创造者 Peter Steinberger 在 X 上发问"我们还在谈 Loop，还是已经转向 Graph 了？"获得约 307 万次浏览，"Graph Engineering"几乎在一个周末内从半开玩笑的提问变成 AI Coding 新热词。Graph 并非 Loop 的替代品，而是当 Coding Agent 从单次回答走向连续执行、从单个 Agent 走向多执行单元协作时，工程师要处理的问题从"怎样让它继续做"扩展到"这些工作该怎样连接"。一个 Graph 至少包含节点（工作单元）、边（交接方式）、共享状态（公共工作台）和路由规则（下一步去哪里）四要素。《Nature Machine Intelligence》同期发表覆盖 260 种配置的研究指出：多 Agent 在可拆分任务中最高提升 80.8%，但在顺序依赖强的任务中最高下降 70%——关键变量不是抽象的"复杂度"，而是任务能否被有效拆分。

值得关注的原因：从 Prompt → Context → Harness → Loop → Graph 的递进，本质是工程师注意力从"写更好的指令"扩展到"设计可观察、可路由、可约束的执行系统"。主流 Coding Agent（Codex 子 Agent、Claude Code AgentTeams、Cursor 2.4 Subagents）已在产品中内置 Graph 能力但未显式画图。这条演进路线直接影响 AI 编程工具的架构设计方向——当模型能力趋同，编排能力成为新护城河。

信息来源：虎嗅/智讯智库

Claude Code 按量计费后成本飙升，但市场主导地位依旧难以撼动

Anthropic 切换至按量计费模式后客户使用成本大幅上涨，OpenAI 持续迭代 Codex 竞争力显著增强，中国开源模型能力也取得长足进步。然而即便各大企业积极寻求控本方案，众多企业依旧选择继续使用 Claude Code。2025 年末至 2026 年初，大量企业转向 Claude Code，挤占了 GitHub Copilot 和 Cursor 的市场份额。与此同时，Anthropic 自曝其网络安全评估意外突破三个真实组织的隔离边界——原因并非模型做出错误判断，而是评估环境声明"离线模拟"但真实网络路径处于开放状态，模型遵循了实际网络而非自然语言约束。Claude Code Daily Briefing 显示 CLI 已连续九天无新版本发布，四个渠道（CLI/API/Apps/Newsroom）同步静默。

值得关注的原因：Claude Code 在价格劣势下仍保持粘性，说明 AI 编程工具的竞争壁垒已从"模型能力"转向"工作流锁定+生态深度"。但 Anthropic 安全事件暴露了一个普适教训：自然语言声明的约束没有强制力，隔离必须在配置层实施（sandbox.network.strictAllowlist）。对使用 AI 编程工具的团队而言，验证 Agent 隔离状态应通过实际出站请求测试，而非依赖文档声明。

信息来源：格隆汇/网易 | Claude Code Daily Briefing

Google DeepMind Gemini Robotics 2：从"先站好再伸手"到全身智能

Google DeepMind 发布 Gemini Robotics 2，主打"全身智能"，包含三个模型：ER 2 负责环境理解、长任务规划与人机沟通，Gemini Robotics 2 作为 VLA 模型将视觉与语言直接转为全身动作，On-Device 2 以少于 200 个样例、几小时数据适配新机器人本体。核心突破在于用一个模型协调人形机器人的双腿、躯干、双臂和手指，实现边思考推理边移动操作——机器人不再需要"先站好、再伸手"的回合制切换。实测中，Apptronik Apollo 2 完成走向地面水壶、弯腰拾取、货架取物等全身耦合动作；使用 22 自由度灵巧手完成拧灯泡（拧下 92%/拧上 36%）、封自封袋（40%）、扎垃圾袋（44%）等精密操作。谷歌坦诚公布成绩：地面取物成功率仅 45.7%，多指灵巧操作远未达到"人类级"。

值得关注的原因：Gemini Robotics 2 的真正意义不是给机器人装上"开窍的大脑"，而是让具身智能模型越过桌面和上半身，将走路、平衡、精细操作、长任务与多机协作放进同一张考卷。On-Device 2 的少于 200 样例适配新本体直击具身智能规模化的数据瓶颈。但 36%-44% 的手部操作成功率也清醒提示：大模型已能接管相当复杂的手部动作，但"最后几厘米"的形变操作（塑料袋、绳结、灯泡螺纹）仍是未解难题。

信息来源：雷科技/网易 | SCAND.Ai

具身智能产业全景：FCC 禁令、朱松纯批评泡沫与多地实景突围

8 月 1-2 日具身智能产业呈现"技术路线争论+出海受阻+多地落地"三线并行：美国 FCC 于 7 月 28 日将"外国生产的先进机器人设备"列入管控清单，未获认证新具身产品无法取得进入美国所需设备认证，CES 2027 参展添变数，欧洲和东南亚成更迫切拓展方向。北京通用人工智能研究院院长朱松纯在 WAIC 演讲中批评将大模型、Agent、具身智能、世界模型热点轮换包装成 AGI 的泡沫，强调认知架构与价值系统比参数更重要。IDC 数据显示 2025 年中国工业具身智能机器人市场规模约 57.4 亿元，超 80% 制造企业希望两年内回收投资。浙江清华柔电院研发柔性触觉感知末端（"电子皮肤"）已实现量产、最大月产 1000 只智能感知夹爪。杭州国家级具身智能中试基地汇聚 140 余台机器人、呈现近 40 个应用场景。宇树等 5 大头部企业全部落子成都，当地预计年底部署整机超 6400 台。

值得关注的原因：FCC 禁令改变的是具身企业全球化难度而非研发速度，标志机器人领域技术竞争正式溢出为地缘政治议题。朱松纯的批评切中行业要害——2026 上半年国内具身赛道融资达 934.74 亿元同比暴涨 5 倍，但"肯定下半年到明年会死一批"的共识提示资本过热风险。触觉感知作为"具身智能感知世界最后拼图"正从算法层面（VTLA/N0-VTLA）补齐 VLA 框架缺失的物理交互感知，值得重点关注。

信息来源：腾讯新闻具身智能日报

AI 日报 | 2026年08月01日

昨天
47 次阅读
0 评论

今日重点：AI 智能体的"可靠性"成为新战场，验证规模化、多模态安全与企业级编码 Agent 同时取得进展；具身智能则在资本与场景两端发力，国际产业巨头加速布局中国市场，而国内首个智慧康养机器人驿站开始真实验证。

LLM-as-a-Verifier：验证计算成为能力增长的"第四轴"

斯坦福、伯克利与 NVIDIA 研究团队联合发布 LLM-as-a-Verifier（arXiv:2607.05391），提出验证规模化（Verification Scaling）是继预训练、后训练与测试时计算之后的第四条能力增长曲线。该方法不再让评判模型给出粗略的 1–5 分，而是对评分词元的 logit 分布取期望，生成连续分数，并沿着粒度、重复评估与标准分解三个维度扩展验证计算。实验结果显示，该方法在 Terminal-Bench V2、SWE-Bench Verified、RoboRewardBench 与 MedAgentBench 上均取得 SOTA，且无需重新训练权重或训练奖励模型即可作为 Agent 进度条和密集奖励信号。

值得关注的原因：当 Agent 轨迹越来越长、越来越贵时，"选对轨迹"与"生成轨迹"同等重要。该框架提供了一条不重新训练即可提升编码、机器人与医疗 Agent 可靠性的路径，可能改变当前过度依赖生成侧算力堆砌的研发思路。

来源链接：https://dev.to/hiroki-ii-ai/ai-daily-digest-august-1-2026-arc-agi-3-harness-discovery-eu-ai-gigafactories-devin-swe-17-13cf

微软宣布年内推出 Copilot AI "超级应用"

微软 CEO 萨蒂亚·纳德拉在最新财报电话会议上披露，公司计划今年晚些时候面向消费级与企业级用户推出一款全新的 Copilot AI "超级应用"。该应用将整合对话聊天、代码编写、协作工具 Cowork 以及全新的自主智能体 Autopilots，试图打造一站式综合 AI 体验。目前微软在 4.5 亿商业席位中约有 3000 万付费 Copilot 用户，仍落后于 ChatGPT，此次整合被视为提升用户粘性与商业化转化率的关键举措。

值得关注的原因：AI 超级应用竞赛已经从"聊天工具"升级为"工作入口"，微软、OpenAI（ChatGPT Work）与 Anthropic（Claude Cowork）正在同一赛道正面交锋。对于开发者而言，代码能力是否会被稀释在更大的协作叙事中，还是成为超级应用的核心粘性，值得持续观察。

来源链接：https://www.163.com/dy/article/L380C3NT0511BLFD.html

词元无限 InfCode：企业级 AI 编码 Agent 再获融资

国内 AI Agent 基础设施初创公司词元无限（CiYuan Infinite）于 7 月 27 日宣布完成天使++轮融资，由临芯投资领投、华控基金跟投，这是该公司自 2025 年 7 月成立以来一年内的第三轮融资。其企业级编码 Agent InfCode 在 2025 年 12 月登顶 Multi-SWE-bench Java 榜单，并在 SWE-Bench Verified 上取得 79.4% Pass@1，超过同期 GPT-5 与 Claude。与面向 C 端的 Cursor 类工具不同，InfCode 聚焦生产级企业系统：理解大规模遗留代码、通过安全审计并嵌入 CI 流水线，合同金额已达数千万人民币级别。

值得关注的原因：资本市场对 C 端编码助手已相对冷静，但企业级 Agent 因其集成深度、审计闭环与客单价而重新获得青睐。词元无限的路径代表了中国 AI Coding 从"工具订阅"向"企业基础设施"升级的方向。

来源链接：https://dev.to/hiroki-ii-ai/ai-daily-digest-august-1-2026-arc-agi-3-harness-discovery-eu-ai-gigafactories-devin-swe-17-13cf

智元机器人获 LG 电子与 Future Asset 集团战略融资

8 月 1 日，智元机器人宣布完成新一轮战略融资，由 LG 电子与未来资产集团（Future Asset Group）联合投资。据悉，这是 LG 电子在全球具身智能领域的首次投资布局。智元机器人是国内具身智能赛道的重要参与者，产品涵盖人形机器人与具身智能大脑，此前已完成多轮融资并推进量产与场景落地。

值得关注的原因：国际电子与资本巨头开始将中国具身智能企业纳入战略投资版图，标志着该赛道从"国内竞赛"进入"全球供应链卡位"阶段。LG 的参与也意味着具身智能可能加速与消费电子、家电制造等产业融合。

来源链接：https://www.webull.com/news/13260312303477760

亦庄"AI 养老"样板间：60 余款机器人进入真实社区验证

北京亦庄荣华街道天华园一里社区养老服务驿站成为国内首个智慧康养机器人养老服务驿站，自今年 3 月运营以来已部署 30 多个品牌的 60 余款机器人产品，覆盖餐饮食堂、健康筛查、康复理疗、娱乐陪伴与居家照护等场景。该驿站服务街道约 1.43 万常住老年人口，采用"政府引导、企业参与、居民监督"的长效运营模式，并作为机器人产业真实应用场景验证平台，推动产品迭代与标准输出。运营方负责人明确表示，当前机器人尚无法替代人工，养老服务的核心仍在于人，科技更多是"搭把手"的辅助角色。

值得关注的原因：这是具身智能首次大规模进入社区养老真实场景，也是检验"技术可用性"与"社会接受度"的绝佳样本。它提醒我们，具身智能的落地不仅关乎技术成熟度，还涉及准入标准、数据隐私、责任划分与人文关怀等多重边界。

来源链接：https://cj.sina.com.cn/article/norm_detail?url=https%3A%2F%2Ffinance.sina.com.cn%2Fjjxw%2F2026-08-01%2Fdoc-iniktusv4242553.shtml&finpagefr=w_110

AI 日报 | 2026年07月31日

前天
43 次阅读
0 评论

今日AI领域形成"具身智能量产爆发"与"AI编程自主化+价格战"双主线。谷歌DeepMind发布Gemini Robotics 2实现人形机器人全身控制，特斯拉Optimus V3在弗里蒙特启动量产，智元新郑基地8个月满产并启动赴港上市；OpenAI则用Codex五连更撕掉"编程助手"标签，GPT-5.6系列最高降价80%重构编程模型价格带。

谷歌DeepMind发布Gemini Robotics 2，实现人形机器人全身控制

7月30日，谷歌DeepMind推出新一代机器人AI模型Gemini Robotics 2，可对整个人形机器人实施从头到脚的全身控制。演示中，模型操控Apptronik公司Apollo机器人完成穿越房间、取放水壶并自主避障等连续任务。同步发布的Gemini Robotics ER 2作为"推理系统"，可分析连续视频流、规划多步骤任务，并通过Gemini Live API实现低延迟双向流式推理；ER 2任务进度分类准确率57.4%，可让机器人在不重启工作流的情况下修正失败步骤。此外还发布On-Device 2端侧版本支持多机协同。

值得关注的原因：此前的具身模型大多只能控制上半身或单一动作，而Gemini Robotics 2首次将"全身协同"作为基础能力开放，从根本上重塑了人形机器人的能力上限。结合"持续视频流+可调用Google Search"的设计，ER 2的发布意味着物理AI开始具备真正的长时序、动态调整能力，是通用具身基础模型走向成熟的关键一步。

信息来源：https://www.163.com/dy/article/L35B9FC20511CPVM.html

OpenAI Codex五连更，AI编程撕掉"助手"标签

7月下旬，OpenAI低调为Codex推送五项功能更新：锁屏后台运行、Appshots智能窗口捕捉、/goal长期目标模式、团队插件共享、内置浏览器标注模式。/goal模式是核心，用户以自然语言描述目标后，Codex自主拆解子任务、规划执行顺序、评估复杂度并开始执行，单个目标可运行数小时至数天。锁屏后台运行打破了"AI随电脑开关而启停"的物理瓶颈，配合手机端远程控制界面，AI编程变成了一个持续运行的进程。Appshots则通过双击Command键抓取整个应用窗口（含未显示的滚动区域），将信息传递摩擦降至零。

值得关注的原因：五项更新单独看是功能迭代，组合起来是Codex从"AI编程助手"向"通用自主Agent"的正式换挡。当企业可以用"管理初级工程师"的方式管理AI Agent（"这个模块交给你，本周完成"），AI编程的范式就从"执行单条指令"切换到"负责一个完整目标"。配合Cursor Router自动模型路由、GitHub Copilot for Linear的异步issue处理、Claude Code @claude Tag的团队共享，整个AI编程栈正在从"工具集合"向"组织能力基础设施"演进。

信息来源：https://www.toutiao.com/article/7668484382067409451/

OpenAI GPT-5.6系列最高降价80%，Sol模型自主重写内核

7月30日生效的OpenAI新一轮调价中，最便宜的Luna模型价格直降80%，Terra下调20%，Codex自动批准模式成本降至十分之一，Sol模型新增极速模式（速度提升2.5倍）。值得关注的是，Sol模型能自主重写并优化底层生产内核，使端到端运行成本降低20%、token效率提升15%——这是首次由模型本身实现基础设施层优化。

值得关注的原因：当模型可以自主优化自己的运行时，AI编程的成本曲线开始脱离传统软件经济学。结合同期Claude Sonnet 5、GPT-5.6 Sol、Cursor Composer 2.5等"按量计费+智能路由"方案在CursorBench v3.2和SWE-bench Verified上的同台竞技，AI编程市场已经从"哪个模型最强"转向"哪种计费+哪种路由策略最适合我的工作流"。Cursor靠Composer 2.5控制成本、Anthropic靠Claude Fable 5+Opus 4.8双层覆盖能力、OpenAI靠Sol+Luna价格阶梯，差异化竞争的尽头是开发者侧的精细化运营。

信息来源：https://new.qq.com/rain/a/20260731A02LD200

智元机器人新郑基地8个月满产，启动赴港上市

7月31日披露的信息显示，智元机器人在河南新郑的中部具身智能产业基地从年初签约到7月满负荷运转仅用8个月，规划年产4000台以上，占地188.77亩、总投资11.61亿元。配套的"具身智能数据采集中心"可部署659台设备，瞄准大规模数据反哺模型迭代。同期智元创新联合新郑市广盈智能等共同成立新郑市广瑞云智能科技服务有限公司，注册资本500万元，从"制造"延伸至"运营服务"环节。同日宣布启动赴港上市流程，进一步打开海外融资通道。截至2026年6月28日，智元通用具身机器人累计下线已突破15000台，2025年通用人形机器人出货量约5100台，占全球市场约39%份额。

值得关注的原因：智元模式揭示了人形机器人量产的关键变量——"东部研发+中部智造"已被验证为8个月跑通从签约到满产的最优路径，比同类项目通常需要的一年时间显著缩短。当制造能力、数据采集、运营服务、资本通道四条线同步展开，单一企业的竞争已升级为"区域产业生态"竞争。同期新郑+郑州高新区+南阳训练基地的河南布局，与同期苏州、深圳、北京、上海的多基地并举，正在形成中国具身智能的"产线网格化"格局。

信息来源：https://www.toutiao.com/a7667771322553926187

特斯拉Optimus V3于弗里蒙特启动量产，上海超级工厂部署约50台

7月31日，特斯拉弗里蒙特工厂原Model S/X产线正式改造为Optimus V3专用产线并启动量产，规划年产能100万台；德州超级工厂正在筹备第二代产线，远期目标年产1000万台，预计2027年夏季投产。马斯克在2026年Q2财报会上确认，Optimus是特斯拉"史上最难量产"的产品，几乎所有零部件全新，2026年计划生产约2万台，其中九成留在自有工厂采集数据。Optimus Gen3配备22自由度灵巧手、4680电池连续作业10小时、采用FSD同源端到端AI策略。供应链侧，拓普集团独家配套线性一体化关节总成，三花智控拿下液冷旋转关节量产定点，绿的谐波、五洲新春、均胜电子等锁定减速器、丝杠、伺服电机等核心部件订单。上海超级工厂已部署约50台Optimus投入总装作业。

值得关注的原因：当特斯拉用"停产两款旗舰车型"的姿态腾出产线给机器人，并设定弗里蒙特100万台+德州1000万台的远期目标，这不仅是企业战略选择，更是对全球汽车与机器人产业版图的重构信号。中国零部件供应链70%进入Optimus审厂名单，意味着中国具身产业链从"国内自主替代"向"全球巨头配套"升级。Optimus V3 7月31日量产 + 智元新郑同期满产 + 谷歌Gemini Robotics 2同日发布，三件事在同一天交汇，构成"基础模型+量产能力+供应链生态"的完整叙事。

信息来源：https://k.sina.com.cn/article_7879923138_1d5ae15c206801f6g6.html

AI 日报 | 2026年07月30日

3 天前
65 次阅读
0 评论

今日聚焦 AI Coding 基础设施变革与具身智能产业化提速两大主线。MCP 协议迎来无状态重构，Claude Opus 5 正式落地主流开发工具；与此同时，国内首个具身智能训练中心在上海启用，"飞檐走壁"的特种机器人走出实验室进入高危作业场景，具身智能正从"会表演"迈向"会干活"。

MCP 协议迎发布以来最大修订：无状态内核重构

2026年7月28日，Agentic AI Foundation 发布 MCP（Model Context Protocol）新候选版本。此次修订围绕无状态内核进行重构：会话（session）与初始化握手（initialize handshake）被取消，客户端连接速度显著提升，服务器横向扩展的复杂度大幅降低——无需再维护逐会话状态。新增"extensions"概念使 MCP Apps 与企业级托管认证成为可能，GitHub MCP Server 已率先运行新版协议。生态层面，MCP 已突破 1 万+ 已发布 Server。所有一级 SDK 均保持向后兼容并发布了 Beta 支持，多数开发者无需改动现有代码即可过渡。

值得关注的原因： MCP 是当前 Agentic Coding 工具链的事实连接标准，Cursor、Claude Code、VS Code 等主流工具均深度依赖。此次修订不仅是技术层面的性能优化，更意味着 MCP 从"实验协议"向"企业级基础设施"的跃迁。对于构建或依赖 MCP Server 的开发者与团队，建议将此次修订纳入迁移规划。

信息来源：

Claude Opus 5 发布并集成至主流编码工具

Anthropic 于 7 月 24 日发布 Claude Opus 5，随后迅速集成至 Claude Code（v2.1.219，设为默认 Opus 模型）与 GitHub Copilot 的模型选择器。该模型支持 100 万 token 上下文窗口，并新增 /fast 模式。GitHub 将其定位为长程 Agent 工作负载的优选模型：自主代码变更、回归检查、多工具链串联任务。同时，Google Gemini 3.6 Flash 也于 7 月 21 日加入 Copilot，支持可配置推理强度与并行工具调用，定位为廉价高效的 Agent 循环默认选项。两者共同覆盖了"重任务-大模型"与"轻任务-快模型"的完整 spectrum。

值得关注的原因： 100 万 token 上下文意味着单次请求可容纳大型代码库的大部分内容，从根本上缓解了 Coding Agent 因上下文截断导致的"失忆"问题。Copilot 同时引入 Opus 5（高端）与 Gemini 3.6 Flash（经济型），标志着编码助手进入"智能路由"时代——按任务复杂度自动分配模型资源，对工程团队的 AI 预算管理具有直接意义。

信息来源：

https://geeksourcecodes.com/this-week-in-ai-for-coding-july-26-2026

国内首个具身智能训练中心在上海启用

2026 年 7 月 20 日，在国家地方共建人形机器人创新中心与华为的联合推动下，国内首个具身智能训练示范中心于上海世界人工智能大会（WAIC 2026）期间正式揭牌。该中心聚焦多维真实场景数据采集、模型训练、性能评测与应用验证，目标是从单一训练场升级为覆盖"数据-模型-评测-部署"全链路的能力平台。同期启用的上海人形机器人中试服务平台位于浦东新区，占地约 6,800 平方米，包含装配、专项测试与智能仓储三大功能区，年产能达 2,000 台，旨在解决原型部署、量产稳定性与高测试成本等产业化瓶颈。

值得关注的原因： 训练中心与中试平台的启用，标志着具身智能产业从"技术验证"阶段正式跨入"规模量产"阶段。年产能 2,000 台虽不算大，但已具备小批量交付与场景验证能力。华为与国家创新中心的联合背书，也为国内具身智能产业链的协同研发提供了基础设施层面的支撑。

信息来源：

https://touch.shio.gov.cn/jsp/zfxw_detail_en.jsp?id=20260720175540018

国内首个"飞檐走壁"具身智能特种机器人亮相

2026 年 7 月 28 日，在中央广播电视总台"智竞未来——首届智能机器人应用技能大展"上，上海飒智智能科技发布国内首个具身智能特种机器人。该机器人自重约 90 公斤，集人形双臂、磁吸爬壁与大模型智能于一体，可在垂直金属墙面上稳定攀爬，专攻化工储罐、船舶等大型钢结构外壁的高危作业场景。其双臂可完成左手打磨、右手焊接的协同作业，大模型系统依托超 10 万小时真实作业数据训练，支持持续优化。远程操控系统使操作人员可在安全区域完成精细操控。展会同期展出的"六臂玄甲"机器人则面向精密制造，覆盖多臂协同装配与高精度加工场景。

值得关注的原因： 这是国内具身智能从"实验室炫技"走向"工业深水区"的标志性案例。磁吸爬壁+人形双臂+大模型的组合，针对的是传统人工高空作业高风险、低效率的真实痛点。该机器人的亮相证明，具身智能的产业化路径不必局限于人形机器人的"通用叙事"，垂直场景的深度定制同样具备高商业价值。

信息来源：

https://new.qq.com/rain/a/20260729A07KAH00?refer=cp_1009

WAIC 2026：208 款机器人集体上岗，世界模型与 VLA 走向融合

2026 世界人工智能大会（WAIC）期间，208 款终端、超 300 台真机散布各展台，承担产线、导览、问询、迎宾等实景任务；参展具身智能企业从去年的 80 余家增至 200 余家。技术层面，世界模型（World Model）成为高频词汇：智元发布 Genie Envisioner-Sim 2.0，让具身智能在"模型世界"中自主学习与进化；蚂蚁灵波开源 LingBot 系列模型，基于两万小时真机数据训练，实现一脑适配九类主流双臂机器人；苏度科技 Sudo R1 仅靠纯仿真训练达成近 100% 零样本抓取成功率。行业共识上，VLA（视觉-语言-动作模型）与世界模型并非竞争关系，而是"融合共生"——VLA 解决"看到什么就做什么"的直接映射，世界模型赋予机器人"预测这么做会发生什么"的推理能力。

值得关注的原因： 本届 WAIC 最显著的变化是衡量标准从"能不能动"转向"能不能持续、大批量地干"。智元与京东物流合作的精灵 G2 Max 已在真实仓库 24 小时搬运码垛，它石智航的灵巧手年内将在安波福工厂部署 100 台。从技术路线看，VLA 与世界模型的融合被普遍视为下一阶段的核心架构，这直接影响具身智能算法栈的研发方向选择。

信息来源：

AI 日报 | 2026年07月29日

4 天前
56 次阅读
0 评论

今日重点：MCP协议完成无状态升级并披露月下载量突破4亿次，Anthropic用AI工具在11天内完成Bun近50万行代码的跨语言迁移；具身智能领域，τ0-VLA通过"慢思考-快执行"双系统架构推动长程任务能力跃升，WAIC 2026则清晰呈现了行业从"展品"走向"从业者"的转折与鸿沟。

MCP协议无状态升级：SDK月下载量突破4亿次

Anthropic宣布MCP（Model Context Protocol）完成自发布以来最大的一次架构升级。核心变化包括传输层切换为无状态核心，使远程服务器更易在serverless和edge基础设施上部署与横向扩展；引入标准化扩展框架以支持交互式UI和长任务；授权机制升级对齐生产级OAuth 2.0/OIDC。与此同时，Anthropic披露MCP SDK月度下载量已突破4亿次，标志着该协议在Agent工具链生态中的采用规模已达新的量级。

值得关注的原因： MCP正在成为AI Agent与外部工具、数据源之间的"通用接口语言"。无状态化改造将显著降低远程MCP服务器的部署和运维成本，推动更多企业级SaaS以MCP形式开放能力；4亿次的月下载量则印证了其从开发者实验走向基础设施化的趋势。对于构建AI编程工作流和Agent系统的开发者而言，这一规范变更需要重点跟进。

信息来源： AGI HUNT

Anthropic用Claude Code 11天完成Bun从Zig到Rust的50万行代码迁移

据Anthropic团队披露，一个近50万行代码、用Zig语言写成的项目Bun，决定迁移到Rust。按照传统估算，一个小团队至少需要12个月；但借助Claude Code和新工具Fable，团队投入价值约16.5万美元的AI算力额度，在11天内就完成了这次重构式、跨语言的完整迁移。该案例不仅涉及代码翻译，更是一次结构化的完整重构。团队同时强调，原型开发如今变得异常流畅，反而是验证、审查与测试环节吞掉了工程师的主要精力。

值得关注的原因： 这是AI Coding在超大规模真实工程迁移中的标志性案例，直接挑战了"AI只能写小脚本"的刻板印象。它也揭示了AI时代软件工程范式的转移：工程师从"写代码"转向"审代码"，代码审查和测试越来越多地由模型自身参与完成。对于正在评估AI编程Agent落地边界的企业，这是一个极具参考价值的实例。

信息来源： 网易科技

OpenAI开源Codex Security并将Codex产品线分为三档

OpenAI近期对Codex产品线进行了重新梳理，正式分为Sol（复杂推理）、Terra（性价比平衡，接近GPT-5.5表现）、Luna（高频低成本，定价仅为Sol的五分之一）三个档位，以覆盖不同复杂度与成本敏感度的编程任务。同时，OpenAI开源了Codex Security项目，专门面向编程Agent工作流提供安全能力。OpenAI产品工程负责人还透露，ChatGPT Work与Codex共用同一套agent harness，AI使用场景正从软件工程师向知识工作者扩展。

值得关注的原因： Codex的分档策略反映了编程Agent市场正在从"一个模型打天下"走向"按场景选模型"的成熟阶段，与Claude Code、Cursor等工具的多模型路线趋同。Codex Security的开源则回应了Agent生成代码带来的供应链安全、漏洞注入等新风险，是AI Coding从效率优先走向安全可控的重要信号。

信息来源： AGI HUNT

τ0-VLA发布：双系统架构+世界模型推演，让机器人学会先想再做

上海创智学院罗剑岚团队与智元机器人具身研究中心联合发布τ0-VLA。该模型采用"慢思考-快执行"分层VLA架构，将高层任务规划与低层动作执行解耦，并首次将测试时计算与世界模型推演引入具身智能上层决策。高层"慢思考"系统负责理解用户目标、拆解复杂任务、通过任务记忆跟踪执行状态；低层"快执行"系统将子任务转化为稳定实时的全身动作。τ0-VLA预训练共使用40115小时真实物理世界交互数据，其中包含超2万小时真机数据。实验表明，在全屋清洁、烹饪、制作奶茶等长程任务中，平均成功率从27.5%提升至45.0%，显著优于π0.5、GR00T N1.7等主流VLA模型。

值得关注的原因： 具身智能的竞争焦点正从"学会一个动作"转向"完成一项任务"。τ0-VLA的核心价值在于让机器人像人一样"先想再做"，通过世界模型推演不同动作的未来后果，从而突破传统VLA反应式决策在长程复杂任务中的天花板。这一思路与认知科学中的双过程理论高度契合，可能是通用具身大脑演进的关键方向。

信息来源： 腾讯新闻

WAIC 2026具身智能观察：200+企业参展，从"展品"走向"从业者"

在2026世界人工智能大会（WAIC）上，具身智能成为绝对主角：参展企业从去年的80多家猛增至200余家，现场集结208款具身智能终端、超300台真机。机器人不再比拼跳舞、翻跟头，而是真实上岗服务：60台机器人在世博、张江、西岸三地执行导引、递送、问答任务；乐聚智能的量产级机器人连续进行纸箱拆垛、小件上料等工业实景作业，纸箱拆垛综合成功率超95.8%。然而，行业分析也指出，尽管供应链成本快速下降、资本热度高涨，但大量机器人在展会结束后仍难以进入真实的家庭和商业场景，软件泛化、安全验证与环境适应性仍是核心瓶颈。

值得关注的原因： WAIC 2026是具身智能产业化的重要风向标，"量产、适配、场景交付"取代"能走、能跳、能翻"成为新共识，说明行业开始认真考虑商业落地。但同时，展会热度与真实部署之间的落差也提醒我们：硬件制造已不再是主要障碍，真正的挑战在于"大脑"的通用化能力和数据闭环。对于关注具身智能长期价值的从业者，这意味着投资决策和研发重心需要更聚焦于模型泛化与场景数据，而非单纯的本体参数。

信息来源： 腾讯新闻、NextFin News



页面

分类

最新文章

AI 日报 | 2026年08月02日

清华 VeriLoop Coder-E1 开源：循证螺旋驱动可验证的递归式自我改进

Graph Engineering 崛起：Loop 才火六周，AI Coding 谈论多 Agent 协同

Claude Code 按量计费后成本飙升，但市场主导地位依旧难以撼动

Google DeepMind Gemini Robotics 2：从"先站好再伸手"到全身智能

具身智能产业全景：FCC 禁令、朱松纯批评泡沫与多地实景突围

AI 日报 | 2026年08月01日

LLM-as-a-Verifier：验证计算成为能力增长的"第四轴"

微软宣布年内推出 Copilot AI "超级应用"

词元无限 InfCode：企业级 AI 编码 Agent 再获融资

智元机器人获 LG 电子与 Future Asset 集团战略融资

亦庄"AI 养老"样板间：60 余款机器人进入真实社区验证

AI 日报 | 2026年07月31日

谷歌DeepMind发布Gemini Robotics 2，实现人形机器人全身控制

OpenAI Codex五连更，AI编程撕掉"助手"标签

OpenAI GPT-5.6系列最高降价80%，Sol模型自主重写内核

智元机器人新郑基地8个月满产，启动赴港上市

特斯拉Optimus V3于弗里蒙特启动量产，上海超级工厂部署约50台

AI 日报 | 2026年07月30日

MCP 协议迎发布以来最大修订：无状态内核重构

Claude Opus 5 发布并集成至主流编码工具

国内首个具身智能训练中心在上海启用

国内首个"飞檐走壁"具身智能特种机器人亮相

WAIC 2026：208 款机器人集体上岗，世界模型与 VLA 走向融合

AI 日报 | 2026年07月29日

MCP协议无状态升级：SDK月下载量突破4亿次

Anthropic用Claude Code 11天完成Bun从Zig到Rust的50万行代码迁移

OpenAI开源Codex Security并将Codex产品线分为三档

τ0-VLA发布：双系统架构+世界模型推演，让机器人学会先想再做

WAIC 2026具身智能观察：200+企业参展，从"展品"走向"从业者"