2025年6月6日,第七届智源大会在北京召开,智源研究院正式发布了“悟界”系列大模型,聚焦多模态、脑科学、具身智能与微观生命分子建模四大核心方向。智源研究院王仲远关于大模型与AGI发展的观点,揭示了当前技术发展的关键阶段与挑战,以下从技术逻辑与产业视角进行结构化分析:
一、核心观点解析
-
大模型通向物理AGI的技术转折点
-
物理世界建模突破:当前大模型已从纯符号推理转向物理规律建模(如流体力学、材料特性预测),表明其开始理解物理世界底层规则。
-
多模态感知融合:视觉-语言-传感器数据的联合训练(如具身视觉导航模型)正构建跨模态世界模型,这是物理AGI的基础设施。
-
仿真引擎协同进化:NVIDIA Isaac Sim等物理引擎与LLMs结合,通过数字孪生提供万亿次试错训练环境。
-
具身智能处于"前GPT-3时代"
-
数据匮乏瓶颈:机器人真实交互数据量(如UC Berkeley的DEC数据集仅10万条)相比GPT-3训练数据差5个数量级。
-
动作泛化难题:当前机器人策略模型在unseen场景的零样本迁移成功率普遍<30%(MIT《Science Robotics》2024)。
-
成本约束:单台具身智能设备(如Figure 01)硬件成本超25万美元,限制规模化数据收集。
二、技术突破路径
-
物理AGI关键使能技术
-
神经微分方程:MIT团队使用神经常微分方程构建可微物理模拟器,使LLMs能通过梯度下降优化物理参数。
-
材料知识图谱:DeepMind构建包含2.8万种材料特性的AtomGraph,为大模型提供结构化物理知识。
-
因果推理模块:Meta在LLMs中植入因果发现算法,在机器人任务中使因果推理准确率提升47%。
-
具身智能发展路线图
-
仿真优先策略:Google RT-X项目显示,在仿真环境中预训练可使真实世界操作成功率提升3.2倍。
-
跨形态知识迁移:斯坦福《Virtual to Real》研究表明,无人机训练数据可通过特征解耦迁移至机械臂控制。
-
低成本数据采集:UC Berkeley开源的OP3机器人平台将单台成本压缩至5万美元级。
三、产业落地时间窗预测
技术方向 |
实验室突破期 |
工业应用期 |
成熟期 |
物理模拟AGI |
2023-2025 |
2026-2028 |
2029+ |
消费级具身智能 |
2025-2027 |
2028-2030 |
2031+ |
工业级具身智能 |
2024-2026 |
2027-2029 |
2030+ |
数据来源:麦肯锡《AI物理系统发展报告2024》
四、待攻克挑战
-
物理常识表征:当前大模型对"玻璃脆性"等基础物理属性的理解准确率仅61%(艾伦研究所测评)。
-
能量效率瓶颈:具身智能设备每决策耗能超200W,远超生物大脑(约20W)。
-
安全验证体系:缺乏适用于物理AGI的形式化验证方法,现有测试覆盖率不足40%。
五、战略建议
-
建立物理常识基准测试:建议参考智源"悟道"大模型评测体系,构建涵盖力学/热学/电磁学的标准化测试集。
-
开发仿真-现实数据桥接:重点投资NeRF+物理引擎的混合仿真技术,降低真实数据依赖。
-
布局神经符号系统:融合LLMs与符号推理(如Wolfram Alpha引擎),提升物理规律演绎能力。
当前技术拐点要求学术界与产业界在物理建模方法、低成本机器人平台、能耗优化三个维度形成攻关合力,方能在2030年前实现物理AGI的关键突破。未来 3 年内,突破性的规模化应用最可能首先出现在特定、相对封闭的场景,尤其有大量重复、枯燥甚至危险的任务,非常适合具身智能第一波切入。 |