据 1M AI News 监测,月之暗面创始人杨植麟在 2026 中关村论坛主持了一场 OpenClaw 与 AI 开源主题圆桌,嘉宾包括智谱华章 CEO 张鹏、AI 算力基础设施公司无问芯穹联合创始人兼 CEO 夏立雪、小米 MiMo 大模型负责人罗福莉和香港大学助理教授黄超,覆盖模型、算力基础设施和 Agent 应用三个层面。
夏立雪给出了一个直观数据:无问芯穹自 1 月底以来 token 用量每两周翻一番,累计已翻十倍,「上次见到这个速度还是 3G 时代手机流量的感觉」。张鹏从模型厂商角度解释了智谱 GLM5 Turbo 近期提价的逻辑:Agent 不再是一问一答,完成一个任务消耗的 token 量可能是回答简单问题的十倍甚至百倍,背后涉及长程任务规划、持续 debug 和多模态信息处理,「长期靠低价竞争不利于整个行业发展」。
罗福莉认为 Agent 时代的核心瓶颈是长上下文的推理成本与速度,只有在百万乃至千万 token 的上下文规模下做到成本够低、速度够快,才会有真正高生产力价值的任务被交给模型。她透露,模型「自进化」已从概念走向实践,在目标明确的科学研究任务上,模型已能自主运行两三天,团队自身的研究效率因此加速近十倍。她还抛出一个问题:推理需求过去一段时间已增长近十倍,今年整体 token 增长会不会到百倍?
黄超从 Agent 应用层拆解了三个技术瓶颈:长链路任务的 planning 能力不足、多 Agent 协作带来的 memory 膨胀压力,以及 skill 生态中低质量工具和恶意注入的风险。他指出,现有框架的记忆管理仍停留在文件系统和 Markdown 格式,未来需要走向分层设计。
圆桌最后,四位嘉宾各用一个词概括未来 12 个月的趋势:
1. 黄超:「生态」,软件将从面向人类转向 Agent Native 设计
2. 罗福莉:「自进化」,称这是「唯一能创造出新东西的地方」
3. 夏立雪:「可持续 token」,希望中国成为世界的 token 工厂
4. 张鹏:「算力」,称十倍增长的背后「还有一百倍的需求没有被满足」