据 1M AI NEWS 监测,阿里通义实验室 Qwen Pilot 团队于 4 月 7 日发布技术博客,正式推出全新强化学习算法 FIPO(Future-KL Influenced Policy Optimization)。该算法通过引入「未来影响力」(Future-KL)机制,有效解决了纯强化学习训练中模型「推理长度停滞」的难题。
研究发现,强化学习优化并非重写模型,而是在不到 2% 的关键逻辑决策点上精准引导,将模型导向正确推理轨迹。传统指标仅能衡量变化幅度,团队引入「符号对数概率差」新维度,精准捕捉算法对 Token 生成的「鼓励」或「打压」方向。统计显示,模型在长思维链中发生「自我误导」的概率(近 3%)是「顿悟」概率(约 1%)的三倍。根源在于传统全局奖励机制无法区分关键逻辑与冗余反思,导致模型迷失方向。
FIPO 实现了从「全局统一奖励」到 Token 级精确信用分配的跨越,通过 Future-KL 估算机制实时量化每个 Token 对后续推理轨迹的因果影响,并配套极端值过滤、软衰减窗口、影响力权重裁剪三大稳健性机制保障训练稳定。
实验成果显示,在零基础模型 Qwen2.5-32B-Base 上,平均推理长度从约 4,000 Token 推升至 10,000 Token 以上。在 AIME 2024 数学测试中,准确率突破基线 50.0% 瓶颈提升至 58.0%,成为首个在 32B 参数规模、纯强化学习设定下性能超越 o1-mini 的开源方案。相关论文、代码及型均已开源。
BlockBeats 消息,4 月 7 日,据华尔街日报报道,由 Anthony Pompliano 创立的 ProCap Financial 推出 AI 投研产品「ProCap Insights」,可自动生成个股及宏观研究内容,目标用户为个人投资者。该产品通过 AI agent 实时扫描市场数据并生成报告,强调速度和成本优势,但不会直接提供买卖建议以规避监管风险。订阅价格为约 2500 美元/年,开发成本较低,几乎无需传统分析师团队支持。
公司同时推进 AI 能力扩展,包括收购相关技术公司并获取用户财务数据(匿名化),以增强模型分析能力,打造类似「AI 投顾/个人 CFO」的服务体系。
ProCap Financial 是一家专注于比特币原生金融服务的上市公司(纳斯达克代码:BRR),由知名加密投资者 Anthony Pompliano 于 2025 年创立。
BlockBeats 消息,4 月 7 日,据澎湃新闻报道,360 漏洞挖掘智能体近期针对 OpenClaw 新挖掘并上报 1 个高危、2 个中危共 3 个高价值漏洞,目前所有新发现漏洞均已被官方修复并公开披露。
据悉,此次新发现的三大漏洞直指 AI 智能体核心运行机制,直接影响用户设备、数据与账号的核心安全。
[原文链接]据 1M AI News 监测,好莱坞女星 Milla Jovovich(代表作《第五元素》《生化危机》系列)与比特币创业者、去中心化借贷平台 Libre 创始人 Ben Sigman 联合开发了开源 AI 记忆系统 MemPalace,以 MIT 协议在 GitHub 发布,三天内获得 5500 颗星标。Sigman 称二人花了数月时间用 Anthropic 的 Claude 开发该项目,Git 提交记录中 Claude Opus 4.6 被列为代码共同作者。
MemPalace 的核心竞争力在基准测试成绩。在记忆检索行业标准基准 LongMemEval 上,纯本地检索(不调用任何外部 API)达到 96.6% 的 Recall@5,开启可选的 Haiku 模型重排序后取得 500 题全对的满分,项目方称这是该基准有史以来的最高分,无论免费还是付费产品。在另外两个基准上,ConvoMem 得分 92.9%,称超过 AI 记忆产品 Mem0 两倍以上;LoCoMo 全部多跳推理类别均为满分。基准测试代码已随仓库公开,可复现。
与常见的向量数据库方案不同,MemPalace 模仿古希腊演说家的「记忆宫殿」术来组织信息。系统将用户的对话记录挖掘整理为四层结构:翼(Wing,按人物或项目划分)→ 房间(Room,具体主题)→ 壁橱(Closet,压缩摘要)→ 抽屉(Drawer,逐字对话记录),同一翼内的相关房间通过「厅」(Hall)横向连通,不同翼之间通过「隧道」(Tunnel)交叉引用。项目方测试显示,仅凭这套结构就能将检索准确率提升 34%。
项目还自创了一种名为 AAAK 的无损压缩方言,专为 AI 代理设计,将上千 token 的用户上下文压缩到约 120 token,压缩比约 30 倍。AAAK 是纯结构化文本,不需要特殊解码器或微调,任何能读文本的大语言模型都能直接理解。系统还内置矛盾检测,能在输出前捕捉姓名、代词、年龄等前后不一致。
整个系统完全在本地运行,不依赖云服务,不需要 API 密钥,不收费。支持通过 MCP 协议接入 Claude、ChatGPT、Cursor 等工具(提供 19 个 MCP 工具),也支持通过命令行为 Llama、Mistral 等本地模型生成上下文摘要。
Jovovich 的跨界令科技圈颇感意外。项目仓库注册在她的 GitHub 账号下,7 次提交中有 4 次由她完成,包括包含全部核心代码的初始提交。她在 Instagram 上发布了项目介绍视频。
据 1M AI News 监测,中国无人配送企业新石器无人车(Neolix)发布 AI 智能体 NeoClaw,将 AI 在车队管理、复杂任务调度、运营数据分析等一线场景落地,致力于让管理多辆无人车像「一句话,AI 全帮安排好」一样简单。
随着无人配送行业持续走向规模化落地,一线运营人员同时管理几十上百辆车已成常态。然而,传统运营模式依赖人工跑腿、表格算账,人管车模式存在天然的管理半径上限。伴随车队规模扩大,运营方也会面临「规模不经济」的困境——人员成本不断增加,管理复杂度上升,运营效率反而下降。此外,企业进入新城市时,往往需要重新搭建本地团队、培训新人、磨合流程,传统堆砌人力的方式不仅速度慢,不同城市的运营水平也参差不齐,都会导致无人车的运营开支等总成本攀升。
而借助 NeoClaw 内置的车队管理、车辆控制和数据查询分析等运营核心能力,无论是指挥无人车送货、批量开车,还是更复杂的批量识别车辆状态、安排充电、分析运营数据等工作,用户只需要告诉 NeoClaw 要干什么,NeoClaw 都能帮用户轻松完成。目前,NeoClaw 已在中国青岛等地的部分区域率先上线,后续将覆盖更多地区。
[原文链接]据 1M AI News 监测,Anthropic 旗下 AI 编程工具 Claude Code 遭遇严重口碑危机。来自 AMD 的 AI 总监在 GitHub 官方仓库公开提交问题报告,基于对数万条会话日志的量化分析,指控 Claude Code 自今年 2 月起出现系统性能力退化,思考深度骤降 67%,模型行为全面走样。这一报告迅速在开发者社区引爆讨论,将 Anthropic 推上舆论风口。基于 6852 个会话日志的分析显示,模型的思考深度中位数骤降 67%,修改代码前的研究投入减少约 70%,而推诿、提前终止等不良行为的触发次数在 17 天内飙升至 173 次。AMD 的 AI 总监直言「Claude 已无法被信任来执行复杂工程任务」,其团队已切换至其他服务商。
Anthropic 团队成员 Boris 回应称,问题源于 2 月 9 日引入的「自适应思考」机制以及 3 月 3 日将默认思考等级从高调整为中等,并非模型核心能力退化,建议用户手动调高 effort 等级恢复性能。然而大量开发者实测反馈,即便将参数调至最高,模型「急于完成任务」的摆烂行为依然明显,认为官方解释未能触及问题本质。
该报告在开发者社区引发强烈反响,大量用户表示已取消订阅并切换至 OpenAI Codex 等替代工具。与此同时,退化带来的无效循环使 API 成本灾难性膨胀:在提问量持平的情况下,月度成本从 345 美元飙升至 42121 美元,涨幅达 122 倍。分析还指出,官方此前上线的「隐藏思考内容」功能客观上遮蔽了这一退化过程,进一步加剧了用户的不信任感。
[原文链接]据 1M AI News 监测,英伟达于 2025 年 12 月宣布收购 SchedMD 公司,该公司是开源作业调度软件 Slurm 的主要开发者,而 Slurm 广泛用于管理超级计算机和 AI 数据中心的计算任务调度,据称全球约 60% 的超级计算机都在使用它,包括 Anthropic、Meta、Mistral 等公司的 AI 训练集群,以及多国政府用于天气预报和核武器开发的超级计算机。Slurm 特别擅长管理英伟达芯片,但在非英伟达硬件上也有大量应用。
这一收购近期开始引发 AI 专家和超级计算机用户的担忧,他们担心英伟达可能会通过软件更新 subtly 偏向自家芯片(如 CUDA 和 InfiniBand),从而让 AMD、Intel 等竞争对手的硬件性能受损。部分人士引用英伟达此前收购 Bright Computing 的案例,认为类似整合可能导致其他芯片出现性能惩罚。Intersect360 Research CEO Addison Snell 表示,担忧在于英伟达可能将这个通用的开源工具改造为「更适合或专属自家硬件」的产品,影响公平竞争。
英伟达回应称,Slurm 仍是开源软件,公司将继续为所有用户提供增强和支持,强调其致力于「开源、厂商中立」的开发,并表示客户会普遍受益。公司计划维持对 SchedMD 数百家客户的培训和技术支持,同时否认过去收购会损害多硬件兼容性。这一事件被视为检验 Nvidia 在 AI 和高性能计算领域是否真正保持开放的重要测试。
[原文链接]据 1M AI News 监测,字节跳动旗下短剧平台红果短剧宣布:一季度,平台已累计下架违反平台治理规范的漫剧 1718 部。其中针对近期 AI 短剧素材违规使用问题频发的情况,平台专项开展集中治理。目前已完成 1.5 万部作品的全面核查,依规处置违规作品 670 部。
[原文链接]据 1M AI News 监测,近日,中电信人工智能科技(北京)有限公司发生工商变更,新增中国国家人工智能产业投资基金合伙企业(有限合伙)、央视融媒体产业投资基金(有限合伙)、北京市人工智能产业投资基金(有限合伙)等为股东,同时注册资本由 30 亿元增至 33.72 亿元。
公开信息显示,中电信人工智能是中国电信开展人工智能业务的科技型、能力型、平台型专业公司。
[原文链接]据 1M AI News 监测,彭博 Opinion 专栏作家 Parmy Olson 撰文称,OpenAI 和 Anthropic 均在为 2026 年末或 2027 年初的 IPO 铺路,但 Altman 把精力放错了地方。Olson 将 Altman 比作扎克伯格,称其有追逐闪亮新事物的习惯:先让 ChatGPT 做购物,大量算力砸进 Sora,如今又押注代号 Spud 的新模型来打造「超级应用」。但超级应用在欧美市场从未成功过,马斯克想把 X 做成万能应用也没能实现。
她认为 Altman 真正该做的是修复与微软的关系。四分之三的财富 500 强企业使用 Microsoft 365,微软拥有 4.5 亿企业端用户。ChatGPT 虽有 9 亿周活用户,但消费者是巨大的算力成本,微软的企业客户才是通往盈利的路径。OpenAI 上周披露月营收 20 亿美元,但未公布亏损,预计到 2029 年将烧掉 1150 亿美元现金。
Olson 还点出一个令 OpenAI 尴尬的事实:微软近期在 Copilot 中引入了 Claude 来审核 GPT 输出的准确性和引用完整性,她称这是「一个看得见的、令人尴尬的差距」。她建议 Altman 少把微软当提款机,多当产品伙伴,用微软的企业分发优势铺就更稳的 IPO 之路。