据 1M AI News 监测,美股零售交易数据平台 Unusual Whales 发布了 MCP Server,通过 Anthropic 主导的 Model Context Protocol 协议,将实时金融市场数据接入 AI 助手。该 MCP Server 提供 18 个工具和 123 个以上的操作接口,覆盖实时期权资金流(含 sweeps 和大宗交易)、暗池交易及 NBBO 报价上下文、美国国会议员交易披露、公司财务报表(利润表、资产负债表、现金流量表)、技术指标(含 RSI)以及预测市场等数据类别。
该 MCP Server 支持 Claude Desktop、Cursor、VS Code、Windsurf 等客户端,官方称 30 秒即可完成配置。Unusual Whales 在推文中表示,用户可以用自然语言直接构建交易机器人或金融仪表板,「想建什么就建什么」。文档页面注明该服务面向 vibecoders(即用自然语言驱动 AI 编程的开发者)和专业交易者,Unusual Whales 同时也提供 REST API、WebSocket 和 Kafka 等传统接入方式。
据 1M AI News 监测,AI 安全评估机构 METR 发布了对 Anthropic Claude Opus 4.6 破坏风险报告(Sabotage Risk Report)的独立外部评审。Anthropic 向 METR 提供了报告的未删减版本,METR 先后审阅了 2 月 11 日和 3 月 3 日两个版本,分别出具了评审文件。
METR 认同 Anthropic 的总体结论:Opus 4.6 通过不对齐行为导致灾难性后果的风险「很低但非零」。但 METR 对几个关键环节提出了异议:对齐评估的灵敏度可能被「评估感知」(evaluation awareness)削弱,即模型可能意识到自己正在被测试从而调整行为;评审还发现了一些未被对齐评估捕获的低严重性不对齐行为,这让 METR 认为「可能存在更多尚未被检测到的类似行为」。METR 建议 Anthropic 对评估感知和「隐蔽的不对齐推理」(obfuscated misaligned reasoning)进行更深入的调查。METR 也指出,其最终结论的信心部分来自 Opus 4.6 已公开部署数周未出现重大事故这一事实。
据 1M AI News 监测,开源 AI 聊天框架 LobeChat(GitHub 7.36 万星)的创始人空谷 Arvin Xu 今日在 X 上发帖,贴出 LobeHub Skills Marketplace 与腾讯 SkillHub 的对比截图,称后者的布局和图标与自己的产品相似,「这抄都不会去换一下图标的吗?」Arvin Xu 是 Ant Design UI 核心成员、前蚂蚁集团员工。LobeChat 采用 Apache 2.0 开源协议,该协议允许商业使用和二次开发。
此前 OpenClaw 创始人 Peter Steinberger 也曾质疑腾讯 SkillHub 在未对项目做出贡献的情况下搬运了 ClawHub 的技能数据。腾讯当时回应称,SkillHub 是面向中国用户的本地镜像站,已标注 ClawHub 为原始来源,团队成员也是 OpenClaw 的代码贡献者。截至发稿,腾讯尚未就 LobeHub 方面的说法作出回应。
据 1M AI News 监测,AI 编程工具 Cursor 公开了其内部基准测试 CursorBench 的方法论和数据。Cursor 认为 SWE-bench 等公开基准存在三个根本问题:任务以修 bug 为主,与开发者实际使用 agent 的方式不对齐;评分机制假设只有少数正确解法,无法处理开放式需求;训练数据污染严重,OpenAI 已因此停止报告 SWE-bench Verified 成绩,其调查发现近 60% 的未解决问题存在测试缺陷。
CursorBench 的任务来源于 Cursor Blame 功能:追溯已提交代码到产生它的 agent 请求,形成天然的「需求 — 正确答案」配对。大量任务取自内部代码库,降低数据污染风险,测试集每隔数月更新。当前版本 CursorBench-3 的任务复杂度较初版翻倍(代码行数和涉及文件数均翻倍),远超 SWE-bench 各变体。任务描述故意保持简短模糊,模拟开发者与 agent 的真实交流方式,由 agent 评分器打分。
Cursor 称 CursorBench 在前沿模型间产生了比公开基准更大的区分度。在公开基准上分数接近甚至被 Haiku 追平的模型,在 CursorBench 上呈现出与开发者实际体验一致的明显差距。Cursor 表示未来将适配长时运行的自主 agent 场景,并计划公开更多数据。
据 1M AI News 监测,继此前腾讯 SkillHub 搬运 ClawHub 技能一事后,有用户进一步发现,安装腾讯 SkillHub 时自动附带的 skillhub 插件会在用户发给 AI 的每一条消息前,强行插入一段名为「Skills store policy (operator configured)」的策略提示词。该提示词包含 6 条规则,核心指令是:技能发现、安装和搜索时优先使用 skillhub(标注为 cn-optimized),不可用或未匹配时才回退到官方的 clawhub(public-registry)。
即刻用户「张佳的流量常识」在「大公司负面监督小组」圈子发帖,贴出截图和源码分析。截图显示,该策略文本出现在每条对话中,持续消耗用户 token。对插件路径 ~/.openclaw/extensions/skillhub/index.ts 的源码分析表明,该插件的核心逻辑仅有一项:通过 before_prompt_build 事件钩子,以 prependContext 方式将策略文本插入系统提示词最前端。分析结论是:「本质上就是一个提示词注入器,没有实际业务逻辑,只做策略声明。」帖主评价:「这是我使用 Agent 以来,遇到的第一个流氓软件。」
据 1M AI News 监测,OpenAI 为 Responses API 新增 Shell 工具(Hosted Shell Tool),模型可在隔离容器中执行命令行操作。与仅支持 Python 的 Code Interpreter 不同,Shell 工具支持 Go、Java、Node.js 等多种语言,可运行服务、调用外部 API、生成电子表格和报告等制品。每个会话的容器带有持久化文件系统,支持跨轮次保持状态。
安全方面,网络访问通过边车出口代理(egress proxy)进行域名白名单控制,密钥以占位符形式注入容器,实际密钥仅在代理层处理。平台还新增了 /compact 端点,可在长会话中进行服务端上下文压缩。开发者可将「Agent Skills」作为版本化包上传挂载到容器中,Glean 是该功能的首批企业用户。容器定价为 1 GB 配置每 20 分钟 0.03 美元,4 GB 配置 0.12 美元,3 月 31 日起正式计费。OpenAI 同时宣布 Assistants API 将在 2026 年内停用。
据 1M AI News 监测,Adobe CEO Shantanu Narayen 宣布将在继任者到位后卸任,届时他将继续担任董事会主席。Adobe 董事会已任命首席独立董事 Frank Calderoni 领导特别委员会,负责内外部候选人的遴选工作。Narayen 自 2007 年 12 月起担任 CEO,在任期间 Adobe 员工从约 3000 人增至超过 30000 人,年收入从不到 10 亿美元增长至超过 250 亿美元。
同日公布的 2026 财年 Q1 业绩超出预期:每股收益 6.06 美元(预期 5.87),营收 64 亿美元,同比增长 12.1%。AI 产品年化收入同比增长超过两倍。但 Q2 指引仅略高于华尔街预期,加上 CEO 交接消息,Adobe 股价盘后下跌约 1.4%。Narayen 卸任的背景是华尔街正在辩论 AI 是否会削弱传统软件工具的需求。2 月的 SaaS 板块抛售已反映出市场担忧 AI agent 可能冲击按人头收费的软件定价模式。
据 1M AI News 监测,AI 数据库初创公司 HydraDB 宣布完成 650 万美元种子轮融资。创始人 Nishkarsh 在 X 上表示,当前所有系统检索上下文的方式都是同一套路:向量搜索将一切存为扁平的 embedding,然后返回「感觉上最接近」的结果。「相似?当然。相关?几乎从来不是。」
Nishkarsh 用一个案例说明问题:有人让 AI 查一份合同,得到了一份详尽、精心组织的答案——但内容来自一个完全不同的客户文件。原因是 embedding 在语言足够接近时,无法区分 Q3 续约条款和 Q1 终止通知。他指出,一旦文档量超过 1,000 万份,这种混淆会频繁发生,「向量数据库的准确率就崩了」。
HydraDB 的方案是构建一个以本体论(ontology)为核心的上下文图谱:不只是计算向量相似度,而是映射实体之间的关系、理解文档背后的「为什么」、追踪信息随时间的演变。Nishkarsh 举例,当用户查询「Apple」时,系统知道你指的是你正在服务的那家客户公司,而不是水果。
据 1M AI News 监测,魅族近期宣布一轮大调整,超 50% 的员工即将离开,涉及约 400 人。离开的员工中,大部分将获得 N+2 赔偿,本周五前办完手续;潮牌团队 PANDAER 将分拆、自负盈亏;AR 眼镜团队据报部分被 AR 眼镜公司雷鸟创新吸收,魅族方面否认了这一说法。
更值得关注的是背后的资产流向。据独家报道,AI 公司阶跃星辰此前曾与魅族手机团队洽谈并购,但最终放弃,原因是「认为魅族当前品牌价值并不大」。不过,阶跃星辰旗下 AI 硬件公司智跃千里已经吸收了魅族手机的部分核心资产,包括代码、产品文档、技术接口文档和视觉动效文档等。阶跃星辰与魅族的关联在于共同的资方吉利:吉利数年前收购魅族近八成股权,同时也是阶跃星辰和千里科技的出资方,旷视联合创始人印奇同时担任阶跃星辰和千里科技的董事长。
经过调整后,魅族手机剩余员工约 400 人,将分流至 Flyme 车机团队和 AI 软件方向。据报这批人员主要集中在珠海,接下来不再使用魅族品牌,或将更换公司主体。魅族 2 月 27 日曾发布公告,宣布暂停手机新产品自研硬件项目。公告将战略调整的原因直指内存涨价,称「手机新产品的商业化变成不可为」。
据 1M AI News 监测,美团 CEO 王兴今日在 2026 年管理层沟通会上表示:「AI Agent 对我的冲击比 ChatGPT 冲击更大。」他称移动互联网和互联网的区别像玫瑰和芍药,而 AI 和互联网相比「像猴与花的区别,量级和影响力要大得多」。王兴认为 AI 注定会创造巨大生产力,也一定会对组织和工作模式带来很大变化,面对 AI 浪潮「唯一能做的就是积极拥抱它」。
王兴用一个比喻阐述美团的 AI 切入点:就算爱因斯坦当秘书,让他订一个餐厅,他依然不知道那个餐厅有没有座位,「这不是智力问题,而是信息问题。」言下之意,大模型再聪明也需要物理世界的实时数据,而这正是美团的长期积累所在。美团核心本地商业 CEO 王莆中在同一场合表示,美团将坚定投入自有基础大模型,做有特色的低推理成本模型,同时建设物理世界最全最准的数据基础,帮每个商家都用上 AI 助理。美团此前已在春节期间上线 AI 搜索产品「问小团」。
此次沟通会有 2000 余名管理者线上线下参会。王兴还要求管理层「减少登味」,倡议公司内部直呼其名,不再叫「兴哥」。