header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP
全部
预测市场
AI
链上侦探
融资
2026-03-13
订阅推送
自动更新

1M AI News 监测,美股零售交易数据平台 Unusual Whales 发布了 MCP Server,通过 Anthropic 主导的 Model Context Protocol 协议,将实时金融市场数据接入 AI 助手。该 MCP Server 提供 18 个工具和 123 个以上的操作接口,覆盖实时期权资金流(含 sweeps 和大宗交易)、暗池交易及 NBBO 报价上下文、美国国会议员交易披露、公司财务报表(利润表、资产负债表、现金流量表)、技术指标(含 RSI)以及预测市场等数据类别。

该 MCP Server 支持 Claude Desktop、Cursor、VS Code、Windsurf 等客户端,官方称 30 秒即可完成配置。Unusual Whales 在推文中表示,用户可以用自然语言直接构建交易机器人或金融仪表板,「想建什么就建什么」。文档页面注明该服务面向 vibecoders(即用自然语言驱动 AI 编程的开发者)和专业交易者,Unusual Whales 同时也提供 REST API、WebSocket 和 Kafka 等传统接入方式。

[原文链接]

1M AI News 监测,AI 安全评估机构 METR 发布了对 Anthropic Claude Opus 4.6 破坏风险报告(Sabotage Risk Report)的独立外部评审。Anthropic 向 METR 提供了报告的未删减版本,METR 先后审阅了 2 月 11 日和 3 月 3 日两个版本,分别出具了评审文件。

METR 认同 Anthropic 的总体结论:Opus 4.6 通过不对齐行为导致灾难性后果的风险「很低但非零」。但 METR 对几个关键环节提出了异议:对齐评估的灵敏度可能被「评估感知」(evaluation awareness)削弱,即模型可能意识到自己正在被测试从而调整行为;评审还发现了一些未被对齐评估捕获的低严重性不对齐行为,这让 METR 认为「可能存在更多尚未被检测到的类似行为」。METR 建议 Anthropic 对评估感知和「隐蔽的不对齐推理」(obfuscated misaligned reasoning)进行更深入的调查。METR 也指出,其最终结论的信心部分来自 Opus 4.6 已公开部署数周未出现重大事故这一事实。

[原文链接]

1M AI News 监测,开源 AI 聊天框架 LobeChat(GitHub 7.36 万星)的创始人空谷 Arvin Xu 今日在 X 上发帖,贴出 LobeHub Skills Marketplace 与腾讯 SkillHub 的对比截图,称后者的布局和图标与自己的产品相似,「这抄都不会去换一下图标的吗?」Arvin Xu 是 Ant Design UI 核心成员、前蚂蚁集团员工。LobeChat 采用 Apache 2.0 开源协议,该协议允许商业使用和二次开发。

此前 OpenClaw 创始人 Peter Steinberger 也曾质疑腾讯 SkillHub 在未对项目做出贡献的情况下搬运了 ClawHub 的技能数据。腾讯当时回应称,SkillHub 是面向中国用户的本地镜像站,已标注 ClawHub 为原始来源,团队成员也是 OpenClaw 的代码贡献者。截至发稿,腾讯尚未就 LobeHub 方面的说法作出回应。

[原文链接]

1M AI News 监测,AI 编程工具 Cursor 公开了其内部基准测试 CursorBench 的方法论和数据。Cursor 认为 SWE-bench 等公开基准存在三个根本问题:任务以修 bug 为主,与开发者实际使用 agent 的方式不对齐;评分机制假设只有少数正确解法,无法处理开放式需求;训练数据污染严重,OpenAI 已因此停止报告 SWE-bench Verified 成绩,其调查发现近 60% 的未解决问题存在测试缺陷。

CursorBench 的任务来源于 Cursor Blame 功能:追溯已提交代码到产生它的 agent 请求,形成天然的「需求 — 正确答案」配对。大量任务取自内部代码库,降低数据污染风险,测试集每隔数月更新。当前版本 CursorBench-3 的任务复杂度较初版翻倍(代码行数和涉及文件数均翻倍),远超 SWE-bench 各变体。任务描述故意保持简短模糊,模拟开发者与 agent 的真实交流方式,由 agent 评分器打分。

Cursor 称 CursorBench 在前沿模型间产生了比公开基准更大的区分度。在公开基准上分数接近甚至被 Haiku 追平的模型,在 CursorBench 上呈现出与开发者实际体验一致的明显差距。Cursor 表示未来将适配长时运行的自主 agent 场景,并计划公开更多数据。

[原文链接]

1M AI News 监测,继此前腾讯 SkillHub 搬运 ClawHub 技能一事后,有用户进一步发现,安装腾讯 SkillHub 时自动附带的 skillhub 插件会在用户发给 AI 的每一条消息前,强行插入一段名为「Skills store policy (operator configured)」的策略提示词。该提示词包含 6 条规则,核心指令是:技能发现、安装和搜索时优先使用 skillhub(标注为 cn-optimized),不可用或未匹配时才回退到官方的 clawhub(public-registry)。

即刻用户「张佳的流量常识」在「大公司负面监督小组」圈子发帖,贴出截图和源码分析。截图显示,该策略文本出现在每条对话中,持续消耗用户 token。对插件路径 ~/.openclaw/extensions/skillhub/index.ts 的源码分析表明,该插件的核心逻辑仅有一项:通过 before_prompt_build 事件钩子,以 prependContext 方式将策略文本插入系统提示词最前端。分析结论是:「本质上就是一个提示词注入器,没有实际业务逻辑,只做策略声明。」帖主评价:「这是我使用 Agent 以来,遇到的第一个流氓软件。」

[原文链接]

1M AI News 监测,OpenAI 为 Responses API 新增 Shell 工具(Hosted Shell Tool),模型可在隔离容器中执行命令行操作。与仅支持 Python 的 Code Interpreter 不同,Shell 工具支持 Go、Java、Node.js 等多种语言,可运行服务、调用外部 API、生成电子表格和报告等制品。每个会话的容器带有持久化文件系统,支持跨轮次保持状态。

安全方面,网络访问通过边车出口代理(egress proxy)进行域名白名单控制,密钥以占位符形式注入容器,实际密钥仅在代理层处理。平台还新增了 /compact 端点,可在长会话中进行服务端上下文压缩。开发者可将「Agent Skills」作为版本化包上传挂载到容器中,Glean 是该功能的首批企业用户。容器定价为 1 GB 配置每 20 分钟 0.03 美元,4 GB 配置 0.12 美元,3 月 31 日起正式计费。OpenAI 同时宣布 Assistants API 将在 2026 年内停用。

[原文链接]

1M AI News 监测,Adobe CEO Shantanu Narayen 宣布将在继任者到位后卸任,届时他将继续担任董事会主席。Adobe 董事会已任命首席独立董事 Frank Calderoni 领导特别委员会,负责内外部候选人的遴选工作。Narayen 自 2007 年 12 月起担任 CEO,在任期间 Adobe 员工从约 3000 人增至超过 30000 人,年收入从不到 10 亿美元增长至超过 250 亿美元。

同日公布的 2026 财年 Q1 业绩超出预期:每股收益 6.06 美元(预期 5.87),营收 64 亿美元,同比增长 12.1%。AI 产品年化收入同比增长超过两倍。但 Q2 指引仅略高于华尔街预期,加上 CEO 交接消息,Adobe 股价盘后下跌约 1.4%。Narayen 卸任的背景是华尔街正在辩论 AI 是否会削弱传统软件工具的需求。2 月的 SaaS 板块抛售已反映出市场担忧 AI agent 可能冲击按人头收费的软件定价模式。

[原文链接]

1M AI News 监测,AI 数据库初创公司 HydraDB 宣布完成 650 万美元种子轮融资。创始人 Nishkarsh 在 X 上表示,当前所有系统检索上下文的方式都是同一套路:向量搜索将一切存为扁平的 embedding,然后返回「感觉上最接近」的结果。「相似?当然。相关?几乎从来不是。」

Nishkarsh 用一个案例说明问题:有人让 AI 查一份合同,得到了一份详尽、精心组织的答案——但内容来自一个完全不同的客户文件。原因是 embedding 在语言足够接近时,无法区分 Q3 续约条款和 Q1 终止通知。他指出,一旦文档量超过 1,000 万份,这种混淆会频繁发生,「向量数据库的准确率就崩了」。

HydraDB 的方案是构建一个以本体论(ontology)为核心的上下文图谱:不只是计算向量相似度,而是映射实体之间的关系、理解文档背后的「为什么」、追踪信息随时间的演变。Nishkarsh 举例,当用户查询「Apple」时,系统知道你指的是你正在服务的那家客户公司,而不是水果。

[原文链接]

1M AI News 监测,魅族近期宣布一轮大调整,超 50% 的员工即将离开,涉及约 400 人。离开的员工中,大部分将获得 N+2 赔偿,本周五前办完手续;潮牌团队 PANDAER 将分拆、自负盈亏;AR 眼镜团队据报部分被 AR 眼镜公司雷鸟创新吸收,魅族方面否认了这一说法。

更值得关注的是背后的资产流向。据独家报道,AI 公司阶跃星辰此前曾与魅族手机团队洽谈并购,但最终放弃,原因是「认为魅族当前品牌价值并不大」。不过,阶跃星辰旗下 AI 硬件公司智跃千里已经吸收了魅族手机的部分核心资产,包括代码、产品文档、技术接口文档和视觉动效文档等。阶跃星辰与魅族的关联在于共同的资方吉利:吉利数年前收购魅族近八成股权,同时也是阶跃星辰和千里科技的出资方,旷视联合创始人印奇同时担任阶跃星辰和千里科技的董事长。

经过调整后,魅族手机剩余员工约 400 人,将分流至 Flyme 车机团队和 AI 软件方向。据报这批人员主要集中在珠海,接下来不再使用魅族品牌,或将更换公司主体。魅族 2 月 27 日曾发布公告,宣布暂停手机新产品自研硬件项目。公告将战略调整的原因直指内存涨价,称「手机新产品的商业化变成不可为」。

[原文链接]

1M AI News 监测,美团 CEO 王兴今日在 2026 年管理层沟通会上表示:「AI Agent 对我的冲击比 ChatGPT 冲击更大。」他称移动互联网和互联网的区别像玫瑰和芍药,而 AI 和互联网相比「像猴与花的区别,量级和影响力要大得多」。王兴认为 AI 注定会创造巨大生产力,也一定会对组织和工作模式带来很大变化,面对 AI 浪潮「唯一能做的就是积极拥抱它」。

王兴用一个比喻阐述美团的 AI 切入点:就算爱因斯坦当秘书,让他订一个餐厅,他依然不知道那个餐厅有没有座位,「这不是智力问题,而是信息问题。」言下之意,大模型再聪明也需要物理世界的实时数据,而这正是美团的长期积累所在。美团核心本地商业 CEO 王莆中在同一场合表示,美团将坚定投入自有基础大模型,做有特色的低推理成本模型,同时建设物理世界最全最准的数据基础,帮每个商家都用上 AI 助理。美团此前已在春节期间上线 AI 搜索产品「问小团」。

此次沟通会有 2000 余名管理者线上线下参会。王兴还要求管理层「减少登味」,倡议公司内部直呼其名,不再叫「兴哥」。

[原文链接]
查看更多
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成