header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP
全部
预测市场
AI
链上侦探
融资
2026-03-11
订阅推送
自动更新

1M AI News 监测,OpenAI 计划将 Sora AI 视频生成功能整合进 ChatGPT。Sora 独立 App 去年 9 月上线后一度登上 App Store 榜首,但用户活跃迅速下滑,目前排名已跌至第 165 位。Sam Altman 此前在全员会上承认,仅有少量 Sora 用户会在 App 内公开分享视频。

将 Sora 接入 ChatGPT 有望提升周活用户数,目前约 9.2 亿,距离去年定下的 10 亿目标仍有差距。OpenAI 可能希望复制去年 3 月吉卜力风格照片引爆全网、将算力推至极限的那一刻。ChatGPT 此后已成为个人和企业用户(包括家具和服装设计师)的主要 AI 图像生成工具。Sora 独立 App 将继续运营,但长期规划尚不明确。

谷歌 Gemini 已通过 Veo AI 提供视频生成功能。OpenAI 近期也撤回了在 ChatGPT 内直接内置购物的计划。OpenAI 预计从现在到 2030 年推理成本将超过 2250 亿美元,并已为病毒式功能引发的用量峰值储备算力。

[原文链接]

据 1M AI News 监测,腾讯云智能体开发平台今日发布公告,宣布自 3 月 13 日起对部分模型计费策略进行调整,涉及两类变更。

第一类是模型结束免费公测:GLM 5(智谱)、MiniMax 2.5、Kimi 2.5(月之暗面)三款第三方模型将转为正式商用,按量计费。非套餐用户需在 3 月 13 日前手动开启后付费设置,套餐用户则通过 PU 资源抵扣。

第二类是自研模型涨价:混元系列 Tencent HY2.0 Instruct 输入价格从每千 tokens 0.0008 元调至 0.004505 元,输出从 0.002 元调至 0.01113 元;HY2.0 Think 输入从 0.001 元调至 0.0053 元,输出从 0.004 元调至 0.0212 元,涨幅约 4.3 至 4.6 倍。

[原文链接]

据 1M AI News 监测,OpenAI 为 ChatGPT 推出「动态可视化解释」(dynamic visual explanations)功能。用户提出数学或科学问题时,ChatGPT 不再仅给出文字回答,还会生成可交互操作的可视化模块:图表、几何图形和公式模型均可直接在对话中拖动调整变量,实时观察结果变化。例如提问勾股定理时,可以拖动三角形的边长,立即看到斜边随之更新。

该功能目前覆盖 70 余个数学和科学核心概念,包括二项式平方、查理定律、圆面积、复利、库仑定律、指数衰减、胡克定律、动能、线性方程和欧姆定律等,主要面向高中和大学阶段学习者。OpenAI 称每周有 1.4 亿用户使用 ChatGPT 获取数学和科学帮助。该功能对所有已登录 ChatGPT 用户开放,后续将扩展更多主题。

[原文链接]

据 1M AI News 监测,月之暗面(Moonshot AI)创始人兼 CEO 杨植麟将于 3 月 17 日在英伟达 GTC 大会上发表演讲,主题为「How We Scaled Kimi K2.5」,归属 Open Models Session,时间为太平洋时间上午 11:00—11:40。Kimi 官方称这是杨植麟首次在美国的公开亮相。

[原文链接]

据 1M AI News 监测,Codex 工程负责人 Thibault Sottiaux 确认 Codex 已恢复稳定,并再次按下了速率限制重置按钮。此前他曾发文称「Codex 的 GPU 集群快要熔化了(GPU fleet is still melting),团队日夜赶工以跟上需求」。这是连续第二天出现故障后重置速率限制的循环。

[原文链接]

据 1M AI News 监测,OpenAI 状态页显示 Codex 再次无响应,截至发稿已持续超过 1 天,官方表示仍在实施修复方案。同时 ChatGPT 也出现文件上传错误(持续 7 小时,已进入监控恢复阶段)和文件下载错误(持续 5 小时,已确认问题)。

Codex 工程负责人 Thibault Sottiaux 在 X 上表示:「我们正在尽快为 Codex 增加算力,但需求增速超出预期,部分用户的服务可能会有些卡顿。团队在幕后全力工作。」这是 Codex 连续两天出现服务中断。昨日故障修复后,团队曾按惯例重置了所有用户的速率限制作为补偿。

[原文链接]

据 1M AI News 监测,情感语音 AI 公司 Hume AI 首次开源了 TTS(文本转语音)模型 TADA(Text-Acoustic Dual Alignment)。该模型的核心创新是将文本 token 与声学特征做 1:1 对齐,在单一同步流中同时生成文本和语音,从根本上消除了传统 LLM TTS 中因音频序列远长于文本序列而导致的幻觉问题。

官方公布的性能数据:在 1000+ 测试样本中实现零内容幻觉(传统系统常出现漏词、多词等问题),推理速度比同级 LLM TTS 快 5 倍。在相同的 2048 个 token 预算下,TADA 可覆盖约 700 秒音频,而传统系统仅覆盖约 70 秒,同时附带免费文本转录且不增加延迟。代码和预训练模型已在 PyPI 上开放下载。

Hume AI 由心理学博士 Alan Cowen 创立,专注于理解和生成具有情感表达能力的语音 AI。今年 1 月,Cowen 和约 7 名核心工程师被谷歌 DeepMind 以 IP 授权模式引入(非收购),用于增强 Gemini 的情感语音能力。Hume AI 在新任 CEO Andrew Ettinger 领导下继续独立运营。

[原文链接]

据 1M AI News 监测,法国独立开发者 Thomas Ricouard(@Dimillian)宣布将于本月底加入 OpenAI,专注于 Codex 相关工作。Ricouard 此前在 Medium 担任资深 iOS 工程师,更为人知的身份是开源 Mastodon 客户端 IceCubesApp 的作者,此前还曾在 Google 和电子书平台 Glose 工作。

真正促成这次加入的,是他业余时间开发的开源项目 Codex Monitor。在 OpenAI 2 月初正式推出官方 Codex macOS 桌面应用之前,Ricouard 就已独立构建了这款基于 Tauri(Rust + React)的第三方桌面客户端。Codex Monitor 通过 Codex CLI 的 app-server 协议连接底层 Agent,提供了多工作区编排、线程管理、Git worktree 隔离和 GitHub 集成等功能——与 OpenAI 后来发布的官方 app 在产品理念上高度重合:两者都定位为 Agent 的「指挥中心」,都支持多 Agent 并行、worktree 隔离和 diff review。Ricouard 本人已将 Codex Monitor 作为日常主力开发环境,取代了传统 IDE。

Ricouard 表示,他将加入 Codex 的开发者体验团队,与 OpenAI 开发者关系负责人 Romain Huet 合作,并期待将自己的 iOS 和 macOS 开发经验带入 Codex 在这些平台上的体验优化。他确认 Codex Monitor 将继续保持开源。这也契合 OpenAI 近期的招募模式——去年 9 月,OpenAI 以类似路径将 AI Xcode 工具 Alex 的团队纳入 Codex 部门。

[原文链接]

据 1M AI News 监测,谷歌 CEO Sundar Pichai 宣布 Workspace 套件全线深度集成 Gemini,今日起以 Beta 形式向 Google AI Ultra 和 Pro 付费用户开放(英文版全球可用,Drive 功能暂限美国)。

Docs 新增「Help me create」功能:用户用自然语言描述需求,Gemini 会从 Gmail、Drive 和 Google Chat 中提取相关信息,自动生成格式完整的初稿。考虑到超过三分之一的新文档是通过复制已有文件创建的,谷歌还新增了「Match doc format」(复制参考文档的版式)和「Match writing style」(统一多人协作文档的语气风格)两个编辑功能。Sheets 的升级幅度最大:Gemini 可以从自然语言描述直接生成包含公式和格式的完整电子表格,谷歌称复杂表格的生成速度较此前提升 9 倍。Slides 新增 AI 布局生成,用户描述内容后 Gemini 会自动生成符合品牌风格的幻灯片。Drive 则在搜索结果顶部新增 AI 摘要功能,直接给出答案而无需翻找文件夹。

[原文链接]

据 1M AI News 监测,斯坦福大学教授 Percy Liang 和 Simile AI CEO Joon Sung Park 发表博文,提出 AI 正在进入「模拟时代」。Percy Liang 认为,AI 迄今最令人印象深刻的成就都发生在环境和奖励函数明确的场景中(如围棋、IMO 数学竞赛、从零写出完整应用),RL 算法可以在沙盒中安全地尝试不同操作并观察结果。但现实世界中涉及人的问题(远程办公如何影响组织文化?如何为数百万学生重新设计三年级数学课程?)奖励模糊、风险高、无法直接实验,这恰恰是 AI 下一个最大的机会所在。

博文将 AI 的演进划分为三个阶段:预测时代(训练通用模型对文本和图像做高精度分类)、推理时代(让模型解决数学和编程等复杂多步问题)、模拟时代(理解人类和环境到足以推演任意「如果…会怎样」场景的程度)。Percy Liang 认为,模拟本质上是因果模型,不仅能预测未来,还能评估干预效果和回答反事实问题,「预测模型能生成最优行动但无法解释原因,推理模型能讲故事但不一定扎根于现实,模拟则为世界上最复杂的问题提供完整可审计的推演轨迹」,并称这是「通向稳健超级智能的真正路径」。

Joon Sung Park 是 2023 年轰动学界的「斯坦福小镇」(Generative Agents)论文第一作者(让 25 个 AI 居民在虚拟小镇自主生活、产生涌现行为的经典实验)。两人共同创办的 Simile AI 于上月完成 1 亿美元 A 轮融资,Index Ventures 领投,李飞飞和 Andrej Karpathy 参投,目标是将模拟从数千个 Agent 扩展到数百万乃至全球 80 亿人口规模。

[原文链接]
查看更多
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成