据 1M AI News 监测,AI 数据公司 Markov 在 Hugging Face 上开源了 computer-use-large 数据集,包含 48,478 个屏幕录制视频,总时长约 12,300 小时,CC-BY-4.0 许可。该数据集覆盖 6 类专业软件:Blender(3,624h)、Salesforce(2,336h)、AutoCAD(2,149h)、Photoshop(2,060h)、Excel(2,002h)和 VS Code(127h)。所有视频均经过裁剪,去除了片头片尾、人脸画面和转场,音频已剥离,只保留纯粹的屏幕操作录制。
该数据集面向 computer use agent 的训练和评估,即那些能像人类一样通过点击、输入、滚动等 GUI 操作来控制桌面软件的 AI 模型。Markov 创始人 Dev Mandal 称数据来源于互联网上的专业软件教程和操作录屏。Markov 定位为 computer use AI 领域的数据基础设施公司,此前曾开源过一个规模较小的版本。