UFO²

UFO²

UFO³ 是微软开源的多设备编排框架,用于跨平台智能自动化。包含 Galaxy(多设备编排)和 UFO²(Windows 桌面 AgentOS)两大核心组件。

M
Microsoft(微软) 美国
模型等级 A-Tier
访问官网

【产品概述】

UFO³ 是微软官方开源的智能自动化跨设备编排框架,被誉为”编织数字代理银河”。该产品包含 UFO²(桌面代理操作系统)和 Galaxy(多设备编排框架)两大互补组件。其核心定位是解决异构设备间复杂工作流的自动化协同问题,支持 Windows、Linux、macOS、Android 及 Web 端的统一调度。核心价值主张在于通过统一的代理交互协议(AIP),将单一设备的自动化能力扩展为多设备协作生态,实现任务分解、并行执行与实时监控。它显著降低了跨平台自动化的门槛,使开发者能够构建可扩展的通用跨设备代理,大幅提升企业级自动化任务的效率与覆盖范围,从单一 Agent 进化为数字银河。

【核心功能】

  1. Galaxy 多设备编排:基于 DAG 的任务星座规划,支持跨设备依赖跟踪、并行执行优化及数据流管理。
  2. UFO² 桌面自动化:深度集成 Windows UIA/WinCOM,支持混合 GUI 点击与 API 调用,实现稳健的本地操作。
  3. 智能设备分配:基于能力匹配、资源监控及性能历史的动态设备选择,自动将任务分配至最优设备。
  4. 知识基底(Knowledge Substrate):结合 RAG 技术,利用帮助文档、演示和执行痕迹增强代理的学习与适应能力。
  5. 推测性多动作执行:通过批量预测动作,减少 51% 的 LLM 调用次数,显著提升任务执行效率。

【应用场景】

  1. 跨平台数据流水线:适用于数据分析师,实现从 Windows Excel 提取数据,在 Linux 处理,最后在 Mac 可视化的全流程自动化。
  2. 办公自动化:适用于企业职员,自动生成 Excel/Word/PPT 报告,处理文件管理及系统配置任务。
  3. 分布式测试与监控:适用于开发运维人员,在多设备上运行测试、部署应用或聚合日志,实现高效的质量保障。

【技术特点】

技术架构采用分层设计,涵盖状态层、策略层和命令层,支持异构、异步且安全的编排。核心差异化特点在于声明式分解为动态有向无环图(DAG),支持任务星座的实时演化与重写,确保执行的正确性。系统基于 WebSocket 构建 Agent Interaction Protocol (AIP),提供安全协调层,具备容错与自动重连能力。同时集成 Model Context Protocol (MCP) 赋能设备代理,支持 OpenAI、Azure、Qwen 等多种大模型接入。UFO² 采用混合控制检测(视觉+UIA)确保鲁棒性,并通过推测性多动作预测减少 51% 的 LLM 调用,结合 RAG 知识基底增强代理的学习与适应能力,实现了正式验证的正确性与高效执行。

【定价信息】

UFO³ 为开源框架项目,采用 MIT License 开源许可证。文档中未提及商业软件定价方案,用户可免费获取源代码并进行部署使用。用户仅需自行承担在使用过程中调用的第三方大模型 API 费用(如 OpenAI、Azure OpenAI、Qwen 等)以及运行设备的基础硬件成本。项目提供长期支持(LTS)版本与活跃开发版本供不同需求的用户选择。

【公司信息】

该产品由 微软(Microsoft) 开发并维护,属于微软旗下的开源框架项目。根据文档提供的演进时间线,初代 UFO 于 2024 年 2 月发布,UFO² 于 2025 年 4 月推出,最新的 UFO³ Galaxy 于 2025 年 11 月发布。作为科技巨头的开源项目,其背后依托微软深厚的技术积累与研究院支持,旨在推动智能自动化生态的标准化发展。项目采用 MIT 许可证,鼓励社区贡献。由于是公司内部孵化的开源项目,暂无独立的外部融资情况披露,主要通过 GitHub 社区与开发者互动,提供长期支持(LTS)与活跃开发并行的版本策略。

Agent UID: 20082000