近来,明略科技正式开源自研 GUI 感知智能体模型 Mano-P 1.0。Mano-P 具有 GUI 感知、了解、规划、操作与验证才能,可经过纯视觉方法直接了解并控制桌面软件、网页界面及更杂乱的图形化作业流,并支撑在 Apple M4 芯片设备上本地运转。
Mano-P 让 AI 打破了“只看不做”的约束,能够直接在实在的图形界面中跨渠道履行杂乱使命。该项目以 Apache 2.0 协议开源,完好代码揭露可审计,支撑商业运用与二次开发。
经过供给纯视觉了解与本地履行才能,Mano-P 赋能个人开发者与企业安排能够以低本钱构建专属的个性化 AI,在保证数据主权的前提下,正式迈入“私有化”的个人 AI 年代。
在现有技能架构下,自动化操作往往受限于底层 API 接口调用、CDP 协议或网页 HTML 解析,一旦面临非标准运用或跨体系协作时便显得无能为力。Mano-P 以纯视觉了解为中心技能范式 ,不依赖外部接口与协议,能够直接了解并控制桌面软件、3D 运用及杂乱的专业东西,从根本上打破了传统根据浏览器的生态鸿沟 。
一起,Mano-P 可为现有 Agent 生态供给要害的履行才能底座。现在,Mano-P 可经过 skill 方式无缝接入OpenClaw 等 AI Agent。强强联合下,Agent 能够无缝络绎于多窗口体系和跨运用的作业流中,顺滑地履行点击、文本输入、窗口切换及视觉验证等闭环动作。
这一打破处理了长时间困扰 Agent 作业流的人工干预瓶颈,使模型不只能担任全自动运用的构建测验,更能向杂乱的商业场景延伸,完结杂乱使命的全程自主履行。
为保证前沿技能在端侧设备的普惠可用,Mano-P 采用了双版别交给架构:由 72B 完好模型探究并证明技能上限,一起供给 4B 量化模型(w4a16)以满意极致的端侧布置需求 。
Mano-P 1.0 以 72B 参数量的完好模型版别,在全球多模态范畴的 13 个威望基准测验榜单中,完结了针对小尺度模型的屠榜式 SOTA 抢先 。其才能矩阵全方面掩盖了 GUI Grounding、CUA(计算机运用署理)、多模态感知认知、视频了解以及长上下文学习等要害维度,确立了端侧 GUI Agent 的功能标杆 。
杰出的功能离不开底层的技能创新。Mano-P 引入了 SFT(监督微调)、离线强化学习与在线强化学习的三阶段渐进式练习架构,并合作专有的 GSPruning 视觉 Token 剪枝技能,完结了端侧推理功率的腾跃。
在装备 Apple M4 Pro 芯片的设备上,4B 量化模型可完结高达 476 tokens/s 的预填充速度与 76 tokens/s 的解码速度,峰值内存占用仅为 4.3GB,完美适配干流边际设备的算力与存储约束。
跟着 AI 深化中心事务流,数据隐私与合规性成为企业决议计划的中心考量。Mano-P 可进行本地端侧布置,数据零上云 ,经过“纯视觉了解 + 本地履行”的架构,能够在必定程度上完结数据处理与外部网络的物理阻隔。
在本地形式下,模型可直接在 Mac mini / MacBook(M4 芯片及以上,32GB+ 内存)上运转,或运用 Mano-P 算力棒衔接(经过 USB 4.0)。体系的屏幕截图、事务流通数据及使命指令均在本地闭环,从源头上杜绝了面向云端服务器的传输危险 。
一起,Mano-P 具有强壮的离线长使命自主规划才能。在无网环境下,Mano-P相同能自主推动杂乱事务流程,并完结过程中的决议计划与纠错。这一特性不只重塑了人机交互的信赖鸿沟,更使得端侧 AI 能够真实进入高安全性、高隐私要求的企业级出产环境 。
技能的价值在于广泛的运用与生态的共建。Mano-P 遵从 Apache 2.0 协议正式开源,完好客户端代码全面揭露并支撑严厉审计,答应商业化运用与二次开发 。
为下降企业与个人用户的接入本钱,Mano-P 规划了三种开箱即用的运用形状,精准掩盖不同技能栈的用户集体。无需繁琐装备杂乱的 API 密钥,用户均能以极低门槛构建专属的高功能 GUI 智能体。
依照既定开源规划,明略科技本次首先开源 Mano-CUA 中心技能,用户可将其快捷装备到 OpenClaw 或 Claude Code 中,以构建更智能的 CUA 使命作业流程,并战胜人工干预带来的瓶颈。
Mano-CUA 本地模型和 SDK 组件估计将于月内正式开源,以满意具有高安全性开发者的需求。到时用户可直接调用本地化布置的 GUI-VLA 模型来构建自定义技能与东西,一切 CUA 操作都将在本地 Mac 设备上履行,而不会上传到外部服务器。
未来,明略科技还将全面开源 Mano-P 模型底层的练习方法、Token 剪枝技能与混合精度量化计划,助力开发者打造契合本身事务需求的专属本地 GUI-VLA 模型。
面向未来,从技能破局到生态共建,Mano-P 将 GUI 感知、视觉操作、本地运转与开源生态紧密结合,不只为端侧智能体夯实了坚实的技能底座,更为“Personalized AI”铺就了一条明晰的实际途径。无论是独立开发者,仍是对安全要求苛刻的企业安排,都能以更低的门槛、更高的可控性,打造个性化 AI。明略科技正以敞开之姿,让“人人能够发明专属AI ”的愿景逐步照进实际。
,米兰体育官网是真的吗

首页
产品中心
发送消息
一键拨打