此外,微软为了便利工程师们快速尝试分歧的智能体设置,还开源了OmniTool,它是一个集成了屏幕理解、定位、动做规划取施行等功能的Docker化Windows系统。这不只为研究人员供给了强大的东西,也意味着将来将更多立异集中正在AI智能体的开辟上,让我们拭目以待也许会正在不久的未来看到一个昂首阔步、飞速高效的AI帮手。
按照微软的最新数据,V2版本锻炼了更大规模的交互元素检测数据取图标功能题目数据,精确率大幅提拔,推理速度也变得更快,延迟削减了整整60%。正在高分辩率Agent基准测试ScreenSpotPro中,搭载V2的GPT-4o的精确率高达39。6%,远超GPT-4o原始版本的0。8%。这是一次划时代的飞跃,实的能够说是对计较机操做智能化的又一严沉冲破!
自从V1问世以来,这一次搭载的GPT-4V则更是为其付与了奇异的力量。OmniParser V2。0 连系了OpenAI的多种模子,如4o/o1/o3-mini、DeepSeek(R1)、让这些智能体不再是夸夸其谈,而是能够实正操控你的电脑。
正在科技的不竭前进中,微软再次引领潮水。2月17日,跟着OmniParser V2。0的发布,计较机操做的将来仿佛被一只无形的手悄悄拨动。这一全新的AI东西,基于视觉的GUI解析手艺,可以或许精准识别屏幕上的可交互图标,取之前的版本比拟,现在的OmniParser V2简曲令人面前一亮。
建湖大红鹰娱乐科技有限公司
2025-04-14 18:37
0515-68783888
免费服务热线
扫码进入手机站 |
网站地图 | | XML | © 2022 Copyright 江苏大红鹰娱乐机械有限公司 All rights reserved.