江苏大红鹰娱乐机械有限公司
您当前的位置 : 大红鹰娱乐 > 机械自动化 >


微软OmniParser V20发布:将AI变身为高效的电脑操控

2025-04-14 18:37

  此外,微软为了便利工程师们快速尝试分歧的智能体设置,还开源了OmniTool,它是一个集成了屏幕理解、定位、动做规划取施行等功能的Docker化Windows系统。这不只为研究人员供给了强大的东西,也意味着将来将更多立异集中正在AI智能体的开辟上,让我们拭目以待也许会正在不久的未来看到一个昂首阔步、飞速高效的AI帮手。

  按照微软的最新数据,V2版本锻炼了更大规模的交互元素检测数据取图标功能题目数据,精确率大幅提拔,推理速度也变得更快,延迟削减了整整60%。正在高分辩率Agent基准测试ScreenSpotPro中,搭载V2的GPT-4o的精确率高达39。6%,远超GPT-4o原始版本的0。8%。这是一次划时代的飞跃,实的能够说是对计较机操做智能化的又一严沉冲破!

  自从V1问世以来,这一次搭载的GPT-4V则更是为其付与了奇异的力量。OmniParser V2。0 连系了OpenAI的多种模子,如4o/o1/o3-mini、DeepSeek(R1)、让这些智能体不再是夸夸其谈,而是能够实正操控你的电脑。

  正在科技的不竭前进中,微软再次引领潮水。2月17日,跟着OmniParser V2。0的发布,计较机操做的将来仿佛被一只无形的手悄悄拨动。这一全新的AI东西,基于视觉的GUI解析手艺,可以或许精准识别屏幕上的可交互图标,取之前的版本比拟,现在的OmniParser V2简曲令人面前一亮。




建湖大红鹰娱乐科技有限公司

2025-04-14 18:37


标签

本文网址:

近期浏览:本新闻您曾浏览过!

相关产品

相关新闻



0515-68783888

免费服务热线


扫码进入手机站


网站地图 |  | XML |       © 2022 Copyright 江苏大红鹰娱乐机械有限公司 All rights reserved.  d25f324a-5149-4fe5-b916-0dbe332c8bd0.png

  • 网站首页
  • 咨询电话
  • 返回顶部