谷歌Gemini2.0大模型加持,AI“贾维斯”如何接管人类电脑?
创始人
2024-10-29 19:03:08
0

在科技飞速发展的今天,人工智能正以前所未有的速度改变着我们的生活和工作方式。其中,AI自主操控电脑成为了科技大厂们重点发力的战场,谷歌版“贾维斯”的即将问世,更是引发了广泛的关注。

Anthropic的Claude 3.5已经展示了自主看屏幕操作光标完成复杂任务的能力,而谷歌正在开发的Project Jarvis更是备受期待。这个由未来版Gemini 2.0驱动的项目,预计在12月亮相。它本质上是一个大动作模型,专门针对谷歌Chrome浏览器进行了优化。其操作原理与 Claude 3.5类似,通过截屏、解析屏幕内容,然后自动点击按钮或输入文本,从而帮助人们完成基于网页的日常任务,如收集研究信息、购物、预定航班等。不过,它在执行操作时中间会有几秒钟的思考时间,目前在终端设备中运行还不太现实,仍需在云上操作。

与此同时,微软团队也不甘示弱,悄悄放出了OmniParser。这是一个屏幕解析工具,可将截图转化为结构化数据,帮助AI精准理解用户意图。通过一系列的实验评估,如SeeAssign 任务、ScreenSpot评估、Mind2Web评估和AITW评估等,证明了OmniParser能够显著提高GPT-4V的性能,使其在处理各种任务时更加准确和高效。它不仅能准确识别用户界面中的可交互图标,还能理解屏幕截图中各种元素的语义,并将预期动作与屏幕上的相应区域关联起来。

OpenAI内部也有了AI智能体雏形,能够操控计算机完成在线订餐、自动查询解决编程难题等任务。包括苹果在内的科技巨头也在积极布局,预计在明年发布跨多个APP屏幕识别能力。

这些进展都表明,AI自主操控电脑的时代正在来临。然而,要实现像科幻作品中“贾维斯” 那样完美地接管人类电脑,还有很长的路要走。首先,模型需要具备强大的屏幕解析能力,这包括准确识别图标和理解语义等方面。其次,要解决在不同设备和平台上的兼容性问题,确保能够稳定运行。此外,还需要考虑数据安全和隐私保护等重要因素。

尽管面临诸多挑战,但科技的进步总是令人充满期待。谷歌Gemini 2.0加持的“贾维斯”以及其他厂商的相关研究成果,都为我们展示了未来人工智能的巨大潜力。也许在不久的将来,我们真的能够像钢铁侠一样,拥有一个智能的“贾维斯”来协助我们处理各种电脑任务,使我们的生活和工作变得更加便捷和高效。

相关内容

因为微软,OpenAI收购...
OpenAI收购AI编程助手Windsurf的谈判因微软知识产权担...
2025-07-12 13:14:23
美工课程视频讲解:零基础也...
你是不是也这样:收藏夹里塞满了各种“美工入门教程”、“PS速成课”...
2025-07-12 13:14:12
看了AI生成的ASMR吃播...
前段时间,一条用 AI 生成的切水果 ASMR 短视频,在洋抖上爆...
2025-07-12 13:13:44
上海AI实验室团队:如何优...
这项由上海AI实验室和复?dan大学联合开展的突破性研究发表于20...
2025-07-12 13:13:26
剖析市场突破的核心动力,开...
报告摘要 ●指数上行突破的核心驱动——中微观线索带来的新契机 为什...
2025-07-12 13:13:06
月之暗面Kimi K2发布...
月之暗面今天宣布,正式发布Kimi K2模型,并同步开源。Kimi...
2025-07-12 06:12:21

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...