谷歌Gemini2.0大模型加持,AI“贾维斯”如何接管人类电脑?
创始人
2024-10-29 19:03:08
0

在科技飞速发展的今天,人工智能正以前所未有的速度改变着我们的生活和工作方式。其中,AI自主操控电脑成为了科技大厂们重点发力的战场,谷歌版“贾维斯”的即将问世,更是引发了广泛的关注。

Anthropic的Claude 3.5已经展示了自主看屏幕操作光标完成复杂任务的能力,而谷歌正在开发的Project Jarvis更是备受期待。这个由未来版Gemini 2.0驱动的项目,预计在12月亮相。它本质上是一个大动作模型,专门针对谷歌Chrome浏览器进行了优化。其操作原理与 Claude 3.5类似,通过截屏、解析屏幕内容,然后自动点击按钮或输入文本,从而帮助人们完成基于网页的日常任务,如收集研究信息、购物、预定航班等。不过,它在执行操作时中间会有几秒钟的思考时间,目前在终端设备中运行还不太现实,仍需在云上操作。

与此同时,微软团队也不甘示弱,悄悄放出了OmniParser。这是一个屏幕解析工具,可将截图转化为结构化数据,帮助AI精准理解用户意图。通过一系列的实验评估,如SeeAssign 任务、ScreenSpot评估、Mind2Web评估和AITW评估等,证明了OmniParser能够显著提高GPT-4V的性能,使其在处理各种任务时更加准确和高效。它不仅能准确识别用户界面中的可交互图标,还能理解屏幕截图中各种元素的语义,并将预期动作与屏幕上的相应区域关联起来。

OpenAI内部也有了AI智能体雏形,能够操控计算机完成在线订餐、自动查询解决编程难题等任务。包括苹果在内的科技巨头也在积极布局,预计在明年发布跨多个APP屏幕识别能力。

这些进展都表明,AI自主操控电脑的时代正在来临。然而,要实现像科幻作品中“贾维斯” 那样完美地接管人类电脑,还有很长的路要走。首先,模型需要具备强大的屏幕解析能力,这包括准确识别图标和理解语义等方面。其次,要解决在不同设备和平台上的兼容性问题,确保能够稳定运行。此外,还需要考虑数据安全和隐私保护等重要因素。

尽管面临诸多挑战,但科技的进步总是令人充满期待。谷歌Gemini 2.0加持的“贾维斯”以及其他厂商的相关研究成果,都为我们展示了未来人工智能的巨大潜力。也许在不久的将来,我们真的能够像钢铁侠一样,拥有一个智能的“贾维斯”来协助我们处理各种电脑任务,使我们的生活和工作变得更加便捷和高效。

相关内容

消息称Meta下月启动首轮...
IT之家4月18日消息,北京时间今天(4月18日)凌晨,据路透社援...
2026-04-18 11:16:43
Google正式推出面向m...
谷歌近日正式发布了面向macOS平台的Gemini原生应用程序,用...
2026-04-18 11:13:16
Meta押注AI数字人 正...
来源:环球市场播报 Meta正在打造人工智能版马克・扎克伯格,可代...
2026-04-18 11:12:52
AI赋能千行百业一线观察|...
编者按:新华网“AI赋能千行百业一线观察”系列融合报道,走进产业一...
2026-04-13 21:54:36
从“全民养龙虾”到AI调用...
近期,一则数据引发全球科技界关注:根据OpenRouter最新数据...
2026-04-13 21:42:20
AI时代,让“鸡娃”回归育...
近日,“AI(人工智能)时代鸡娃还有意义吗”话题冲上热搜,引发家长...
2026-04-13 13:57:46

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...