谷歌计划推出人工智能浏览器助手“Jarvis”来自动执行浏览任务

据报道谷歌正在开发一款名为“Project Jarvis”的人工智能系统,该系统可以独立控制Chrome并执行常见的网络任务。

人工智能助手将能够处理日常任务,如搜索网页、购物和预订航班,而无需用户干预。据三位熟悉该项目的人士称,Project Jarvis 的工作原理是定期截取浏览器窗口的屏幕截图,对其进行分析,然后执行单击或输入文本等操作,The Information报道。

虽然与Anthropic 最近推出的计算机自动化系统类似,但谷歌的方法不同,它只专注于 Chrome 浏览器控制,而不是更广泛的程序访问。该公司的目标是普通消费者,而不是开发人员和办公室职员。

QQ截图20241028090252_调整大小

然而,该系统仍面临一些限制。有消息称,人工智能在每次行动前需要几秒钟“思考”,因此速度相对较慢。谷歌还需要解决用户对与系统共享密码和信用卡信息等敏感数据的担忧。

谷歌计划于今年 12 月发布该系统及其新的 Gemini 语言模型,但这一计划尚未确定。

随着语言模型达到极限,人工智能公司转移焦点

12 月的时间表与The Verge 早些时候关于谷歌计划推出其 Gemini 语言模型的报道相吻合。然而,该报道指出,Gemini 可能不会比现有的人工智能系统带来重大的性能提升。

这或许就是为什么 AI 公司越来越关注实际应用的原因,因为尽管效率不断提高,但原始语言模型能力似乎已达到瓶颈。因此,他们正在寻找新方法,让 AI 系统更加实用。

“Jarvis”这个名字早些时候在讨论谷歌的人工智能战略时出现过。前谷歌用户体验战略师斯科特·詹森 (Scott Jenson)在今年 5 月批评了该公司,称该公司旨在打造一款类似 Jarvis 的助手,以便将用户留在谷歌的生态系统中,其动机是担心竞争对手可能会先这么做。

相关内容