The Information引述知情人士報導,Google正開發一項人工智慧(AI)技術,能接管瀏覽器,替使用者完成在網頁上執行的日常任務,如購物、訂機票,預計最早將於12月公開展示。
知情人士說,Google發表這項代號「Jarvis計畫」(Project Jarvis)的電腦操作代理人(CUA)的同時,也將推出其旗艦大型語言模型Gemini的新一代版本,協助支援前者。
以電影《鋼鐵人》主角的AI助理命名的Jarvis,回應指令的方式是:頻繁擷取並解讀使用者螢幕畫面,再執行諸如點選按鍵或在指定區域輸入文字等動作。
AI開發商將「AI代理人」系統定位為該產業發展的下一步,微軟、Salesforce和Workday等業者正加速開發相關產品,但目前多為實驗性質。Google最初將開放Jarvis給少數人測試,藉此發現並修正產品缺失。Google之後也將須說服用戶,其AI代理人能安全處理個資。
Google和上周公布類似產品的Anthropic,均試圖推進代理人的概念,開發能與個人電腦(PC)或瀏覽器直接互動的軟體。OpenAI今年多數時間,也已著手開發相似的軟體。