圖片來源google官網(wǎng)
8月14日,谷歌在其硬件大會上發(fā)布了旗下第一款真正意義上的AI Phone——Pixel 9系列新品。這顛覆了谷歌在硬件發(fā)布方面的一項慣例,即Pixel系列智能手機歷來都是在下半年發(fā)布。然而,此次谷歌卻選擇提前行動,搶在了新款iPhone發(fā)布之前。
“談到人工智能,已經(jīng)有太多的承諾,太多的即將推出的功能,但在現(xiàn)實世界中卻沒有足夠的幫助,這就是為什么今天我們要實事求是。”谷歌設(shè)備和服務(wù)高級副總裁里克·奧斯特洛 (Rick Osterloh) 表示。
從新發(fā)布的Pixel 9 系列來看,此次谷歌主要進行了軟件方面的升級,核心就是將AI融入進來,構(gòu)建新的手機功能。但這些功能并沒有超出市場的預(yù)期,大多都是蘋果和其他手機廠商已經(jīng)公開的方向,只不過谷歌提前了一步。
AI Phone,是智能手機陷入創(chuàng)新瓶頸之后的一個新物種。現(xiàn)在,這個新物種正陷入到另一種雷同的平庸之中。
也許是從蘋果那里得到的啟發(fā),谷歌在新的Pixel 9 系列上,也在試圖進行手機助手的AI改造。
谷歌最新的進展是,通過Gemini訪問手機屏幕,來實現(xiàn)更個性化的功能。比如,用戶召喚Gemini后,可以點擊“詢問此屏幕”或“詢問此視頻”,讓模型指向你正在查看的內(nèi)容,從而給出上下文回復(fù)。谷歌表示,這意味著Gemini可以執(zhí)行一些操作,例如將YouTube旅游視頻中的餐廳列表添加到谷歌地圖中。
同時,谷歌正在推出自己的ChatGPT語音聊天版本,名為Gemini Live。其表示,該功能可實現(xiàn)自然對話,因此用戶可以在Gemini中途打斷或暫停對話,稍后再繼續(xù)。谷歌表示,即使屏幕鎖定,Gemini Live也可以使用。不過,該功能僅適用于Gemini Advanced訂閱者。
此外,谷歌還稱得益于Gemini 1.5 Flash等新模型,Gemini作為語音助手的速度將更快,并且不會像以前的助手版本那樣經(jīng)常出錯。谷歌還為Gemini添加了更多擴展,因此它將能夠從Keep、Tasks、Utilities和Google日歷等應(yīng)用程序中提取信息或在應(yīng)用程序內(nèi)執(zhí)行操作。
需要注意的是,以上這些都不是任何意義上新的發(fā)明,而是一些乏味的重復(fù)。
在WWDC上,蘋果首次推出了Apple Intelligence,核心之一就是Siri的改造。按照蘋果的說法,蘋果正計劃用生成式AI技術(shù)徹底改造Siri虛擬助手,新系統(tǒng)將首次允許Siri控制應(yīng)用程序內(nèi)的所有功能。Siri的這一變化,需要使用大語言模型進行iOS的系統(tǒng)底層改造,OpenAI則會幫助蘋果實現(xiàn)這一切。
圖片來源蘋果官網(wǎng)
比如,新系統(tǒng)將允許Siri更精確地控制iPhone或iPad,包括利用Siri能夠打開單個文檔、將筆記移動到另一個文件夾、發(fā)送或刪除電子郵件、打開Apple News中的特定出版物、通過電子郵件發(fā)送網(wǎng)絡(luò)鏈接,以及要求設(shè)備提供文章摘要。
無獨有偶,華為也計劃在原生的鴻蒙系統(tǒng)里干同樣的事情。
華為試圖將AI大模型的能力植入鴻蒙系統(tǒng)底層,以此來同時調(diào)用多個APP的功能,讓終端設(shè)備可以完成復(fù)雜度更高的人機交互方式。不同的是,鴻蒙所使用的AI大模型為華為自研,而蘋果則選擇與OpenAI這樣的第三方公司合作。
利用華為自研的盤古大模型,華為手機的語音助手“小藝”,可以化身為一個AI agent,幫助用戶自動調(diào)取日歷信息、輸入法、通訊錄、文件,并生成文本并發(fā)送短信或是郵件。在第三方APP中,小藝可以識別位置信息、圖片,自動導(dǎo)航或是購物。當然,前提是這些APP同意AI調(diào)用這些信息。
除了對于手機助手的改造,谷歌此次還披露更多新的個性化AI功能,但依然還是重復(fù)著已有的技術(shù)路線。
谷歌新推出的Pixel截圖功能,這是一個集截圖管理、智能分析和自然語言搜索于一體的應(yīng)用。 基于該功能,手機可以保存整理截圖中的重要信息,將其轉(zhuǎn)變?yōu)橐粋€更便于搜索的數(shù)據(jù)庫。用戶查找之前的截圖信息時,可以變得更容易。谷歌表示,這是Pixel設(shè)備獨有的。
但是,這并不是Pixel獨創(chuàng)的。早在今年5月,微軟就宣布為Windows 11推出回顧功能 (Recall),該功能可以記憶用戶打開過的各種窗口或文件,然后在必要的時候可以快速回到當時使用的時刻。
在具體的操作過程中,當用戶啟用該功能后,電腦每隔幾秒會對屏幕內(nèi)容進行截圖,截取的內(nèi)容將通過加密保存在設(shè)備本地,接下來這些數(shù)據(jù)將交給AI在本地完成分析。之后,用戶可以通過時間軸瀏覽最近的各種活動,例如查看過的網(wǎng)頁等,而AI則會在本地完成分析,用戶可以搜索特定關(guān)鍵詞回到某個時刻。
回顧功能還允許用戶直接打開當時保存的原始截圖,后續(xù)該功能被完善后,它還可以以屏幕截圖的形式打開實際的源文檔、網(wǎng)站或電子郵件等。
此外,谷歌還在添加一項叫作Circle的AI功能。當用戶使用該功能時,可以分享圖片或屏幕的部分內(nèi)容。比如,用戶可以圈出圖片的文字信息,按住分享按鈕通過發(fā)送文本信息。
巧合的是,類似的功能此前榮耀已經(jīng)推出過。在榮耀手機的任意門功能中,用戶通過長按所在界面的文字、圖片、文件、視頻等元素,將其拖至左右兩側(cè)屏幕邊緣處,即可觸發(fā)“任意門”功能,快速流轉(zhuǎn)至其他應(yīng)用服務(wù)。更早之前,類似的交互邏輯也在錘子手機的“onestep”功能上出現(xiàn)。
總的來看,將“AI Phone“視為智能手機重新崛起新機會的手機廠商們,至今還未推出一款真正意義上的新產(chǎn)品。在AI Phone的起跑線上,手機廠商推出的新功能,大多都是沿著類似的技術(shù)路線和交互邏輯而展開。(本文首發(fā)于鈦媒體APP,作者 | 饒翔宇 編輯 | 鐘毅)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論