圖片由Soul官方提供
社交平臺Soul App在出海方向上有了新的進展。他們將最新自研的3D虛擬人多模態(tài)AI交互體驗首次落地10月14日-18日舉辦的迪拜GITEX GLOBAL海灣信息技術(shù)博覽會上。
這也是Soul自2016年上線以來,首次亮相國際大型展會。在大會現(xiàn)場,參與體驗的用戶可以實現(xiàn)高相似度的3D虛擬人的AI建模,通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù),于幾秒鐘內(nèi),快速在3D世界精細化還原真實人臉的特征 ,打造專屬的虛擬化身。
據(jù)Soul App CTO 陶明對鈦媒體APP介紹,該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性,實現(xiàn)更接近人類模式的互動體驗。
“目前可以看到的是,海外市場對AIGC+社交的接受度非常高。”陶明對鈦媒體APP表示。
從具體的數(shù)據(jù)增長情況來看,根據(jù)第三方數(shù)據(jù)公司data.ai,美國等海外市場的社交應(yīng)用榜單TOP30上,已經(jīng)頻繁出現(xiàn)了如Pengu、Linky AI等AI社交類型的產(chǎn)品。
比如說Character.AI,盡管已經(jīng)被Google以25億美元收購,但在全球收獲超過2億用戶后,Character.AI也通過2023上線后的瘋狂增長速度,證明了海外用戶對AIGC+社交產(chǎn)品的歡迎與認可。
不過,陶明也發(fā)現(xiàn),目前在海外還沒有見到特別亮眼的“AIGC+社交”的相關(guān)產(chǎn)品。
這背后主要的原因是,海外市場的重點其實還是聚焦在技術(shù)能力的突破上,而技術(shù)突破和應(yīng)用層落地之間,有比較大的割裂,或者說,海外并不著急把技術(shù)盡快落地。
而國內(nèi)目前的情況是,在技術(shù)上很多公司與海外巨頭相比,存在一定的差距,但優(yōu)勢在于場景和應(yīng)用的快速落地。這是國內(nèi)在移動互聯(lián)網(wǎng)、數(shù)字經(jīng)濟時代就有的鮮明特征。
所以,他認為,在“AIGC+社交”方向,國內(nèi)的應(yīng)用落地探索反而會是更快速和積極的。
“在推進AIGC+社交業(yè)務(wù)落地的過程中,我們采取的是‘模應(yīng)一體’思路,大模型是Soul解決用戶社交需求的方案之一,不是最終目的。”陶明說。
2016年,Soul在上線時,一個基本的思路是,希望能夠在線上創(chuàng)造一個新的世界,它與現(xiàn)實世界可以不一樣,是真實存在的另一個平行世界,但更有歸屬感。
所以,當時Soul沒有采用彼時社交產(chǎn)品流行的導(dǎo)入通訊錄現(xiàn)實關(guān)系,或者LBS的模式,而是采用了AI的解決方案,即,用基于AI算法的靈犀引擎,主要是通過對用戶在站內(nèi)多元場景下的行為數(shù)據(jù)分析,為用戶推薦有可能結(jié)成深度社交關(guān)系的人,以去中心化的機制分發(fā)關(guān)系和內(nèi)容。
這是Soul用AI對社交關(guān)系中“發(fā)現(xiàn)”環(huán)節(jié)的變革,也讓Soul在用戶層面形成了非常差異化的認知,在上線后,以很快地速度獲得了市場的使用和認可。
截至2022年,Soul的月活用戶近3000萬,其中,Z世代用戶占比超過78%;平臺月活躍15天以上的用戶占比63.7%;人均用戶日均使用時長為46.4分鐘,日均私人信息數(shù)為66.9條。
靈犀引擎的推出和受認可,讓Soul堅定了對AI的投入,后續(xù),Soul還陸續(xù)推出了集成AI的NAWA引擎,以及AI茍蛋等相關(guān)應(yīng)用。
從目前推出的一系列新功能的用戶反饋來看,AI的應(yīng)用讓Soul的用戶對話輪數(shù)、次留、用戶時長等關(guān)鍵數(shù)據(jù)都有不錯的表現(xiàn),并且在持續(xù)增長中。
陶明舉例說,用戶平均每天會給AI茍蛋發(fā)送超過70條消息,互動平均時長超過30分鐘。而在輔助對話方面,在AI的參與下,陌生關(guān)系的對話框回復(fù)率提高了接近十個百分點。
整體來看,陶明認為,AI對Soul的用戶產(chǎn)生了可持續(xù)的價值,同時也在Soul整體的用戶時長、粘性、用戶體驗等方面都有積極、正向的助力,“這對我們來說就是難以衡量的收益”。
但AI在社交領(lǐng)域現(xiàn)有的應(yīng)用落地實踐,距離實現(xiàn)行業(yè)徹底的變革還有一定差距,陶明認為,這其中主要的挑戰(zhàn)還在于技術(shù)側(cè)。
以Soul關(guān)注的情感關(guān)懷這個方向為例,他認為,讓AI理解社交、理解情感和情緒這件事情,這其實也是當下AGI的難題。比如說,面對“我感冒了”的信息,在不同的場景中,回答“多喝熱水”可能并不是讓用戶滿意的答案。
另一方面在于應(yīng)用層,如何理解用戶核心的社交需求,將前沿的技術(shù)能力轉(zhuǎn)化為用戶需要的產(chǎn)品功能。
諸多難點之下,可以看到的是,AI對話類的產(chǎn)品正經(jīng)歷新一輪的洗牌,相關(guān)產(chǎn)品正在批量式關(guān)停。
很大程度上,這是因為得益于ChatGPT橫空出世,以及對話模型的開源,很多AI聊天APP,背后直接使用了開源模型,于是,市場上AI社交應(yīng)用批量涌現(xiàn),但問題也隨之而來:同質(zhì)化情況嚴重,人機交互體驗、情緒價值反饋沒有顯著的改善,導(dǎo)致用戶留存差,也無法實現(xiàn)有效的商業(yè)化。
而Soul在快速落地“AIGC+社交”的實踐中發(fā)現(xiàn),很多方向也在逐一被證偽。比如說,做“AI茍蛋”的時候,團隊希望它能說會唱、能識圖、有形象。他們原本也以為,把很多資源投入到每個點上,每個點都做得最好,一定能實現(xiàn)不錯的用戶反饋,但最終發(fā)現(xiàn)資源用了很多,效果并不明顯。
“能說會唱只是一種增益,對話能力,即聊天的情感化再加上語境里的場景構(gòu)建是最重要的。在不同場景,一個人用同樣一句語料所表達的情感不一樣,大模型產(chǎn)品在這里的改進空間還很大。我們的經(jīng)驗總結(jié)是,要先把基礎(chǔ)分做好,然后再優(yōu)化增益項。”陶明對鈦媒體APP說。
在市面上眾多AI人機交互產(chǎn)品之中,要做出差異化的關(guān)鍵在于“大模型的情感能力”。 而陶明認為,人機交互的本質(zhì),是讓AI與人社交。社交的本質(zhì)是情感的流動,只有能夠?qū)崿F(xiàn)情感的識別,才能讓AI更好地理解人性、情緒和情感,實現(xiàn)理想的人機互動。
這需要大模型多模態(tài)的、具備擬人化屬性,確保實現(xiàn)情感化、個性化和生活化。也就是說,情感識別是Soul一直在持續(xù)投入攻克的難點。
下一階段,具備情感能力的大模型或許將會是“AIGC+社交”行業(yè)競爭的新焦點,同時,在“AIGC+社交”方向的探索過程中,產(chǎn)品形態(tài)不會僅局限于對話場景。
AI Agent是承載AI社交服務(wù)的重要載體,也是完成人機互動體驗的重要組成。從更大視角來看,當人們習(xí)慣于與AI Agent對話、互動,AI Agent便成為人們接觸數(shù)字世界和數(shù)字服務(wù)的入口,這將進一步打開“AI+社交”賽道的發(fā)展空間。
陶明更看好的是,多模態(tài)端到端大模型的應(yīng)用,特別是在情感能力突破、多模態(tài)互動和端到端能力方向。
情感能力突破指向的是AI更能理解、反饋人類,多模態(tài)互動則更接近真實、自然的真人日?;幽J?,端到端則意味著,為用戶服務(wù)的底層方案的創(chuàng)新和真正意義上“在場感”的實現(xiàn)。
“這都是顛覆社交體驗的關(guān)鍵。”陶明說,快的話,預(yù)計在今年年底,Soul多模態(tài)端到端大模型將再次升級,推出全雙工視頻通話能力,讓用戶可以便捷、自然地體驗到包括文字、語音、視覺在內(nèi)的多模態(tài)創(chuàng)新交互。(本文首發(fā)于鈦媒體APP,作者|李程程,編輯|胡潤峰)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論