DeepSeek R1意外沒有標記內容來源,但輸出的內容和百度、夸克差別不大,并未出現(xiàn)太多“幻覺”。

百度AI搜索的答案相對簡潔了不少,聚焦在了花粉、螨蟲等過敏源,然后梳理了對應的應對措施,和DeepSeek R1不相上下。

夸克的答案更為詳實,將防護建議進一步細化到了皮膚護理、呼吸道護理,以及飲食調整、藥物治療、中醫(yī)調理等建議,在內容的多樣性方面比百度和DeepSeek R1有進步。

微博智搜、知乎直答和“點點”,因為本身擁有大量的UGC內容,表現(xiàn)出了各自的特色:“點點”沒有太多增量信息,但排版上有著鮮明的小紅書風格,視覺上更加友好。

知乎直答的參考資料全部來自站內,也在某種程度上暴露了知乎在健康類內容上的短板。

微博智搜的答案是讓我們最驚訝的,原因是在搜索結果中給到了更多的增量信息,而且包含了權威媒體和專業(yè)健康類博主的原創(chuàng)視頻,幾乎可以直接作為預防手冊使用。

第二題:電腦的內存條是越多越好嗎

這是一個很多人選配電腦時都會糾結的事,看起來比較專業(yè),其實里面留了一個坑,用來測試不同AI搜索的用戶友好性。

單從準確性上看,六個產品沒有拉開明顯差距,均考慮到了不同的使用場景,兼容性和穩(wěn)定性,很多用戶選購內存條時可能陷入的誤區(qū)。比知識本身更重要的是,用戶在提問時想要的答案是什么呢?

百度和夸克不可避免地出現(xiàn)了搜索引擎的常見弊病,首先介紹通道配置、內存性能等專業(yè)知識,最后簡單提了下“根據實際場景選擇”。

猜測癥結主要在于數據源,百度和夸克的來源站點都以長篇的圖文介紹為主,不少內容來自內存品牌的官網,看似是從專業(yè)的角度切入,卻沒有顧及到“小白”群體的認知能力。

相比之下,DeepSeek R1、微博智搜、知乎直答和“點點”都將使用需求放在了最前面,偏向于內容博主講故事的風格,先讓用戶按需求對號入座,再結合專業(yè)的知識高速用戶這么選的原因。

圖:知乎直答第二題答案

圖:小紅書點點第二題答案

其中微博智搜和“點點”都在答案中引用了專業(yè)數碼博主的科普視頻。

不同的是,微博智搜在排版上將視頻作為了答案的一部分,契合了小白群體的需求,譬如可以直接點擊觀看視頻,通俗易懂地學習相關知識點。“點點”則將視頻放在最后,僅作為延伸了解。

第三題:含玻色因和視黃醇的護膚品能一起使用嗎?

前面兩個問題中,平臺的博主和UGC內容在很大程度上左右了輸出內容,于是我們找來了一個和美妝相關的問題。

結果和我們預料中的一樣。因為時尚美妝是內容營銷的“重災區(qū)”,AI搜索能否處理營銷味兒比較重的內容,給出一份客觀的答案呢?

鑒于DeepSeek R1從純技術角度進行了回答,將作為判定其他內容是否被營銷污染的“佐證”。

圖:百度AI搜索第三題答案

圖:夸克第三題答案

百度和夸克“終于扳回了一局”,盡管內容中出現(xiàn)了珀萊雅逆時光瓶、珀萊雅黑繃帶等扎眼的產品名,整體上依然比較客觀,自動過濾到了一些“軟植入”,且成分介紹、注意事項、使用建議等都相對準確。

“翻車”最嚴重的是“點點”,可以看到平臺想要規(guī)避營銷類內容的努力,來源中特意增加了有來醫(yī)生、百家號等外部內容,但“輔助方案”和引用的圖片,有著濃濃的營銷味兒。

同樣的問題,微博智搜優(yōu)先采用的是浙大一院主治醫(yī)生的視頻講解,對兩種成分的作用機制進行了通俗易懂的介紹,使用建議和注意事項中也提到了相關產品,但營銷味兒弱了很多。

至于知乎直答,在這個問題下直接“擺爛”了,原因大概與第一題一樣,和知乎的用戶構成和內容側重有關。

第四題:《王者榮耀》最新版本里最適合上分的打野英雄是誰?

如果說前面幾道題都有相對確切的答案,我們找了到比較主觀的題目,比如對《王者榮耀》里打野英雄的排序。

預料之中的,我們看到了六個不同版本的答案,不僅提到的英雄不同,同一英雄的排名也不同。為了盡可能客觀,我們仔細查看了思考過程和來源,看看哪個AI在“實事求是”,哪個AI在“弄虛作假”。

圖:DeepSeek R1第四題答案

圖:百度AI搜索第四題答案

圖:夸克第四題答案

有意思的是,DeepSeek R1、百度、夸克均采用了T0、T0.5、T1的分類方法,滿滿的專業(yè)評測范兒,只是英雄的排序全然不同。

在“思考過程”中可以看到,都注意了“網頁”的發(fā)布時間,并提出查看“過去三個月的內容”,答案里仍采用了大量2023年乃至2018年的內容,DeepSeek R1被網友詬病的“幻覺”問題,總算是“暴露”了。

微博智搜和“點點”主要參考的是2024年12月份以后的用戶內容,其中微博智搜“挖”出了二十多篇三天內的相關微博。我們認真查看了引用的每一條微博,發(fā)現(xiàn)微博智搜主要借鑒了多位金V博主的內容,并且在答案明確提及了英雄的特點和版本適配。

“點點”的回答同樣不乏可圈可點的地方,特別是避坑提醒和上分小技巧,多了幾分真實感,而非僅僅摘述科普文里的內容。

知乎直答遺憾地再一次“拉胯”了,猜測原因是同一個問題下有近期的回答,也有兩三年前的回答,知乎直答并未對舊內容進一步按時間過濾,導致答案和其他幾家出入最大。

第五題:平價的蜜雪冰城擁有塌房豁免權嗎?

既然“時間線”成了某些深度搜索的短板,不妨進一步測試下——能否準確回答或梳理過去一周內發(fā)生的焦點事件?

起因是315晚會對蜜雪冰城門店使用隔夜檸檬片的報道,在輿論端卻出現(xiàn)了反差,不同于對“滬上阿姨”的口誅筆伐,網友們再一次“寬恕”了蜜雪冰城,衍生出了“塌房豁免權”的說法,吸引不少自媒體進行解讀。

恰恰是這個問題的答案,讓我們對“深度搜索”有了更深刻的認知,絕非是一場同質化的競賽,而是內容差異化的較量。

圖:DeepSeek R1第五題答案

圖:夸克第五題答案

圖:百度AI搜索第五題答案

DeepSeek R1、夸克和百度主要參考的是新聞報道和自媒體文章,答案里的措辭有所不同,但有著相似的邏輯。同時也意味著,缺少UGC內容的情感和真實體驗,很難拉開實質性的差距。

微博智搜在回答中提到了消費平權、品牌形象的防御性建構和危機傳播的娛樂化消解,讓我們看到了更多的維度,也再一次印證了微博在中文輿論場里的“陣地優(yōu)勢”;

“點點”在回答中提到了情感綁架、自我PUA式消費等議題,本質上也是對平臺用戶價值觀的呈現(xiàn);

知乎直答的表現(xiàn)中規(guī)中矩,但提到了“消費降級”,同樣可以看到平臺內容上的差異化……普通用戶分享生活、觀點、經驗等真實感強的內容,才是深度搜索的魅力所在。

寫在最后

由于時間關系,我們只測試了5道問題。

單就推理速度而言,百度、夸克位于第一梯隊,無形中印證了百度和阿里的技術硬實力,點點和知乎直答處于第二梯隊,微博智搜的思考速度稍慢了一些,用時和DeepSeek R1不相上下。

對于搜索的結果,暫時無法對幾個深度搜索平臺的優(yōu)劣做出確定性的結論,但不乏一些值得關注洞察:

1、大模型的深度思考能力決定了體驗的下限,但內容決定了體驗的上限。

無論是百度、夸克,還是微博、小紅書、知乎,接入的都是DeepSeek R1滿血版,在底層的技術能力上實現(xiàn)了對齊,最大的差異其實在于各個平臺所擁有的內容資源。

比如微博以前的搜索體驗差強人意,直接原因就是基于關鍵詞的搜索技術,導致來自權威媒體、行業(yè)大V的優(yōu)質內容“沉沒”。接入DeepSeek R1后,原本零散、碎片化的優(yōu)質信息,被高效整合成清晰、邏輯性強且具備參考價值的搜索結果,在用戶體驗上有了極大改善。

2、深度搜索不只是“找信息”,而是“找真實、權威、有可信度的信息”。

大模型本身“沒有價值觀”,影響輸出結果的是數據,社交平臺上的UGC內容也就成了一把雙刃劍:可能讓答案更有“人情味兒”,也可能“污染”生成內容的準確性。

就像小紅書里的美妝廣告,搜索結果中不可避免地夾雜了太多的營銷信息。并非沒有“避險方案”,比如在特定領域調整UGC內容的權重,以外部可信內容為主,UGC內容為輔;或者像微博那樣引入權威媒體和垂直領域的專業(yè)博主,用大量權威、可信的內容避免信息失真。

3、深度搜索的體驗是不可逆的,將帶來更加有效的商業(yè)變現(xiàn)路徑。

俞軍老師提出過一個著名的體驗公式,即用戶體驗=(新體驗-舊體驗)-遷移成本。鑒于深度搜索相較于傳統(tǒng)搜索的跨時代優(yōu)勢,用戶體驗在很大程度上是不可逆的。

新范式必然會帶來新的機會。以內容付費為例,用戶更愿意為高權威、高可信的內容付費,微博、小紅書、知乎等社交類平臺,或許可以在醫(yī)療、法律、財經咨詢等垂直領域,構建信任型內容付費場景,通過搜索結果在專家和用戶間建立信任的紐帶,激勵專家持續(xù)生產優(yōu)質內容。

做一個總結的話:傳統(tǒng)搜索的時代結束了,而我們正站在新時代的大門前,搜索不再是簡單的信息檢索,而是基于理解和洞察的信息重組與再創(chuàng)造,屬于內容平臺的下一個春天來了。

本文系作者 Alter 授權鈦媒體發(fā)表,并經鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

掃描下載App