拆解Perplexity:搜索領域的超級黑馬,“谷歌殺手”是如何煉成的?
若干年前,中文互聯網發展到頂峰的標誌,是以BAT爲首的超級明星公司的崛起,但誰能想到,到了AI大爆發的時代,最先受到猛烈衝擊的反而是搜索,儘管早前馬雲曾放話AI電商將成爲主流,但現實情況是,AI對搜索領域的衝擊要遠比對電商來的早得多。
最明顯的,由前OpenAI研究科學家Aravind Srinivas聯合幾位合夥人共同創辦的Perplexity,在沒有任何用戶基礎的情況下MAU(月度活躍用戶)超過千萬,而這僅用了短短不到兩年時間,與之相對的,它的身價也一路水漲船高,據The information 5月底的報道,眼下BVP正在牽頭對Perplexity 2.5億美元的投資,最新估值達30億美元,相當於1/10左右個百度。
作爲傳統搜索引擎的升級品,Perplexity實質上是AI時代的產物,你可以把它理解成一個答案引擎,但它絕非只是大模型的"套殼"公司,它的核心技術是一個名叫RAG的檢索增強生成技術,通過RAG技術,Perplexity AI能夠實時搜索互聯網並提供準確的最新信息,並附有來自可靠來源的引用。
值得一提的是,這家公司規模還不足百人,但包括黃仁勳、貝索斯在內的業界大牛皆是Perplexity的忠實擁躉。按照黃仁勳的說法,Perplexity是他每天工作使用最高頻的應用之一,尤其是面向對專業度要求更高的搜索需求,比如"瞭解關於計算機輔助藥物研發"。
事實上,Perplexity並非個例,包括天工、秘塔等在內的都是近兩年剛崛起的新秀,反觀Google、百度在內的傳統搜索巨頭,儘管他們都嗅到了這場即將到來的危機,但弔詭的是,以百度搜索爲例,儘管文心一言的推出曾在市場上引發過一波小高潮,但後續百度APP「用AI重做一遍」並沒有帶來二級市場的持續看好,股價從去年3月的最高點跌幅近1/5,以至於很多人開始思考,AI搜索的正確打開方式究竟是什麼?
01、AI搜索劇變始末
和大多數初創公司一樣,Perplexity源於一個產品創意,創始人Aravind Srinivas發現使用谷歌搜索常常給不了他想要的結果,而且搜索過程過於繁瑣,於是他決定自己打造一款能夠直接生成答案的搜索引擎,他想打造最世界上最好的研究助理。
Aravind Srinivas的想法與Denis Yarats(現任Perplexity聯合創始人兼CTO)不謀而合,兩位因相似的研究興趣與觀點結緣,分別獨立發表了在主題,論點,甚至在引文上都高度相似地論文,他們都認爲未來的搜索應更高效。
但有意思的是,他們的想法並沒有得到投資人的支持,所以他們只好「曲線救國」,先把理念落地成一個to B的產品,一個從自然語言——SQL-2的轉換工具,據此設計的初代答案引擎也僅僅是在內部使用,用來搜索員工保險之類比較瑣碎的事情。
在當時來看,投資人不看好他們是有道理的,囿於谷歌的強大壟斷,如果一個人跟你提出要顛覆谷歌無異於癡人說夢。事實也的確如此,在Perplexity之前,包括Marc Andreessen、Ask Jeeves先後嘗試過做直接生成答案的搜索引擎,但最後都無疾而終,前者是大名鼎鼎美國網絡瀏覽器之父,Netscape Navigator瀏覽器就是他的傑作。
事實證明,Perplexity成立的時間是一個很妙的時間點。據Perplexity創始人Aravind Srinivas披露,早在2018年剛進入加州伯克利大學攻讀AI和深度學習方向的博士時,他就瞄準了LLM出色的語言"理解"能力,但他也同時坦言,2021年以前,他都沒法加入遊戲,因爲大語言的模型開發還未成熟,直到出現了Jasper這樣的初創公司,也有了像GitHub Copilot這樣從模型變成產品的例子。
這也意味着最燒錢的大語言模型基礎已經被Open AI、Anthropic這樣的頭部公司攻克的差不多了。而Perplexity需要做的,就是如何藉助大模型打造一個新產品。
值得一提的是,Perplexity團隊的反應速度相當驚人,GPT3.5發佈一週後,Perplexity AI就正式上線。更厲害的是,Perplexity不僅藉助LLM實現了答案引擎的想法,還在這個基礎上用RAG技術優化了LLM幻覺問題,就如Aravind Srinivas所述,Perplexity並不是二者的替代,而是兩者的平衡點。
02、"顛覆谷歌"的背後邏輯
外界容易忽略的是,谷歌佈局AI 搜索並不算晚,甚至要比Perplexity早得多,甚至GPT系列模型的基礎訓練都是基於谷歌研發的Transformer架構,但谷歌卻未能在這場搜索劇變中佔得先機,爲什麼?
這還得從傳統搜索引擎的賴以生存的商業模式「競價排名」開始談起,但到了AI時代,Perplexity所定義的搜索邏輯裡,信息排序的流程被省略,直接給出答案,但谷歌的收入恰恰來自讓人們點擊和瀏覽鏈接,賺取廣告費,同時打造數據飛輪,優化搜索排名。
採用AI 搜索意味着推翻自己的搜索模式,顛覆搜索模式給用戶更好的體驗不是難點,但一下子推翻長期以來鑲嵌其中的商業模式纔是最難以抉擇的,起碼就目前來講,在搜索引擎上的廣告業務依舊是谷歌的核心收入來源,根據它的2023年財報,其廣告業務營收2378.6億美元,在總營收中佔比77.4%。
另一個被外界飽受詬病的,是關於傳統搜索引擎的複雜性。搜索引擎說到底就是信息處理工具,過去的使用路徑大致如此:輸入信息需求——信息篩選與排列——信息選擇與整合——需求滿足,只有當用戶搜索需求被滿足了,人們的決策與行動才能進一步展開,由此而衍生的類似知乎問答、小紅書種草大多是這樣的邏輯,但現實情況是,信息過載,這個現象從上世紀80年代就成常態了,互聯網帶來信息指數級增長,生成式AI又升一個量級。
反觀Perplexity AI,它本質上就是一款信息處理工具,關鍵能力在於,最大程度上縮短了滿足信息需求的路徑,可以說,Perplexity的顛覆性也源於改變人們信息搜索習慣的潛力,而一旦當人們習慣了一步得到答案,就沒有耐心去翻閱無數條夾雜廣告的藍色鏈接了。
某種程度上,Perpelxity的用戶活躍數量與使用量的急劇增長,恰恰證明了用戶習慣改變的迅速。根據新眸調查,今年1月,Perplexity的月活躍用戶已經增長至1,000萬,訪問量達到4500萬次,總搜索量超5億次,較2023年增長了20,512%,這種爆發式增長讓Perplexity成爲一級市場的當紅炸子雞。
03、誰將主導下一次搜索革命?
去年以來,相繼有類似的AI 搜索軟件推出,甚至有自己的大模型支持,比如必應和國內的百度,還有專門做搜索引擎的天工、秘塔等等。
如果說Bing、百度等老牌搜索巨頭迎戰AI 搜索的態度還算積極,那谷歌看上去就非常敷衍,僅僅是將王牌大型AI模型Gemini集成到搜索引擎中,直接在搜索頁面開頭添加了摘要,也就是AI Overviews,以直接回答問題。
但打破用戶習慣的產品往往是重寫邏輯,而不是利用AI對原產品縫縫補補,處理不當反而會消耗原有用戶的信任。谷歌的AI overviews推出不到一週,便因爲沒認出毒蘑菇、建議用戶吃石頭、把膠水加到披薩上,招到用戶吐槽。
這些缺乏常識的答案看似是大模型幻覺問題,背後其實是搜索的召回精度問題。谷歌的召回技術依舊依靠網頁索引,這一套在信息排序上管用,但與內容相關度和準確度無法保證;在自己的強勢領域搜索上,谷歌的邏輯開始吃力起來。就如美國證券分析師丹·艾布斯·韋德布什所述,"這是在谷歌搜索服務的壓倒性優勢上出現的裂痕。"
無獨有偶,高度依賴中國本土市場的百度,也面臨着與谷歌相似的境遇。國內的AI 搜索產品使用前三名只有360是從傳統搜索引擎升級而來,天工 AI與秘塔AI均是全新的產品;儘管百度藉助文心一言重構了搜索引擎,但AI 搜索的答案只佔11%,依舊高度依賴着傳統搜索的使用慣性。
這將不可避免的涉及到一些大廠之間的競爭。比如在社交媒體微博上的搜索,用戶大概率想是瞭解熱點事件,並加入討論;在小紅書上搜索更多是爲了查找攻略、測評等經驗性信息;高德等地圖軟件上的搜索是爲了導航等等;也就是說,用戶需求劃分更加細緻的平臺時代,早就瓜分走了一部分通用類搜索引擎的市場。
換句話說,有關搜索的革命並不是因爲AI 搜索纔開始的,它只是加速傳統搜索式微的一支關鍵力量。AI 搜索的本質還是AI Agent,通過搜索解決去用戶各種各樣的問題,因此,無論是平臺內嵌還是專門的搜索引擎,AI 搜索的形態一定是和他匹配的服務相輔相成的,按照這個邏輯,搜索的真正的代際變革纔剛剛開始。