為什么大多數公司做不好搜索引擎?

0 評論 5460 瀏覽 1 收藏 15 分鐘

編輯導讀:搜索引擎,在信息龐大數據冗雜的網絡中,起到了篩選器的作用。人們通過使用搜索功能,可以獲得自己想要的內容,屏蔽掉無用的信息。但互聯網發展這么多年,能做好搜索引擎的也沒幾家公司,這是為什么呢?本文作者對這背后的原因展開了分析探究,與大家分享。

01

在這個信息大爆炸的世界,一個人對熱點信息的響應程度,一定程度上決定了他的受歡迎程度。

畢竟,人人都想有一個江湖百曉生那樣的朋友,更想自己也成為這樣受歡迎的人。

信息搜集和整理的能力,一定程度上取決于用了什么搜索工具。

過去我們的搜索,靠的是搜索引擎?,F在的搜索,是萬物皆可引擎。

我們用微博搜明星,用淘寶搜商品,用豆瓣搜書、搜八卦,搜索引擎已然成為了我們生活中的一部分,成為我們搶占熱點信息、不脫節的社交工具,更是成為了我們網絡生活的全部。

我們需要用搜索對抗不知道外面在發生什么的焦慮,需要它來證實我們的猜測,好尋找心理認同,證明我們沒有社交冷場。

舉個不恰當的例子,哪怕發生了地震,我們的第一反應可能都不是逃生,而是打開手機,搜索“地震”,看看它有沒有上熱搜。

那么問題來了,我們的這種搜索真的能找到“真相”嗎?

很多人并沒有可靠途徑來確保自己所查閱的信息是否真實和權威,所以這種搜索有可能引發群體性的“信息從眾”,人云亦云。

從海量資訊中甄別信息真偽,是每個網民的困境,也是所有搜索引擎正在面臨的挑戰。

我們的問題不是信息不夠多,而是太多。

02

判斷一個搜索引擎好不好用,主要看三方面。

第一,高效。

第二,精準。

第三,穩定。

說白了就是看它能不能讓用戶高效地獲取正確信息的問題,這是市面上所有搜索引擎的痛點。

此外,搜索引擎還存在一些問題。

我們常說獲取信息,有兩種方式:一種主動獲取,一種是被動接受。

如今,想要主動去獲取信息,已然是一種越來越稀缺的獨立思考能力。

很多人雖然接受了信息檢索的訓練,但架不住現在網絡平臺的智能算法和推送能力大法好,導致了信息繭房的存在,大家需要花更多的時間精力去濾篩選信息。

這就增加了主動搜索的不確定的風險,搜不搜得到,以及可能會搜到什么內容非常不可控。

很多青少年甚至中老年人,前者缺乏一定的生活經驗,后者欠缺必要的信息篩選訓練。這兩類人非常容易成為互聯網詐騙的重災區。

發現沒,信息匱乏是個大問題,但信息大爆炸又帶來了虛假信息難以辨別的問題。

相比之下,被動接受就要輕松得多,這種經由大數據處理之后的自動分發模式,讓用戶甚至不需要做什么,想看的東西自己就會冒出來。

不過這種被動接受并不意味著用戶就可以選擇躺平不動。事實上,絕大多數這種自動出現的信息都是無效無聊的,想要從中挑出一點有效信息,時間成本過高,回報過少。

甚至屢屢被爆出的數據泄露事件與謠言危機,在這種被動接受機制下很難得到有效地凈化。

想成為合格的網上沖浪選手,用戶必須要培養自己辨別篩選信息的能力,養成主動獲取信息的習慣。

反過來從搜索引擎自身來說,這二十多年來,它能提供的服務已經越來越無法滿足人們在碎片化的時間中快速尋求答案的需求。

以及“搜索引擎”商業化進程中不可避免誕生的競價推廣,關鍵詞優化模式,用戶根本分不清,自己搜到的是不是廣告。

就說牛老師吧,他前幾天感冒,感覺腮下淋巴結有點腫,他是隨手搜了一下,卻差點給我嚇尿了,結果竟然顯示說他這可能是艾滋的癥狀。

這個搜索引擎太不準了。

按照牛老師的生活習慣,應該把“可能”去掉,這個引擎還需要進步。

這恰好也說明了,搜索的精準率是一種剛需。

并且,搜索引擎所提供的這個答案,不應該只有正確答案的告知。搜索引擎應該意識到,用戶的每分每秒都是黃金時間,經不起一點浪費。

它需要做的遠比現在可以實現的更多,比如說幫助用戶一步到位地解決問題,告知他們用什么手段解決以及在哪里解決。

但顯然,這條路并不好走。

03

是當前存在難以攻克的技術難題嗎?

是,但也不是。

搜索引擎本質上是一種信息獲取方式。

理想情況下,對一套搜索引擎來說,它本身存儲的信息當然是越全越好。

這就意味著,首先它需要靠爬蟲技術爬取全網內容,并且有一套自己的清洗機制數據的能力,在對這些原始信息進行必要的處理后,建立自己的資料庫或者說自己的大數據中心。

其次是構建索引環節,這相當于給每一個內容添加目錄,便于搜索引擎根據用戶的查詢詞來進行數據庫檢索。這就涉及到一個排列機制的問題,需要用到用戶查詢內容與網頁內容的相關性分析、網頁質量評價等技術。

盡管市面上所有的搜索引擎具體實現方式有差異,但所有的搜索服務的核心都是資料庫+排列機制。

技術有差異,但是原理上基本沒差別。

如果說資料庫決定了搜索引擎的上限,那排列機制則決定有多接近上限。

答案很簡單,排列機制直接跟效率掛鉤。

不同的排列機制,直接決定用戶第一眼看到什么信息,繼而影響到他們的現實決策。

可見,效率才是搜索引擎的生死棋,也是影響用戶執行的大殺器。

所以說下一個階段,搜索引擎賽道上需要比拼的,已經不是數據的抓取技術、更不是數據存儲。

在這個9塊9就能學Python爬蟲的大環境里,大家更看重的并不是真正的大千世界,而是那個跟自己有關系的世界。

現在搜索引擎需要做的,就是去理解用戶真正想要的是什么。

并且在最短最快的時間里,給到他們最直接有效,獨一無二的正確答案。

就像關于學Python,我會告訴你,善用搜索,不要錢。

04

引擎和信息的痛點,恰好給了“微信搜一搜”一個證明自己的機會。

生活中,很多人會忽略“微信搜一搜”是個搜索引擎,因為大家更習慣性地把它當成微信的一個小技能。

蟄伏許久,現在終于輪到它發力,成為某種意義上的“答案引擎”了。

別的不提,光從便捷性上說,當你想在微信范圍內搜索任何東西的時候,你是不需要滑出微信的界面的。

無論是搜文字還是圖片,你只需要選中,然后點搜一搜就行了。甚至你可以通過“掃一掃”功能,進行識物,拍照進行翻譯。

搜一搜這么好用,自然繞不開它背后的微信。

我們都知道微信的資源分布很廣,光是公眾號一塊的資源,背后信息沉淀就已經足夠龐大。

而且,不同于市場上其他搜索引擎單純的數據抓、人為操縱的算法編輯,公眾號最突出的特點是,每一個號背后的創作者都是一個個活生生的人。

他們源源不斷的創作力,對信息的消化分解與再次整合能力,不斷地信息知識迭代能力,都為搜一搜的整個搜索引擎系統及時地補充時效快,質量優的資源。

除此之外,搜一搜的搜索結果充分顯示了人工篩選邏輯的力量。

第一,量化搜索結果。

每當用戶在搜一搜上搜索一個東西的時候,結果展示中精選留言的數量、閱讀數據、以及是否關注,都是會被量化展示的。

大家都喜歡用腳投票,一眼就能看出哪個答案呼聲更旺,更得人心,從而避免了在大量的無效信息中摸索,減少篩選成本,提高搜索效率。

第二,規范化決策流程。

無論用戶在搜一搜上搜索什么,搜索結果永遠存在一個執行優先級的排列。

比如,搜索買票、就醫這種,它給到的第一條信息,已經考慮到了用戶有可能要做的決策,甚至足夠承接他接下來的執行行為。

然后才是更大范圍地搜索結果展現,以及細致的聯想搜索拓展,從而幫助用戶從更多的角度去思考決策。

05

在這種模式之下,追逐技術抓取并不是搜一搜做搜索引擎的核心,而是找到一套更為有效的方式去解決獲取高質量信息的頻率和概率的問題。

想要練就這種數據力量,僅靠一家公司去做數據抓取根本做不到,需要整個互聯網的集體共創才能實現。

這意味著,我們看到的搜一搜還只是一個入口,在它背后真正站著的是微信建立起來的內容生態圈。

其實從搜一搜的內容來源就能看出來,除了微信公眾號文章,它還接駁了海量的創作平臺和外部信息源,用戶完全可以把搜一搜當成跳板,從這里直接找到內容更加專業,更加優質的外部信息。

對搜一搜來說,這個口子既是對外也是對內。

對外,它需要保持更開放地心態,去合作更多靠譜的信息平臺伙伴。

對內,微信,這個有十一億用戶,并且一直在持續壯大中的生態,每天都在產生和沉淀海量的信息內容。

搜一搜需要做的,并不是一味地追逐這種無窮無盡地信息瀚海,而是想方設法地讓這些信息資源在流動中不斷被激活。

最后回應給用戶的搜索結果,不是量大,而是精準。

現在,搜一搜還需要做的,是更大力地撕開這個生態的口子,讓更多的個人帶著他們的搜索習慣和模式,參與到信息流動中。

這是一種借力打力,四兩撥千斤的做法。

06

隨著存量市場的競爭越來越進入到白熱化的狀態,做好一款搜索引擎的意義絕對不是收割更多的用戶,靠他們賺錢,這套商業模式已經過時了。

直白地說,我們所描述的搜一搜背后的十一億微信用戶甚至幾十億相關用戶深不見底的數據本身,是人們的生活,是大家在衣食住行的需求,在情緒上的求安慰,求鼓勵,甚至是在迷惘中的求指引、求寬慰。

搜一搜存在的意義,無非是以這樣的形式,架設起一個橋梁,讓生活對接更廣泛的生活。

從這個角度說,搜一搜只是一個工具,是生活中的人用它進行搜索,看到了更大的生活,這是一個眾生見眾生的過程。

懂事的公司都明白,工具的宿命就是為人服務。

同理,沒有一家公司可以底氣十足地說它創造發明出了一款偉大的工具。

所有的偉大都是背后的不起眼的,被欲望支配的,但也在不斷進行著自我克制的蕓蕓眾生。

這也是搜索引擎背后真正站的東西,尊重。

無非是尊重用戶的選擇,用戶的想法,用戶的好奇。

這就跟盲猜哪把鑰匙能開鎖一樣,往往是最不起眼的那一把鑰匙,打開了鎖。

 

作者:半佛仙人;公眾號:半佛仙人(ID:banfoSB)

來源:https://mp.weixin.qq.com/s/2Du9dktJpX9ntll-jnkpVQ

本文由 @半佛仙人 授權發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!