互聯網資訊
互聯網資訊

揭秘淘寶搜索•那段故事(shì)

時間:2013-08-16   點擊量:567   關鍵詞:搜索  文章(zhāng)  淘寶  揭秘  系列  可(kě)以  整體(tǐ)  概念  得(de)懂(dǒng)  寫在  能看(kàn)  


【7哥導讀(dú)】本文是《揭秘淘寶搜索》系列文章(zhāng)的第一篇,主要介紹了搜索的特點,系列文章(zhāng)的規劃,以及淘寶搜索的曆史和變化。可(kě)以作(zuò)爲了解淘寶搜索的入門(mén)級的文章(zhāng),不懂(dǒng)搜索的人(rén)也能看(kàn)得(de)懂(dǒng),懂(dǒng)搜索的人(rén)可(kě)以有更整體(tǐ)的概念。

寫在前面


終于要開始寫揭秘淘寶搜索的文章(zhāng)了,2013年(nián)1月自(zì)媒體(tǐ)”鬼腳七”剛開始的時候,我說(shuō)如(rú)果微信"鬼腳七"粉絲數達到10萬,我就(jiù)開始寫《揭秘淘寶搜索》,在這個賬号中連載,沒想到很快(kuài)就(jiù)到了。當時我還(hái)在負責淘寶搜索的産品,現在我不再負責淘寶搜索業務,正好可(kě)以專心寫淘寶搜索的文章(zhāng)。


之所以寫想寫這個系列的文章(zhāng),有幾個原因:


1 淘寶搜索對于一個賣家來(lái)說(shuō),太重要了。目前又沒有系統性的介紹,我之前答應過要寫,這次剛好有機(jī)會。可(kě)以供賣家參考。


2 我負責了4年(nián)多的淘寶搜索技術(shù)和産品,如(rú)今不再負責搜索業務了,也希望能寫一些文章(zhāng),做爲總結。也算對自(zì)己交代。


3 目前對于購(gòu)物搜索方面的文章(zhāng)太少,我寫出來(lái),可(kě)以讓其他(tā)做購(gòu)物搜索的同仁們有所借鑒。


搜索這十多年(nián),就(jiù)像一幕電影(yǐng)。我現在隻不過把劇(jù)本零星的整理(lǐ)出來(lái)形成系列的文章(zhāng)。


我假定的讀(dú)者對象是搜索相(xiàng)關産品和技術(shù)人(rén)員(yuán)、所有淘寶和天貓上的賣家,以及其他(tā)對購(gòu)物搜索感興趣的朋友。因此文章(zhāng)不能太技術(shù),但(dàn)又不能太沒有技術(shù),這是很有挑戰的地方。所以大(dà)家不要期望太高,照(zhào)顧一下其他(tā)讀(dú)者。


雖然是計劃寫揭秘淘寶搜索系列,但(dàn)我希望我的文章(zhāng)包括淘寶搜索、一淘搜索、天貓搜索、以及阿裡(lǐ)巴巴B2B的搜索,也不會有真的内部秘密要公開,能公開的就(jiù)不是秘密。


那幾個搜索引擎


B2B、B2C、C2C這些名詞想必都(dōu)很熟悉,還(hái)有現在比較新潮的O2O, C2B。所謂的模式,都(dōu)是做出來(lái)以後總結出來(lái)的。先知先覺設定某個模式,然後去(qù)搞,十有八九不會成功。此文章(zhāng)系列不談這些,着重談搜索技術(shù),不同的搜索引擎,搜索的原理(lǐ)基本一緻,隻是在産品策略,排序因素上有各自(zì)的特性。


如(rú)果講這幾搜索引擎技術(shù)的完整性,一淘搜索最完整。具體(tǐ)技術(shù)以後再講,先說(shuō)說(shuō)一淘搜索。


中國(guó)最大(dà)的全網購(gòu)物搜索是一淘搜索(淘寶搜索不是全網購(gòu)物搜索),但(dàn)明顯一淘搜索還(hái)不屬于購(gòu)物的主要入口,相(xiàng)比淘寶本身(shēn)還(hái)很小,看(kàn)似一個很好的應用,卻一直沒有得(de)到市場的認可(kě)。原因是多方面的,我這裡(lǐ)列幾個:


  • 當市場一家或幾家獨大(dà)的時候,站内的購(gòu)物搜索已經能解決用戶90%的需求,全網購(gòu)物搜索引擎的需求不大(dà);




  • 購(gòu)買商品不同于浏覽網頁,需要輸入賬号,很少有人(rén)願意到一個地方搜索,然後到另外一個地方重新輸入賬号、浏覽、購(gòu)買,然後再回來(lái)進行搜索的;




  • 各個電商網站的數據非常不一樣,如(rú)果搜索産品想做到非常好用,技術(shù)難度不是一般的高。




  • 淘寶搜索是最有挑戰性的。我從(cóng)2000年(nián)開始做搜索技術(shù),先後做網站的站内搜索、企業知識搜索、網頁搜索,最後做淘寶搜索。這十幾年(nián)中,遇到最具挑戰性的就(jiù)是淘寶搜索。雖然數據量不是最大(dà)的,但(dàn)其技術(shù)的複雜性,一點都(dōu)不低于網頁搜索,更具有挑戰的是,其産品策略太難制定,在考慮用戶體(tǐ)驗的同時,還(hái)需要考慮幾百萬賣家的利益。而且道高一尺魔高一丈,無論多好的策略,很快(kuài)就(jiù)可(kě)能被市場破壞。


    天貓搜索和淘寶搜索都(dōu)是同一套技術(shù)體(tǐ)系,因爲他(tā)們要解決的問(wèn)題都(dōu)是一樣的。天貓的數據量小,商家數隻有淘寶商家數的百分(fēn)之幾,商品量也很小,天貓搜索的産品策略和淘寶搜索有明顯的不一樣。天貓搜索不擔心馬太效應(馬太效應是指大(dà)者越來(lái)越大(dà),小者很難成長),天貓可(kě)以通過制度要求讓賣家配合很多規則,例如(rú)商标、圖片、正品要求、發票等。當然,天貓搜索還(hái)會倡導品質,而不是便宜。


    淘寶搜索和天貓搜索都(dōu)有兩個類型的應用,一個是直接關鍵詞搜索,一個是類目浏覽(也就(jiù)是list)。前者好理(lǐ)解,後者是指當用戶通過某個類目名稱進入到商品列表頁的時候,出現的搜索結果。這兩者都(dōu)是調用的同一個後台,隻不過排序因子有些不一樣。


    阿裡(lǐ)巴巴B2B的搜索,也就(jiù)是1688的搜索,我自(zì)己還(hái)不太了解,等過些天我去(qù)拜訪一下相(xiàng)關的負責人(rén),再向大(dà)家做介紹。


    淘寶搜索VS. 網頁搜索


    我們平時用網頁搜索引擎更多,爲了讓大(dà)家更清楚了解淘寶搜索的特點,我這裡(lǐ)把網頁搜索和淘寶搜索的特點做個對比。


    一、搜索流量的價值


    淘寶上每個賣家店(diàn)鋪流量來(lái)源主要分(fēn)成三部分(fēn):推廣流量(付費廣告或免費活動);老客戶(直接登錄、收藏等);搜索流量。由于推廣活動的持續性問(wèn)題,搜索流量基本上決定了一個店(diàn)鋪新客戶來(lái)源。如(rú)果一個店(diàn)鋪新客戶來(lái)源不夠的話(huà),在市場上會日(rì)益衰落。


    目前的網頁搜索引擎公司,盈利的主要來(lái)源還(hái)在搜索廣告。但(dàn)對于網頁搜索引擎來(lái)說(shuō),不是所有的流量都(dōu)有價值,例如(rú):在百度上搜索“李湘”,估計就(jiù)沒有什麽廣告,大(dà)多是明星新聞八卦什麽的。一般的網頁搜索流量中,大(dà)約20%~30%的搜索詞是有商業價值的(适合出廣告)。淘寶搜索不一樣的是,基本上99%的流量都(dōu)是有商業價值的。搜索“李湘”,會出來(lái)減肥茶,搜索“林志玲”,會出來(lái)充氣娃娃;在韓寒和方舟子鬧得(de)很厲害時,搜索“韓寒 VS 方舟子”也有很多個性T-shirt結果。某種程度上可(kě)以說(shuō),如(rú)果淘寶搜索流量有10億,其價值估計相(xiàng)當于網頁搜索流量40億的商業價值。


    在淘寶搜索上,如(rú)果要賣廣告,是最好融合的。因爲淘寶搜索的結果本身(shēn)就(jiù)是商品,廣告也是商品,二者沒有區别。


    二、搜索的社會影(yǐng)響


    這個和淘寶本身(shēn)的社會影(yǐng)響相(xiàng)關聯。現在淘寶賣家數達到800萬,活躍賣家數應該在200萬左右。我們假設平均每個活躍賣家背後有5個人(rén),那麽直接在淘寶上就(jiù)業的人(rén)就(jiù)有1000萬人(rén),如(rú)果加上其他(tā)兼職賣家、快(kuài)遞公司、第三方服務公司等,估計能到2000萬人(rén)。每天有上億的用戶上淘寶去(qù)買東西。淘寶任何一個規則的變化,對整個社會都(dōu)會有不小的影(yǐng)響。


    2012年(nián)淘寶、天貓雙十一,整個交易額達到191億,考驗的不隻是淘寶、淘寶賣家、淘寶買家,還(hái)有物流快(kuài)遞公司、銀行支付系統等。試想有一天淘寶忽然停業一天,全國(guó)有多少人(rén)都(dōu)得(de)在家打麻将了。同理(lǐ),搜索的任何一個變化,都(dōu)會影(yǐng)響淘寶賣家,通過賣家會影(yǐng)響到買家、第三方物流……


    不知道有多少人(rén)還(hái)記得(de)2010年(nián)7月份搜索規則的變化,已經由一個公司内部的技術(shù)變革,演變成一個社會事(shì)件(jiàn)。這個在本文後面會有專題介紹。


    三、搜索的實時性


    如(rú)果有人(rén)自(zì)己建了個網站,網頁搜索引擎要是一兩個星期沒有收錄這個網站,站長也不會太着急。但(dàn)在淘寶上不一樣,必須是實時或者接近實時的。賣家發布一個商品,希望幾分(fēn)鍾後就(jiù)能搜索到。因爲商品是實體(tǐ),賣一件(jiàn)少一件(jiàn),價格也會有變化,賣家還(hái)會經常搞活動,如(rú)果信息更新不及時,就(jiù)會誤導買家,造成糾紛。這些對搜索的實時性要求非常高。


    在淘寶上,每天會有上億的商品信息發生(shēng)變化,包括上架、下架、銷量、價格、屬性、描述的變化等。這些商品絕大(dà)部分(fēn)都(dōu)會在幾分(fēn)鍾之内反應到搜索結果中去(qù),如(rú)果要做到實時的呢(ne)? 這對技術(shù)帶來(lái)的挑戰是巨大(dà)的。淘寶最開始更新的周期是半個小時到40分(fēn)鍾,到2012年(nián)已經縮短(duǎn)到三四分(fēn)鍾之内了。當然,晚上系統做更新的時候,數據更新會稍微慢(màn)一些。


    四、搜索的查全率


    查全率是個專業術(shù)語。所謂查全率,就(jiù)是搜索鞋子,找到的鞋子數量占總體(tǐ)鞋子數量的百分(fēn)比。類似的術(shù)語還(hái)有相(xiàng)關性,相(xiàng)關性就(jiù)是指搜索結果和搜索詞是否相(xiàng)關。例如(rú):搜索“做自(zì)己”,出來(lái)《做自(zì)己》這本書(shū)就(jiù)算相(xiàng)關,出來(lái)《做自(zì)己的口才專家》就(jiù)屬于不相(xiàng)關。搜索手機(jī),出來(lái)手機(jī)鏈也屬于不相(xiàng)關。


    網頁搜索是會做一些消重和過濾的。我們在網頁搜索時,最不希望看(kàn)見(jiàn)的就(jiù)是一摸一樣的重複結果。在淘寶搜索中,我們也不希望看(kàn)見(jiàn)太多的重複結果,但(dàn)同時又希望有不同的商家可(kě)以對比,有不同的地域可(kě)以選擇。對于賣家來(lái)說(shuō),如(rú)果自(zì)己店(diàn)鋪的寶貝因爲跟其他(tā)店(diàn)鋪重複而不出現的話(huà),一定會詢問(wèn)爲什麽,淘寶的客服電話(huà)很快(kuài)就(jiù)會打爆了。


    淘寶搜索,一方面要考慮買家的體(tǐ)驗,一方面又要考慮賣家的利益,這就(jiù)需要采用很多不同的技術(shù)解決。


     



    文章(zhāng)内容及圖片來(lái)自(zì)網絡,如(rú)果侵權,請(qǐng)聯系:901070669@qq.com,我們将及時處理(lǐ);
    推薦解決方案
    熱(rè)門(mén)解決方案