乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      搜索的困境與突破——搜索的年代劃分

       weicat 2006-02-10
      【八闋】 http://www.
      【八闋】 對搜索進行歷史分期是一個糟糕的想法。搜索包含了不同的模式,模式之間不存在質量優(yōu)劣的可比性,不存在技術的升級換代,所以評價搜索作為總體的歷史進步意義很容易走入陷阱。 【八闋:PopYard.Org】
              搜索提供者熱衷于給自己的產品貼上一個第幾代的標簽,潛臺詞是我的搜索領先于時代,比別的搜索好。
              如果刪除了商業(yè)炒作,心里牢記新一代搜索并不意味著比老一代搜索優(yōu)秀,對搜索進行年代劃分仍是一個從本質上把握搜索這個復雜概念的有效方法。

              分類搜索是手工建造的,正是這個原因使它獲得了“第一代搜索”的殊榮。無論技術怎樣進步,手工建造的東西能夠永保青春。
              網絡史上第一個分類搜索網站是1994年1月發(fā)布的銀河搜索(www.galaxy.com),而風光無限的分類搜索網站是1994年4月發(fā)布的雅虎(www.yahoo.com )。
              分類搜索從誕生到今天,內部基本沒有太大的變化。調整分類的結構或者控制收錄的內容,都不能從實質上改變分類搜索。分類搜索提供者之間的競爭,不可能通過技術創(chuàng)新來實現(xiàn)。這個角斗場上,比拼的是內力和耐心,一種不動聲色卻大而化之的實力。搜狐一般被認為是雅虎的學習者,甚至是模仿者。搜狐從分類搜索網站轉型為門戶網站,完全是識時務的正確決策,既是超越也是新生,體現(xiàn)了張朝陽的商業(yè)睿智。但如果我們認同搜索的戰(zhàn)略地位,那么搜狐的轉型就不是源于實力,而是源于自卑。同時,張朝陽也給搜索界,甚至是網絡界,出了一個難題。在中國的網絡狂熱時期,幾乎每個網站都做搜索,或者綜合搜索(門戶),或者行業(yè)搜索(垂直門戶),——當然是分類搜索,因為那時大部分的網站還沒有實力做索引搜索。曾經紅極一時的“找到啦”網站域名,忠實地記載了當時人們對搜索的熱情。但現(xiàn)在這些網站要么轉型了,要么消亡了,仍在分類搜索領域默默耕耘的只有實力和資金都并不十分具備優(yōu)勢的藍帆搜索(www.search163.com)、139探索器(www.china139.com )和北極星(www.beijixing.com)。那么,誰將是中文分類搜索的領軍人物呢?
              今天的分類搜索和昨天的分類搜索相比,最大的差別是數(shù)據庫要豐富得多。但是,你不能稱它為進步?;ヂ?lián)網的信息資源爆炸式增長,分類搜索網站有限的編輯隊伍很難追上信息增長的速度。假設1994的雅虎收錄了70%的網站,2004年的雅虎也許僅收錄了60%的網站,盡管絕對數(shù)量已經不可同日而語。
              分類搜索網站經營者遭遇的尷尬卻給他們帶來了一筆橫財。分類搜索網站的商業(yè)模式很簡單,向網絡用戶提供完備的分類網站導航服務,獲得一定的訪問量后,向商家出售廣告位。在這個模式里,分類搜索提供者需要一個龐大的、讓用戶滿意的網站數(shù)據庫,所以收錄網站是免費的,因而成為自己的成本。但太多的網站要求登錄,終于有一天,心花怒放的雅虎向他們宣布:我們仍然免費收錄網站,但提交者太多,請耐心等待,如果你想及時登錄,請交納99美元的優(yōu)先收錄費。
              今天,90%的分類搜索提供者都學會了這一招,而且不再使用優(yōu)先收錄費這塊遮羞布。如果你的數(shù)據庫已經足夠龐大,采取有償優(yōu)先收錄是聰明的做法,否則,盲目實施收費登錄就等于自己阻礙自己競爭力的加強,完全是東施效顰的愚行。

              與第一代搜索穩(wěn)健發(fā)展相比,“第二代搜索”,索引搜索,內部的變革要劇烈得多,競爭和淘汰也殘酷得多。
              從真正的索引搜索誕生到今天,短短十年時間內,索引搜索走過了奠基、成長、成熟、創(chuàng)新四個階段。
              那些為索引搜索奠基的先驅們不應該被忘記,他們是AllWeb,JumpStation,WWWWorm,RBSE,Architext(Excite的前身)。
              1994年4月20日標志著索引搜索成長的開始。這一天,美國華盛頓大學學生布來恩.平克頓發(fā)布了網頁爬行者(www.webcrawler.com),第一個檢索全部文件文字的索引搜索。“我們的成功使進入搜索領域變得容易了,一年之內出現(xiàn)了象Lycos,Infoseek,Opentext這樣的競爭對手。他們沒有做任何革命性的創(chuàng)造,不過是在我們的基礎進行了一些修修補補而已,” 網絡爬行者不無牢騷地說。
              1995年12月,DEC公司發(fā)布了AltaVista。這個速度超群的網站給索引搜索帶來了革命性的貢獻:它第一個允許用戶使用自然語言進行搜索,而且第一個引進了高級搜索功能。
              1996年5月20日,Inktomi公司發(fā)布HotBot。Inktomi源于印地安神話,這只傳說中的蜘蛛將文化帶給了人類。在網絡里,這只蜘蛛具有強大的能力,它能夠每天爬行整個網絡,保證數(shù)據及時更新。
              當網絡用戶變得不成熟時,索引搜索成熟了。當歷史跨入21世紀,他們突然失去了一顆平常心,用宗教般的狂熱盛贊他們擁有的搜索工具,聲稱自己的生活再也離不開它了。
              這就是被我們親切地稱為狗哥的“Google”。
              1998年9月7日,Google的兩位創(chuàng)始人和他們僅有的一位雇員宣告了這位網絡“上帝”的誕生。
              這是一個傳奇嗎?是,也不是。很多人都以為比爾.蓋茨是一位天才的發(fā)明家,獨步天下創(chuàng)造了操作系統(tǒng),結果暴富?!鋵嵅皇?,他的技術誰都可以達到,他成功是因為他實踐了一些基本的商業(yè)原則。Google也一樣,它引以為自豪的網頁排序技術(PageRank)和超鏈分析技術(Hypertext-Matching Analysis)并不是高不可攀,它成功,是因為它專注,因為它體貼人的服務。
              索引搜索的創(chuàng)新并不是在它成熟后才開始的。誕生于1997年8月的北極光(Northernlight)第一個開發(fā)了對搜索結果的自動分類技術。盡管北極光的公共搜索已于2002年1月16日關閉,這種創(chuàng)新具有深遠意義。你在搜索框里鍵入“傳奇”,搜索結果會是什么?幾乎全部是游戲。但你實際上想找的是發(fā)生在河南省輝縣的一些周朝傳奇故事。北極光的努力最后變成了集群技術(Advanced Documents Clustering Technology或叫自動分類技術)。目前代表性的網站有發(fā)布于2000年6月的Vivisimo.com。
              在中國,第二代搜索市場完全是一個不設防的領域。得到國家資助的天網搜索(http://e.pku.edu.cn)由北京大學網絡實驗室開發(fā),1997年10月29日開始提供搜索服務。但由于體制的原因,天網搜索整整花了六年時間才走出實驗室,蹣跚著面對搜索巨人中文Google。
              在資金和技術上有實力對抗中文Google的百度和慧聰,僅在第二代搜索市場短短停留便匆匆轉型為第三代搜索。

              書簽搜索作為第2.5代搜索登上歷史舞臺具有必然性。
              你打開瀏覽器上網,去得最多的地方是哪里?你可能回答新浪,或是搜狐,或是中文Google,或是百度?!煎e了。你去得最多的地方是你自己的收藏夾。
              這就是書簽搜索存在的生命源動力。
              每個人的背景、愛好、追求都不一樣,這就決定了收藏夾一定是千差萬別的。但是,能夠進入個人收藏夾的網站,一般會具備兩條共性:一是反映了大多數(shù)人的普遍興趣,二是在某一領域做得最好。
              書簽搜索實際上是一個公共收藏夾。書簽搜索網站,如新浪精品(http://dir.sina.com.cn/jinpin/index.htm )、百度網站(http://site.baidu.com )和阿酷網址(www.arkoo.com ),在分析用戶愛好和網站現(xiàn)狀的基礎上,給上網沖浪的人提供了另一種搜索樂趣——最快捷、最直觀地抵達目的地。
              新浪和百度提供書簽搜索服務,折射出大網站體貼人的商業(yè)敏銳。專業(yè)書簽搜索網站阿酷(www.arkoo.com)在網絡里占有一席之地,反映了書簽搜索的成長歷史。阿酷孕育于個人的收藏夾,后來收藏夾裝不下越來越多的一流網站,便分門別類寫進了隨身攜帶的小本子。阿酷在朋友中因為善于推薦優(yōu)秀網站而受到歡迎,最自然的結果是,阿酷本身成為了一個網站,一個可以分享的書簽,一個公共收藏夾。
              不象分類搜索需要龐大的手工勞動,也不象索引搜索需要復雜的網絡技術,書簽搜索建筑在群體的上網實踐和嚴謹?shù)睦硇苑治龌A上。分類搜索和引擎搜索崇拜數(shù)量,而書簽搜索追求質量。正是因為這個原因,Yahoo.com和Google.com可以在中文領域攻城掠地,Chiff.com和Startingpage.com卻幾乎沒有幾個中國人聽說過。

              競價搜索(PayPerClick,PPC)本質上屬于索引搜索基本模式,看上去也很象傳統(tǒng)的索引搜索,但內部卻存在本質差別,所以競價搜索應該劃入第三代搜索,而不能看成是第二代搜索(傳統(tǒng)的索引搜索)增加了新功能,也不能看成是第二代搜索的創(chuàng)新變種。
              競價搜索其實是廣告商和消費者(廣告受眾)之間的橋梁。消費者總是在尋找自己需要的產品或是服務,但提供某一類產品或是服務的廠商總有成千上萬,要從這么多競爭者之中脫穎而出,顯示在引擎搜索結果的第一頁是一件異常困難的事情,更不要說出現(xiàn)在第一位。更麻煩的是,想了解電影一般信息的人,比要買某一部電影光盤的人要多得多,按照引擎搜索的算法,產品或是服務提供商網站,基本上就淹沒在搜索結果的海洋里。競價搜索解決了這個問題。它舍棄了一般信息,專注于產品和服務,并且按照廣告商愿意出價的高低排列搜索結果。相對于用戶導向的引擎搜索,競價搜索是廠商導向的,所以也稱為商務搜索。
              這就是競價搜索和索引搜索的本質差別。數(shù)據庫建立,競價搜索由廠商提交,而索引搜索通過蜘蛛程序抓??;搜索結果排序,競價搜索按廠商出價高低決定,而索引搜索則按相關度自動生成。
              競價搜索和結果付費廣告又是兩個容易引起混亂的概念。它們的前綴形容詞一致(PayPerClick,PPC或CostPerClick,CPC),而且競價搜索也源于結果付費廣告,但競價搜索已經發(fā)展成為一種搜索模式,不再等同于結果付費廣告。Google也采用結果付費的廣告形式,也就是說廣告主只有在有人點擊時才向Google付費,但Google并不是競價搜索網站。
              競價搜索的定位決定了它不能成為綜合搜索網站,不能成為網絡用戶的首選搜索網站,永遠沒有機會成為搜索的代名詞。但因為競價搜索的專注,因為它體貼地服務于那些有錢人,競價搜索網站在經濟收入上并不一定會輸給索引搜索網站。到目前為止,Overture的銷售收入遠遠高于Google,如Bancorp Piper Jaffray估測,2003年,Overture收入7億美元,而Google收入3億美元。這個令人興奮的消息吸引了大量的參與者,據不完全統(tǒng)計,英文世界現(xiàn)有591家競價搜索網站。
              競價搜索在搜索活動的弱勢地位迫使它大量發(fā)展合作代理商,而不是積極推銷自己的首頁。門戶,甚至個人網頁成為它的合作伙伴(Partner)或代理商(Affiliate),顯示競價搜索結果,分享廣告利潤。
              標準的競價搜索首頁和標準的索引搜索首頁,設計上、風格上迥然不同。標準的索引搜索首頁突出的是搜索框,而標準的競價搜索首頁突出的是廣告商、合作方以及管理賬號,搜索框反而下降到一個不太顯眼的位置。
              競價搜索的先驅和代表是成立于1997年9月的GoTo.com??偛课挥诿绹又莸腉oTo.com于1998年6月開始提供競價搜索服務,擁有十萬個活躍的付費廣告商和一個包括雅虎、微軟、Infospace、CNN在內的代理商網絡。GoTo.com后來改名為Overture.com,2003年10月7日被雅虎收購。
              2000年1月,李彥宏和徐勇從美國回北京創(chuàng)立百度網絡技術有限公司(www.baidu.com );2002年8月,以商情服務起家的慧聰公司進軍搜索領域(www.zhongsou.com )——民族工業(yè)的隊伍里,如果這個詞還能用的話,從此有了民族搜索。
              按搜索服務的對象分,搜索可以分為公共搜索(Search)和后臺搜索(Search Provider)。公共搜索直接面對你我這樣普通的搜索用戶,而后臺搜索則服務于公共搜索網站,向他們提供技術和搜索結果。Power成了一個將情形變得復雜的詞。后臺搜索往往擠到了前臺,而公共搜索完全有可能開發(fā)自己的技術和數(shù)據庫。Google是一個典型的公共搜索網站,但2002年10月開始,它也向雅虎提供搜索結果。2004年2月18日,雅虎終止了Google的服務,不過出乎業(yè)界和觀察家的意料,它沒有起用已經收購的Inktomi索引搜索,而是開發(fā)了自己的索引搜索Slurp。
              百度和慧聰以后臺搜索的身份進入搜索領域,先后分別向新浪、搜狐、網易、263等門戶網站提供搜索結果服務。我們在這些門戶網站進行搜索,看到的結果其實是百度和慧聰提供的,——某一時期也許是臺灣索引搜索Openfind.com.tw的數(shù)據。
              進入搜索領域初期,百度和慧聰都是第二代技術。但他們很快轉型為第三代,百度的時間點是2001年10月,慧聰?shù)臅r間點是2003年4月?!粋€有趣的現(xiàn)象是,百度和慧聰都在第二代和第三代之間去意徘徊。這個看似不經意的商業(yè)模式選擇,其實綁縛著沉重的文化積淀。這個問題將在后面進行剖析。
              盡管百度和慧聰在商業(yè)上十分成功,但他們并不是一家成功的搜索企業(yè)。這個沉重的話題也將在后面討論。
              搜狐的競價廣告(http://cpc.sohu.com)完全具備了競價搜索的雛形,但他們狹隘地理解了自己的杰出產品,沒有能夠向前推進一步。以搜狐的實力,這一步應該很容易邁出。屆時,競價搜索鹿死誰手,第三代搜索誰領風騷,都還是一個未知數(shù)。
              Overture.com聲稱自己擁有十萬個活躍的付費廣告商和一個包括雅虎、微軟、Infospace、CNN在內的代理商網絡。不管是哪家搜索企業(yè),如果它有底氣做出類似的聲稱,而不是聲稱自己擁有幾億網頁的索引和一些花哨的技術,它就是中國第三代搜索的代表。

              第3.5代搜索是一個突破常規(guī)思維的范例。分類搜索、索引搜索追求數(shù)量,書簽搜索則反其道而行之,追求質量。似乎已經很全面了,但另一些人不這么認為。他覺得數(shù)百萬個網站,數(shù)億個網頁仍不算多,于是 “多元搜索”(Meta Search Engine)誕生了?!嘣阉鲗儆谒饕阉骰灸J健?
              在孕育網頁爬行者(www.webcrawler.com)的那所大學里,研究生艾里克.塞爾伯格(Eric Selburg)發(fā)現(xiàn),索引搜索網站越來越多,讓人糊涂的是,每個網站對同一個關鍵詞給出的搜索結果卻差別很多。于是他開發(fā)了“多元爬行”(www.metacrawler.com),負責將用戶的搜索請求提交給當時幾個著名的索引搜索網站,然后將不同的搜索結果同時反饋給搜索使用者。這是第一個多元搜索網站。
              目前比較優(yōu)秀的多元搜索網站還有Dogpile.com、Ixquick.com、Zapmeta.com。
              以Hotbot.com、Queryster.com為代表的組合搜索(Multi-Search)表面上類似多元搜索,其實卻有本質區(qū)別。索引搜索在整個網絡抓取數(shù)據后,多元搜索在索引搜索里抓取網頁,而組合搜索則是將幾個索引搜索的數(shù)據簡單地排列在一起。
              中國的多元搜索還沒有充分發(fā)展,目前有阿酷搜索( www.arkoo.cn )初具多元搜索模樣。一些貼有多元搜索標簽的網站,如SoIQ.com、88seek.com,其實是組合搜索。

              似乎搜索領域的重大變革都在上個世紀完成了。1998年6月,第四代搜索ODP在美國發(fā)布。
              ODP是Open Directory Project的英文縮寫,意思是“開放式分類搜索系統(tǒng)”。沒有人給它貼上第四代的標簽,幾乎所有人都將它等同于分類搜索,歸類在第一代搜索。其實,第四代和第一代之間的關系,有點類似共產主義與原始社會的關系。不管這種比擬是否恰當,ODP和分類搜索既有驚人的相似,也有本質的差異?!斎唬琌DP屬于分類搜索基本模式。
              ODP的代表性網站是美國網景(www.netscape.com) 管理的Dmoz.org。
              ODP的誕生有點象一個堂.吉訶德喜劇。美國加州一位普通的計算機程序師,里奇.斯格仁塔(Rich Skrenta),因為不滿意雅虎搜索(www.yahoo.com ),決心挑戰(zhàn)這個商業(yè)上的巨無霸??瓷先ハ笫请u蛋碰石頭,或是螳臂當車,因為雅虎當時僅編輯隊伍就有一百多人,更不要提它雄厚的資金實力。
              但里奇.斯格仁塔成功了。他的力量來自于人民。ODP是開放資源運動的一部分,信念就是開放、共建、共享。里奇.斯格仁塔將這個網站命名為Gnuhoo.com,從名稱到框架都和Yahoo.com較勁的一個分類目錄搜索體系,但由自愿者編輯,供所有的人免費使用。
              Gnuhoo.com于1998年6月5日問世,13天后,擁有了200名編輯,數(shù)據庫達到2000類共27000個網站。7月2日,Gnuhoo.com改名為Newhoo.com,7月10日,Newhoo.com即擁有1200名編輯,數(shù)據庫達到4200類共40000個網站。僅僅5周的時間,便取得了雅虎難以望其項背的成就。
              五個月后,網景收購了Newhoo.com,正式將系統(tǒng)命名為ODP,并將網站改名為Dmoz.org。到今天,Dmoz.org擁有6萬多名編輯,數(shù)據庫達到59萬類共計4百多萬個網站。Google、美國在線(www.aol.com)、網景搜索、Lycos.com、 Hotbot.com 、Directhit.com等數(shù)百家網站都在使用ODP的數(shù)據庫。
              ODP從一個簡單的想法開始,通過個人的力量,取得了如此巨大的成功,主要原因是,ODP真正體現(xiàn)了互聯(lián)網精神,順應了互聯(lián)網的基本規(guī)律。網絡里每天都在產生無數(shù)個網站,發(fā)布無數(shù)條信息,不管多有實力的公司,它有限的編輯隊伍根本沒有能力趕上這種爆炸式的增長。而蜘蛛程序抓取的網頁永遠是機器一樣的冰冷。ODP適應了網絡的需要,適應了信息消費者的需要,也適應了信息生產者的需要。所以,ODP成功了。
              于是,ODP成為了互聯(lián)網歷史上一塊耀眼的里程碑,成為了互聯(lián)網精神的象征。
              網易(www.163.com)為中國的ODP事業(yè)做出了卓越貢獻,因為是它第一個將ODP這個概念介紹給了中國網絡界。但是,網易并沒有傳播ODP的精神。直到現(xiàn)在,網易的ODP僅僅為網易的一個頻道服務。
              讓我們期待ODP在中國的誕生吧。

              會不會產生第五代搜索?
              我有一個幻想,第五代搜索應該是OIP,Open Index Project,開放式索引搜索系統(tǒng)。
      在搜索領域新一輪的競爭中,第二代搜索遙遙領先。作為分類搜索象征的雅虎2004年2月18日采取重大行動,雄心勃勃地對Google反攻。但是,這一天并不意味著第一代搜索的東山再起,而恰恰標志著它的沒落。雅虎反攻Google,憑借的是Slurp,一個新的蜘蛛程序。即使Google被擊敗,按照中國武俠界的規(guī)矩,它也不算丟面子,因為是敗在本門功夫下。雅虎已經放棄了分類搜索,決心做索引搜索的盟主。它聲稱它已經索引了60億網頁,而Google只有42億,它還聲稱它的全文檢索達到500K,而Google 只有101K。
              搜索市場的前景是迷惘的,誰也難以預料勝利者和失敗者,但又是明朗的,因為搜索王國的統(tǒng)治者一定會是索引搜索。
              索引搜索并不搜索整個互聯(lián)網,而是搜索預先存儲的網頁索引數(shù)據庫。不管是60億,還是42億,這些資源屬于某幾家巨頭,我們進入所謂開放的網絡,實際上完全依賴這些巨頭。他們規(guī)定了我們可以獲取哪些信息,而且還規(guī)定了我們取得這些信息的方式。這是信息的中央集權。
              能不能有一種技術,讓我們真正搜索整個網絡,而不是搜索網絡獨裁者的數(shù)據庫?如果有這一天,信息就能回歸到發(fā)散式分布,回歸到平民手中,而整個網絡將沐浴在互聯(lián)網開放、共建、共享的陽光中。

        本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
        轉藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多