搜索引擎是如何工作的？

qinhuanwei 2018-10-11

展開(kāi)全文

信息檢索是什么？它和搜索引擎的關(guān)系是什么？以及，如何更好地使用搜索引擎？

點(diǎn)擊觀看視頻，你對(duì)人工智能的了解就能輕松超過(guò)全世界 99% 的人類(lèi)！

圖文版本送給不方便打開(kāi)的朋友：

信息檢索（Information Retrieval）起源于圖書(shū)館的資料查詢和文摘索引。計(jì)算機(jī)誕生后，信息檢索的內(nèi)容已經(jīng)從文本檢索，擴(kuò)大到圖片、音頻、視頻等各種信息的檢索。

通常信息檢索會(huì)包含一個(gè) Query，即表述需求的查詢字段，和一份由系統(tǒng)回復(fù)的、包含所需要信息的文檔列表。

搜索引擎是最常見(jiàn)、規(guī)模最大的信息檢索系統(tǒng)。

通過(guò)爬蟲(chóng)不斷抓取、存儲(chǔ)、更新互聯(lián)網(wǎng)中的網(wǎng)頁(yè)內(nèi)容，再為它們建立與字典類(lèi)似的索引目錄，用戶在鍵入關(guān)鍵詞時(shí)，就會(huì)通過(guò)關(guān)鍵詞在這些網(wǎng)頁(yè)中出現(xiàn)次數(shù)和位置，來(lái)判斷頁(yè)面與 Query 的相關(guān)性，并將它們由高到低排列起來(lái)。

說(shuō)起來(lái)簡(jiǎn)單，理解用戶的 Query，清除重復(fù)或低質(zhì)量的頁(yè)面，建立高效的索引，每一項(xiàng)都不簡(jiǎn)單。建立一個(gè)好用的搜索引擎，往往需要分詞、信息抽取、文本分類(lèi)等各種各樣的 NLP 技術(shù)作為支撐，小小的一個(gè)搜索框背后，凝聚著人類(lèi)最頂尖的智慧。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自： qinhuanwei > 《智能互聯(lián)》

舉報(bào)/認(rèn)領(lǐng)