首先我們要了解和監(jiān)控網(wǎng)站的訪問情況,通常需要記錄和統(tǒng)計網(wǎng)站流量的基礎(chǔ)數(shù)據(jù),但是隨著網(wǎng)站在技術(shù)和運營上不斷發(fā)展,人們對數(shù)據(jù)的要求越來越高,以求實現(xiàn)更加精細(xì)的運營來提升網(wǎng)站的質(zhì)量,所以網(wǎng)站的數(shù)據(jù)獲取方式也隨著網(wǎng)站技術(shù)的進(jìn)步和人們對網(wǎng)站數(shù)據(jù)需求的加深而不斷的發(fā)展。 在網(wǎng)站分析中我們?nèi)绻@得網(wǎng)站的數(shù)據(jù)?下面深圳市博納網(wǎng)絡(luò)信息技術(shù)有限公司(https://www.)講解常見的數(shù)據(jù)獲取方法: 第一種方法:網(wǎng)站日志文件 記錄網(wǎng)站日志文件的方式是最原始的數(shù)據(jù)獲取方式,主要在服務(wù)端完成,在網(wǎng)站的應(yīng)用服務(wù)器配置相應(yīng)的寫日志的功能能實現(xiàn)。 網(wǎng)站的應(yīng)用服務(wù)器輸出的日志所記錄的其實是用戶終端為了滿足用戶的訪問需要,對服務(wù)器發(fā)起的所有的資源請求,這些資源請求不僅包含頁面請求,頁面展現(xiàn)的所有相關(guān)元素請求也會被記錄,如圖片、CSS、文件(Flash、視頻、音樂等),另外一些iframe也會被當(dāng)成請求記錄。所以原始的日志文件記錄了很多統(tǒng)計中用不到的內(nèi)容,這些內(nèi)容產(chǎn)生的篩選和過濾工作帶來了巨大成本,同時導(dǎo)致了統(tǒng)計數(shù)據(jù)的不準(zhǔn)確。日志文件的另外一個缺陷就是由于數(shù)據(jù)獲取在服務(wù)端進(jìn)行,很多用戶在頁面端的操作(如點擊、Ajax的使用等)無法被記錄,限制了一些指標(biāo)的統(tǒng)計和計算。 第二種方法:web beacons 為了避免網(wǎng)站日志文件形式給應(yīng)用服務(wù)器帶來的額外壓力,以及過量的日志記錄導(dǎo)致數(shù)據(jù)篩選過濾的成本,于是就出現(xiàn)了WebBeacons的數(shù)據(jù)獲取方式,貌似還沒有正規(guī)的中文翻譯,一般被稱為打點。WebBeacons的實現(xiàn)方式是在需要統(tǒng)計的網(wǎng)站頁面或者模塊上嵌入一個1×1像素的透明圖片,用戶完全察覺不到,當(dāng)用戶訪問該網(wǎng)頁的同時會請求透明圖片,并完成頁面訪問的記錄工作,就像是在紙上畫了一個不易看到的小點來標(biāo)記那張紙。 WebBeacons的方式實現(xiàn)了日志記錄服務(wù)器與網(wǎng)站應(yīng)用服務(wù)器的分離,使用獨立的日志記錄和處理服務(wù)器避免了應(yīng)用服務(wù)器的額外壓力,而且可控的圖片嵌入方式大幅度降低了日志記錄數(shù)(對于一般的網(wǎng)站頁面而言,當(dāng)請求一個頁面時,傳統(tǒng)網(wǎng)站日志記錄數(shù)是6到10條,也就是說,使用WebBeacons的方式記錄的日志數(shù)量大約只有原始服務(wù)器日志的1/8,傳統(tǒng)的流量統(tǒng)計工具如AWStats、Webalizer等用Hits這個指標(biāo)來記錄原始記錄數(shù),一般是正常頁面瀏覽PV的6到10倍,對于某些復(fù)雜的站點甚至是20多倍),保證了數(shù)據(jù)統(tǒng)計的效率和準(zhǔn)確性。 而WebBeacons的最大劣勢就是獲取信息的有限性,尤其是記錄的來源頁面(Referral)為圖片所在的頁面,而不是該頁面的前一個頁面,同時由于與網(wǎng)站應(yīng)用服務(wù)器分離,用戶cookie等信息的記錄也有可能丟失。所以單純使用WebBeacons的形式無法完全獲取網(wǎng)站分析指標(biāo)需要的信息,于是就出現(xiàn)了JS頁面標(biāo)記。 第三種方法:JS頁面標(biāo)記 JS頁面標(biāo)記同樣是對WebBeacons的改進(jìn),彌補WebBeacons在信息獲取上的不足。JS頁面標(biāo)記同樣需要在頁面端進(jìn)行處理,只是嵌入的不再是圖片,而是JS標(biāo)記代碼,當(dāng)用戶訪問網(wǎng)頁時同時出發(fā)并執(zhí)行JS代碼,JS代碼會將一些統(tǒng)計需要的信息以URL參數(shù)的形式附帶在圖片請求地址的后面,然后再向日志服務(wù)器請求圖片,這樣日志服務(wù)器就可以獲取比較完整的訪問數(shù)據(jù)。 JS頁面標(biāo)記數(shù)據(jù)獲取方式JS頁面標(biāo)記的方式具備了數(shù)據(jù)獲取的靈活性和可控性,以及獲取信息的完整性等優(yōu)勢,同時可以監(jiān)控頁面端的各種操作,如點擊、Ajax等,唯一的缺點就是當(dāng)用戶禁用JS功能時,所有的信息將無法獲取。 |
|