這意味著Web日志收集的數據中會混有這部分數據。同時需要提醒的是,爬蟲對網站服務器的造訪僅僅為了下載抓取主要信息,網頁內容並不會像網友訪問時在浏覽器裡得以展示;換句話說,也就是此時網頁源代碼裡的JavaScript數據收集代碼是無法執行的。
3. 防火牆
由於防火牆的原理機制比較復雜,這裡就不做詳細解釋,有興趣的可以從維基百科或別的資源了解。
簡單的理解防火牆功能,可以認為它就是在網絡中根據信任程度的高低,控制來回傳送的數據流。它就像一張過濾網時刻監督過濾試圖通過它的數據流。
防火牆給網絡帶來安全的同時可能會阻止JavaScript腳本向數據收集服務器發送數據。這無疑又會使JavaScript標記丟失一部分流量。
二、 訪問者理想化
網站分析主要為了跟蹤訪問者在網站上的行動,但往往又被訪問者對個人電腦的行為所影響。也許這就是理想與現實的差距,因為你不能要求所有的網友都按照你想要的方式在網上遨游。
1. IP設置
Web日志收集數據時主要依靠訪問者的IP來區分唯一訪問者,但當下面這種動態的IP分配方式出現時收集的數據出現誤差就難免了。
一台機器使用不同的IP很可能會造成統計到的訪問者要比實際的多。可以看出網站分析工具統計出的其實並不是真實的訪問者人數,只不過是一個個IP或一個個浏覽器罷了。所以更不用說當多個人使用同一台電腦時能否被正確統計了。
2. JavaScript有效設置
有些訪問者為了確保安全可能會選擇關閉浏覽器裡的JavaScript有效設置,這樣失去的不止是一些網頁特效;對采用JavaScript標記的工具商來說,失去的還有這部分訪問者在目標網站上的所有行動記錄。
3. Cookie設置
(1)禁用Cookie
互聯網的普及將人們帶進全面的信息化社會,人們對個人信息的保護意識也逐漸強化起來。因為對隱私信息的敏感,一些人會選擇禁用Cookie。
(上圖可以看出Cookie的設置可以分為第一方Cookie和第三方Cookie兩種設置,至於兩種Cookie的區別有興趣的可以查閱網上資料)
離開Cookie,采用JavaScript標記將無法區分訪問次數和唯一身份訪問者人數,沒有這兩個基本度量,網站分析能做的也就不多了。所以說,Cookie的禁用對JavaScript標記收集數據是一個巨大打擊。