為了防采集,真的是想了很多的辦法,之前限制ip,目前基本完成,思路說下:在單位時間內裡,比如一分鐘內浏覽的頁面數超過限制,則等待,最後當總的浏覽頁數達到設定的當天限額,則鎖定ip,還有待進一步的調整,現在再來考慮內容頁中加入隨機字符,來打亂采集者采集的數據!
附上兩個隨機字符串的代碼,各有特色,看您怎麼來使用,達到合理的效果。
第一段:
function rand_string($len = 30, $type = ”, $addChars = ”) {
$str = ”;
switch ($type) {
case 0 :
$chars = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz’ . $addChars;
break;
case 1 :
$chars = str_repeat ( ’0123456789′, 3 );
break;
case 2 :
$chars = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZ’ . $addChars;
break;
case 3 :
$chars = ‘abcdefghijklmnopqrstuvwxyz’ . $addChars;
break;
default :
// 默認去掉了容易混淆的字符oOLl和數字01,要添加請使用addChars參數
$chars = ‘ABCDEFGHIJKMNPQRSTUVWXYZabcdefghijkmnpqrstuvwxyz23456789′ . $addChars;
break;
}
if ($len > 10) { //位數過長重復字符串一定次數
$chars = $type == 1 ? str_repeat ( $chars, $len ) : str_repeat ( $chars, 5 );
}
if ($type != 4) {
$chars = str_shuffle ( $chars );
$str = substr ( $chars, 0, $len );
} else {
//隨機字
for($i = 0; $i < $len; $i ++) {
$str .= msubstr ( $chars, floor ( mt_rand ( 0, mb_strlen ( $chars, ‘utf-8′ ) – 1 ) ), 1 );
}
}
return $str;
}
echo rand_string();
第二段代碼:
function generateWeirdStr($var){
$table=’ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789′;
$len=rand(30,30+$var);
$text=”;
for($i=0;$i<$len;$i++){
$ch=$table[rand(0,61)];
$text.=$i>0? ‘|’.$ch: $ch;
}
return $text;
}
echo generateWeirdStr(15);
活用這兩段代碼,可以達到合理的效果!