以前寫的一個PHP表單電子郵件發送程序,其中采用如下方法來驗證電子郵件地址格式是否正確:
代碼如下eregi("^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9_-]+.[a-z0-9_-]+.*", $email)
後來發現類似於將.誤寫為,的電子郵件地址也能通過驗證,例如user@126,com。經過檢查,發現它實際上只驗證了用戶名部分,所以又在網上找到一個教程,其中給出的例子如下:
代碼如下eregi('^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$',$email)
經過檢查,發現電子郵件地址user@126,com仍然能夠通過它的驗證。找到了一個示例:
代碼如下eregi("^[_.0-9a-z-]+@([0-9a-z][0-9a-z-]+.)+[a-z]{2,3}$",$str)
這個看起來更加合理一些,因為它對後綴名稱進行了驗證,盡管現在出現了4個字符以上的頂級域名,但是只需要稍加修改即可。不過電子郵件地址user@xxx,com 111cn.net仍然能夠通過驗證,仔細檢查後發現是因為沒有對.進行轉義導致。於是對它稍做修改:
代碼如下eregi("^[_.0-9a-z-]+@([0-9a-z][0-9a-z-]+.)+[a-z]{2,4}$)
雖然它對用戶名的檢查要更加寬松一些,但是現在使用它的效果似乎不錯。
例1
代碼如下<?php
function is_valid_email($email, $test_mx = false)
{
if(eregi("^([_a-z0-9-]+)(.[_a-z0-9-]+)*@([a-z0-9-]+)(.[a-z0-9-]+)*(.[a-z]{2,4})$", $email))
if($test_mx)
{
list($username, $domain) = split("@", $email);
return getmxrr($domain, $mxrecords);
}
else
return true;
else
return false;
}
?>
例2(自己寫的)
代碼如下function is_valid_email_address($email){
$qtext = '[^//x0d//x22//x5c//x80-//xff]';
$dtext = '[^//x0d//x5b-//x5d//x80-//xff]';
$atom = '[^//x00-//x20//x22//x28//x29//x2c//x2e//x3a-//x3c'.
'//x3e//x40//x5b-//x5d//x7f-//xff]+';
$quoted_pair = '//x5c[//x00-//x7f]';
$domain_literal = "//x5b($dtext|$quoted_pair)*//x5d";
$quoted_string = "//x22($qtext|$quoted_pair)*//x22";
$domain_ref = $atom;
$sub_domain = "($domain_ref|$domain_literal)";
$word = "($atom|$quoted_string)";
$domain = "$sub_domain(//x2e$sub_domain)*";
$local_part = "$word(//x2e$word)*";
$addr_spec = "$local_part//x40$domain";
return preg_match("!^$addr_spec$!", $email) ? 1 : 0;
}