萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> php編程 >> php權重計算方法代碼分享

php權重計算方法代碼分享

 權重計算,稍加修改亦可用於分詞,詞頻統計,全文和spam檢測等

代碼如下: <?php /* vim: set expandtab tabstop=4 shiftwidth=4: */ // +------------------------------------------------------------------------ //  Name       :   權重計算                                          //  Description:   稍加修改,亦可用於分詞,詞頻統計,全文檢索和垃圾檢測 //  Date       :   2013/12/16 08:51   class weight {     protected $aDict = array(array());     protected $aItems = array();     protected $sLastRule;     protected $aMatchs = array();     protected $aShow = array();    private function init() {   //清空記錄的匹配表和輸出結果   unset($this->aShow);  }       public function newItems($mItems) {   //導入新的項目   $this->aItems = (is_array($mItems))? $mItems: array($mItems);   $this->init();  }    public function newTable(array $aTable) {         //導入新的對照表,並生成字典         foreach($aTable as $iTableKey=>$sTableLine) {             $aTableLine = explode(',', str_replace('|', ',', $sTableLine));              $setter = function($v, $k, $paraMeter) {                 $k1 = $paraMeter[0]; $oWeight = $paraMeter[1];                 $oWeight->genDict($v, $k1);             };             array_walk($aTableLine, $setter, array($iTableKey, $this));         }         $this->init();  }       public function getShow($sRule = 'max') {   //獲取最終的顯示結果         if(empty($this->aItems) || empty($this->aDict))             return array();   if (empty($this->aShow) || $sRule != $this->sLastRule)              return $this->genShow($sRule);         return $this->aShow;  }       public function genShow($sRule) {         $aShow = array();         $aMatchs = array();   $getter = function($v, $k, $oWeight) use(&$aShow, &$aMatchs, $sRule) {    $t = array_count_values($oWeight->matchWord($v));             $aMatchs[] = $t;             switch ($sRule) {                 case 'max':                     $aShow[$k] = array_keys($t, max($t));                      break;             }   };   array_walk($this->aItems, $getter, $this);   $this->aShow = $aShow;   $this->aMatchs = $aMatchs;   return $aShow;     }       private function genDict($mWord, $iKey = '') {         $iInsertPonit = count($this->aDict);         $iCur = 0; //當前節點號         foreach (str_split($mWord) as $iChar) {             if (isset($this->aDict[$iCur][$iChar])) {                 $iCur = $this->aDict[$iCur][$iChar];                 continue;             }             $this->aDict[$iInsertPonit] = array();             $this->aDict[$iCur][$iChar] = $iInsertPonit;             $iCur = $iInsertPonit;             $iInsertPonit++;         }         $this->aDict[$iCur]['acc'][] = $iKey;        }           function matchWord($sLine) {             $iCur = $iOffset = $iPosition = 0;             $sLine .= "";             $iLen = strlen($sLine);             $aReturn = array();             while($iOffset < $iLen) {                 $sChar = $sLine{$iOffset};                 if(isset($this->aDict[$iCur][$sChar])) {                     $iCur = $this->aDict[$iCur][$sChar];                     if(isset($this->aDict[$iCur]['acc'])) {                         $aReturn = array_merge($aReturn, $this->aDict[$iCur]['acc']);                           $iPosition = $iOffset + 1;                         $iCur = 0;                     }                 } else {                     $iCur = 0;                     $iOffset = $iPosition;                     $iPosition = $iOffset + 1;                 }                 ++$iOffset;             }             return $aReturn;         } }   ?>       外部調用示例   代碼如下: $aItems = array(     'chinaisbig',     'whichisnot',     'totalyrightforme', ); $aTable = array(     'china,is|small',     'china,big|me',     'china,is|big,which|not,me',     'totaly|right,for,me', );   $oWeight = new ttrie; $oWeight->newItems($aItems); $aResult = $oWeight->newTable($aTable);  
copyright © 萬盛學電腦網 all rights reserved