萬盛學電腦網

 萬盛學電腦網 >> CMS教程 >> 織夢DEDECMS robots文件設置的想法

織夢DEDECMS robots文件設置的想法

class="area"> 用織夢DEDECMS建站的站長會發現,DEDECMS自帶的robots.txt文件設置很簡單(開發者基於每個網站的目錄結構和優化目的不同的考慮),並不能完全滿足網站的優化要求,那怎樣才能結合自己網站的情況,做好robots.txt優化呢?以下介紹一點自己的想法,僅供參考。

  適用於未偽靜態的DEDECMS網站。

  User-agent: *

  Disallow: /dede 管理後台目錄,需要改名,具體設置後面具體講

  Disallow: /include 程序核心文件目錄

  Disallow: /member 會員管理目錄,有些文件可以開放

  Disallow: /plus 插件及輔助功能目錄 ,有些文件可以開放,如search.php

  Disallow: /templets 默認模板存放目錄

  Disallow: /data 系統緩存或其它可寫入數據存放目錄

  Disallow: /uploads 上傳下載文件保存目錄,不想搜索引擎引用圖片的話,禁止

  Disallow: /images 系統默認模板圖片存放目錄

  Disallow: /index.php 網站默認首頁,靜態化的話,最好禁止

  Disallow: /404.html

  Allow: /plus/search.php 開放禁止目錄裡的具體文件

  ...

  基本設置就是這樣,下面著重講下後台管理目錄和欄目頁的設置:

  1.dede目錄,為了網站安全考慮需要改名。然而改名之後,大家不免疑惑:改了名,在robots.txt文件裡怎麼設置呢?直接禁止抓取,還是洩露了後台目錄,等於改名無效。那麼該如何解決這個問題呢?我們可以通過下面的設置解決這個問題,如後台目錄為dedecms:

  Disallow: /d*ms

  這樣我們就能即禁止了搜索引擎的抓取,又不會洩露了後台目錄名稱。

  2.欄目頁。有些人會注意到,如果網站不做偽靜態優化的話,欄目分頁後會有兩個鏈接指向欄目首頁,如*/web/和*/web/list_1_1.html,為了網站優化,建議先將欄目分頁優化以下(具體做法大家可以在網上找),把首頁和第一頁的鏈接改為*/web/的形式,然後在robots.txt文件裡做以下設置:

  Disallow: /*1.html$

  以上就是DEDECMS robots.txt文件的設置,大家可以根據自己網站的情況具體設置。

  注意事項:

  1.按官方說明設置好目錄權限;

  2.後台目錄改後的名稱開頭字母和結尾字母不要和其他目錄一樣;

  3.用百度站長工具測試一下robots.txt文件設置是否有效。

copyright © 萬盛學電腦網 all rights reserved