精品国产三级国产av中文_亚洲欧美日韩高清综合678_久爱精品在线视频_在线免费观看污片_国产精品女丝袜白丝袜蕾丝_good手机在线观看_一级毛片成人午夜_久久国内日韩精品123_亚洲最大A∨无码网站最新_91精品国产剧情欧美一区二区

<ul id="kmyyw"></ul>

<fieldset id="kmyyw"><menu id="kmyyw"></menu></fieldset>

<strike id="kmyyw"><input id="kmyyw"></input></strike>

標題:網站優(yōu)化之Robots文件的作用及制作方法
日期:2019.01.15
位置:首頁>新聞> 優(yōu)化知識 >網站優(yōu)化之Robots文件的作用及制作方法

Robots協議（爬蟲協議）是國際互聯網界通行的道德規(guī)范，一般是在一個web站點的根目錄下寫的robots.txt文件，用來告知搜索引擎哪些頁面能被抓取，哪些頁面不能被抓取，可以屏蔽一些網站中比較大的文件，如：圖片，音樂，視頻等，節(jié)省服務器帶寬；可以屏蔽站點的一些死鏈接。方便搜索引擎抓取網站內容；設置網站地圖連接，方便引導蜘蛛爬取頁面，Robots是站點與spider溝通的重要渠道，站點通過robots文件聲明本網站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。

網站優(yōu)化之Robots文件作用及制作方法

robots.txt文件的格式

robots文件往往放置于根目錄下，包含一條或更多的記錄，在該文件中可以使用#進行注解，具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始，后面加上若干Disallow和Allow行,詳細情況如下：

User-agent:該項的值用于描述搜索引擎robot的名字。在"robots.txt"文件中，如果有多條User-agent記錄說明有多個robot會受到"robots.txt"的限制，對該文件來說，至少要有一條User-agent記錄。如果該項的值設為*，則對任何robot均有效，在"robots.txt"文件中，"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中，加入"User-agent:SomeBot"和若干Disallow、Allow行，那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:該項的值用于描述不希望被訪問的一組URL，這個值可以是一條完整的路徑，也可以是路徑的非空前綴，以Disallow項的值開頭的URL不會被 robot訪問。例如"Disallow:/help"禁止robot訪問/help.html、/helpabc.html、/help/index.html，而"Disallow:/help/"則允許robot訪問/help.html、/helpabc.html，不能訪問/help/index.html。"Disallow:"說明允許robot訪問該網站的所有url，在"/robots.txt"文件中，至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件，則對于所有的搜索引擎robot，該網站都是開放的。

Allow:該項的值用于描述希望被訪問的一組URL，與Disallow項相似，這個值可以是一條完整的路徑，也可以是路徑的前綴，以Allow項的值開頭的URL 是允許robot訪問的。例如"Allow:/hibaidu"允許robot訪問/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一個網站的所有URL默認是Allow的，所以Allow通常與Disallow搭配使用，實現允許訪問一部分網頁同時禁止訪問其它所有URL的功能。

使用"*"and"$"：Baiduspider支持使用通配符"*"和"$"來模糊匹配url。

"*" 匹配0或多個任意字符

"$" 匹配行結束符。

robots.txt文件書寫舉例：

1. 允許所有的robot訪問

User-agent: * Allow: / 或者 User-agent: * Disallow:

2. 禁止所有搜索引擎訪問網站的任何部分

User-agent: *

Disallow: /

3. 僅禁止Baiduspider訪問您的網站

User-agent: Baiduspider

Disallow: /

4. 僅允許Baiduspider訪問您的網站

User-agent: Baiduspider

Disallow:

5. 禁止spider訪問特定目錄

User-agent: *

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /~joe/

6. 允許訪問特定目錄中的部分url

User-agent: *

Allow: /cgi-bin/see

Allow: /tmp/hi

Allow: /~joe/look

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /~joe/

7. 使用”*”限制訪問url，禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。

User-agent: *

Disallow: /cgi-bin/*.htm

8. 使用”$”限制訪問url，僅允許訪問以”.htm”為后綴的URL。

User-agent: *

Allow: .htm$

Disallow: /

9. 禁止訪問網站中所有的動態(tài)頁面

User-agent: *

Disallow: /*?*

10. 禁止Baiduspider抓取網站上所有圖片，僅允許抓取網頁，禁止抓取任何圖片。

User-agent: Baiduspider

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

11. 僅允許Baiduspider抓取網頁和.gif格式圖片，允許抓取網頁和gif格式圖片，不允許抓取其他格式圖片

User-agent: Baiduspider

Allow: .gif$

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .png$

Disallow: .bmp$

12. 僅禁止Baiduspider抓取.jpg格式圖片

User-agent: Baiduspider

總結：最后需要說明的是：百度會嚴格遵守robots的相關協議，請注意區(qū)分您不想被抓取或收錄的目錄的大小寫，百度會對robots中所寫的文件和您不想被抓取和收錄的目錄做精確匹配，否則robots協議無法生效。

轉載請注明來自：http://etongjin.cn/news/sitenews/80729.html

標簽：網站優(yōu)化 Robots 海之睿

將文章分享到..

熱門文章

Are You Interested ？

感興趣嗎？
與我們聯系了解更多吧

有一個互聯網項目想和我們談談嗎？您可以填寫右邊的表格，讓我們了解您的項目需求，這是一個良好的開始，我們將會盡快與你取得聯系。當然也歡迎您給我們寫信或是打電話，讓我們聽到你的聲音！

網站服務熱線：400-710-6678
郵箱服務熱線：400-799-9163
電話：0510-88100198 渠道：0510-80211762
地址：無錫市濱湖區(qū)蠡湖大道2018號普信copo 3棟810室
E-mail：fuwu@haizr.com

關于海之睿

+

海之睿成立于2011年4月，致力于提供高品質網站建設、響應式網站制作、營銷型網站制作及網站SEO優(yōu)化推廣等服務，服務客戶超4000+家，我們的目標是將“海之睿”打造成網站建設、品牌形象設計、網絡營銷推廣行業(yè)的領導品牌！

我們的優(yōu)勢

+

8年建站服務經驗

服務4000+家企業(yè)

服務50+家上市企業(yè)

服務行業(yè)龍頭超過100+家

自主獨立開發(fā)MVC睿云建站平臺

可視化操作界面易于維護

三層架構設計物理分離

網頁設計與網站開發(fā)技術并重

我們的理念

+

對客戶：以客戶為中心,秉承“客戶為本”的服務宗旨。
對員工：共享知識、共享利益、實現自身價值。
對公司：以精致經營及至精致服務，成為行業(yè)翹楚。
對社會：誠信、感恩，企業(yè)進步的同時用行動回饋社會。

Copyright 無錫海之睿計算機科技有限公司 All Rights Reserved. 【網頁制作與開發(fā)-海之睿您的明智選擇！】技術支持：無錫網站建設

備案號：蘇ICP備13048893號

<fieldset id="ww0mk"><menu id="ww0mk"></menu></fieldset><fieldset id="ww0mk"></fieldset>

<strike id="ww0mk"><input id="ww0mk"></input></strike>