答疑解惑: 網(wǎng)站建設; 程序開發(fā); 網(wǎng)絡安全

網(wǎng)站建設網(wǎng)站建設（企業(yè)形象網(wǎng)站）以展示企業(yè)形象為主，我們通過對企業(yè)信...
商務平臺電子商務平臺即是一個為企業(yè)或個人提供網(wǎng)上交易洽談的平臺。企業(yè)...
程序開發(fā)按照您的需求做您想的功能型網(wǎng)站，只要符合邏輯，沒有實現(xiàn)不了的...
APP開發(fā)App開發(fā)，是指專注于手機應用軟件開發(fā)與服務。 App是ap...
網(wǎng)站托管我們將為您的網(wǎng)站進行托管服務，主要技術維護、程序修復、定期檢...

網(wǎng)絡安全

什么是robots，怎么寫法？

作者：立絡科技2023-09-05訪問量：1419

我們了解過什么是搜索引擎蜘蛛后，就應該了解下什么是robots.txt，因為前面介紹搜索引擎蜘蛛是按照鏈接爬行的，有的時候我不希望搜索引擎蜘蛛爬行并抓取，比如網(wǎng)站后臺文件，如果地址被抓取暴露出來，那后果不是很嚴重嗎？那么是否有制約搜索引擎蜘蛛的規(guī)則或文件呢？
m.9odu.com

什么是robots.txt

當搜索引擎爬行到某個網(wǎng)站的時候，首先第一查看的文件就是robots.txt，查看是否存在，如果存在那么網(wǎng)站的哪些文件不允許爬行，就像道路交通一樣，某些道路無法通行。而robots.txt就像交警的存在，明確指示著某條道路不能通行，如果不存在，那么網(wǎng)站所有頁面將均可以被蜘蛛爬行并收錄。

robots.txt的寫法

robots.txt必須放置在一個站點的根目錄下，而且文件名必須全部小寫。格式例如：

User-agent: *
Disallow: /admin/ <后臺管理文件>
Disallow: /require/ <程序文件>
Disallow: /attachment/ <附件>
Disallow: /images/ <圖片>
Disallow: /data/ <數(shù)據(jù)庫文件>
Disallow: /template/ <模板文件>
Disallow: /css/ <樣式表文件>
Disallow: /lang/ <編碼文件>
Disallow: /script/ <腳本文件>

? User-Agent: 遵守的規(guī)則
? Disallow: 要攔截的網(wǎng)頁

上一篇：刪除域名的規(guī)律和域名狀態(tài)解釋: 下一篇：什么是網(wǎng)站統(tǒng)計？

av无码天堂一区二区三区App|欧美日韩亚洲综合色欲|欧美老外A片99久久免费观看|欧美牲交a欧美牲交一级aa|

立絡科技

什么是robots，怎么寫法？

立絡科技

什么是robots，怎么寫法？