robots是什么?robots.txt怎么写?

释放双眼,带上耳机,听听看~!

一、什么是robots.txt?

robots是网站和搜索引擎协议的纯文本文件,当一个搜索引擎蜘蛛来访问站点的时候,首先爬行检查根目录是否存在这个文件。如果存在的话,那么就会根据文件的内容来确定访问范围,如果没有的话蜘蛛就会沿着链接进行抓取,robots放在项目的根目录下。

二、 robots.txt基本语法:

1、允许所有搜索引擎访问网站的所有部分,robots.txt写法如下

Useragent:*Disallow:或者Useragent:*Allow:/

注意: 1. 首个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

2 、禁止所有搜索引擎访问网站的所有部分

robots.txt写法如下:

Useragent:*Disallow:/

3 、只需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引

robots.txt写法如下:

Useragent:*Disallow:/css/Disallow:/admin/Disallow:/images/

注意:路径后面有斜杠和没有斜杠的区别:比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽

4、屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main

robots.txt写法如下:

Useragent:*Disallow:/templetsAllow:/main

5、 禁止访问/html/目录下的所有以”.php”为后缀的URL(包含子目录)

robots.txt写法如下:

Useragent:*Disallow:/html/*.php

6、 仅允许访问某目录下某个后缀的文件,则使用“$”

robots.txt写法如下:

Useragent:*Allow:.html$Disallow:/

7、禁止索引网站中所有的动态页面

比如这里限制的是有“?”的域名,例如index.php?id=1

robots.txt写法如下:

Useragent:*Disallow:/*?*

8、 禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加)

有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还 可以采取直接屏蔽图片后缀名的方式。

robots.txt写法如下:

Useragent:*Disallow:.jpg$Disallow:.jpeg$Disallow:.gif$Disallow:.png$Disallow:.bmp$

三、写robots.txt要注意的地方:

1)、 首个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

2.)、斜杠:/ 代表整个网站

3)、如果“/”后面多了一个空格,则屏蔽整个网站

4)、不要禁止正常的内容

5)、生效时间是几天到两个月

四、robots.txt文件对网站优化有什么作用?

1、疾速增加网站权重和拜访量;

2、制止某些文件被查找引擎索引,能够节约服务器带宽和网站拜访速度;

3、为查找引擎供给一个简洁明了的索引环境

声明:本站所有文章,如无特殊说明或标注,均来自于互联网,下载的软件和资源请在24小时之内删除,本站提供的资源只可作为下载、学习交流使用,其版权归原作者所有,其产生的任何后果均自己承担,本站不作任何责任承担,具体可查看本站免责声明。如已声明或标注原创,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,客服链接:点此前往,投诉邮箱:nc08wlkj@163.com

给TA赞赏
共{{data.count}}人
人已赞赏
编程代码

各大常见搜索引擎提交入口地址,搜索引擎提交网址收录地址大全

2024-4-16 18:19:20

编程代码

SPlayer – ? 一个简约的在线音乐播放器,支持网易云音乐账号登录,逐字歌词,下载歌曲,展示评论区,音乐频谱,音乐云盘及歌单管理,移动端基础适配

2024-4-16 18:21:45

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索