千家信息网

怎么禁止网站内容被搜索引擎收录的几种方法

发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,这篇文章给大家分享的是有关怎么禁止网站内容被搜索引擎收录的几种方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。通常做网站的目标就是让搜索引擎收录,扩大推广面,但是如果你的
千家信息网最后更新 2024年11月22日怎么禁止网站内容被搜索引擎收录的几种方法

这篇文章给大家分享的是有关怎么禁止网站内容被搜索引擎收录的几种方法的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

通常做网站的目标就是让搜索引擎收录,扩大推广面,但是如果你的网站涉及个人隐私或者机密性非公开的网页而需要禁止搜索引擎收录抓取的话,该如何操作呢?比如淘宝网就是禁止搜索引擎收录的一个例子,本文将教你几种做法来实现屏蔽或禁止搜索引擎收录抓取网站的内容。

搜索引擎蜘蛛不断爬行互联网,如果我们网站没有做出禁止搜索引擎收录的操作,很容易就会被搜索引擎收录。那么下面介绍一下怎么样禁止搜索引擎收录网站内容。

第一种、robots.txt方法

搜索引擎默认的遵守robots.txt协议(不排除某些耍流氓的引擎),创建robots.txt文本文件放至网站根目录下,编辑代码如下:

User-agent: *
Disallow: /

通过以上代码,即可告诉搜索引擎不要抓取采取收录本网站,注意慎用如上代码:这将禁止所有搜索引擎访问网站的任何部分。

如果只禁止百度搜索引擎收录抓取网页

1、编辑robots.txt文件,设计标记为:

User-agent: Baiduspider
Disallow: /

以上robots文件将实现禁止所有来自百度的抓取。

这里说一下百度的user-agent,Baiduspider的user-agent是什么?

百度各个产品使用不同的user-agent:

  • 产品名称 对应user-agent

  • 无线搜索 Baiduspider

  • 图片搜索 Baiduspider-image

  • 视频搜索 Baiduspider-video

  • 新闻搜索 Baiduspider-news

  • 百度搜藏 Baiduspider-favo

  • 百度联盟 Baiduspider-cpro

  • 商务搜索 Baiduspider-ads

  • 网页以及其他搜索 Baiduspider

你可以根据各产品不同的user-agent设置不同的抓取规则,以下robots实现禁止所有来自百度的抓取但允许图片搜索抓取/image/目录:

User-agent: Baiduspider
Disallow: /

User-agent: Baiduspider-image
Allow: /image/

请注意:Baiduspider-cpro和Baiduspider-ads抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,这个就需要和百度的人联系才能解决了。

如何只禁止Google搜索引擎收录抓取网页,方法如下:

编辑robots.txt文件,设计标记为:

User-agent: googlebot
Disallow: /

第二种、网页代码方法

在网站首页代码与之间,加入代码,此标记禁止搜索引擎抓取网站并显示网页快照。

在网站首页代码与之间,加入即可禁止百度搜索引擎抓取网站并显示网页快照。

在网站首页代码与之间,加入即可禁止谷歌搜索引擎抓取网站并显示网页快照。

另外当我们的需求很怪异的时候,比如下面这几种情况:

1. 网站已经加了robots.txt,还能在百度搜索出来?

因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过投诉平台反馈请求处理。

2. 希望网站内容被百度索引但不被保存快照,我该怎么做?

Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。

3. 希望被百度索引,但是不保存网站快照,如下代码解决:

4. 如果要禁止所有的搜索引擎保存你网页的快照,那么代码就是下面的:

下面列出一些常用的代码组合:

  • :可以抓取本页,而且可以顺着本页继续索引别的链接

  • :不许抓取本页,但是可以顺着本页抓取索引别的链接

  • :可以抓取本页,但是不许顺着本页抓取索引别的链接

  • :不许抓取本页,也不许顺着本页抓取索引别的链接

感谢各位的阅读!关于"怎么禁止网站内容被搜索引擎收录的几种方法"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

搜索 引擎 搜索引擎 网站 网页 索引 代码 快照 内容 方法 数据 数据库 文件 链接 不同 之间 产品 就是 时间 标记 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 日本建立政府网络安全中心 建设数据库达到什么效果 聊城直播软件开发 个体工商户注册 软件开发 正规戴尔服务器高质量的选择 铁塔公司与网络安全 2020年全球网络安全形势 网络安全入我心感悟 幼儿园网络安全周宣传总结 有区块链技术还需要数据库吗 南京正规网络技术有哪些 数据库关系代数查询重名 临时搭建的服务器怎么转移 无代码软件开发复用成熟项目 电子商务使用网络技术划分为 贵阳软件开发园区 戴尔四核服务器 信息技术咨询软件开发 网络安全产业未来发展 ppdr网络安全模型的含义 职业规划确定目标软件开发 湖北数据库安全 湖州app软件开发平台有哪些 江阴互联网科技有限公司 西城电脑服务器回收选哪家 java 服务器端推送 疆界互联网科技有限公司基金 无线网络技术属于什么 软件开发前期得投多少钱 高斯数据库怎么配置白名单
0