首页 > 大学专科> 财经

题目内容（请给出正确答案）

[主观题]

关于网络爬虫协议文件robots.txt，说法错误的是:A一个网站可以放多个不同robots文件Brobots文件

关于网络爬虫协议文件robots.txt，说法错误的是:

A一个网站可以放多个不同robots文件

Brobots文件不可以用xml格式命名

Cdisallow用来描述不希望被访问到的一个URL

Drobots文件可以放在任何位置

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“关于网络爬虫协议文件robots.txt，说法错误的是:A一…”相关的问题

第1题

关于网络爬虫协议文件robots.txt，说法正确的是：Arobots.txt是搜索引擎中访问网站的时候要查看

关于网络爬虫协议文件robots.txt，说法正确的是：

Arobots.txt是搜索引擎中访问网站的时候要查看的第一个文件

Brobots.txt文件告诉蜘蛛程序在服务器上哪些文件不要被收录

Crobots文件不可以用xml格式命名

D一个网站可以放多个不同robots文件

点击查看答案

第2题

下面关于网络爬虫的描述正确的是（)。

A.网络爬虫由控制节点、爬虫节点和资源库构成

B.网络爬虫中可以有多个控制节点，每个控制节点下可以有多个爬虫节点

C.控制节点之间可以互相通信，控制节点和其下的各爬虫节点之间也可以进行互相通信

D.属于同一个控制节点下的各爬虫节点间不可以互相通信

点击查看答案

第3题

每个网站都有robots.txt文件。（)

点击查看答案

第4题

robots.txt文件主要放在网站根目录下。（)

点击查看答案

第5题

Robots优化一般是编写Robots.txt文件，然后把文件放在网站根目录。（)

点击查看答案

第6题

关于各种网络爬虫，以下说法不正确的是（)。

A、通用网络爬虫通常采用并行工作方式，但需要较长时间才能刷新一次页面。

B、通用网络爬虫适用于为搜索引擎搜索广泛的主题，有较强的应用价值。

C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。

D、增量式爬虫在需要的时候爬行新产生或发生更新的页面，并重新下载所有页面

点击查看答案

第7题

在为禁止搜索引擎抓取网页设计的Robots.txt文件中，nofollow指令标示禁止抓取。（）

点击查看答案

第8题

下面关于网络爬虫的描述错误的是()。

A.网络爬虫是一个自动提取网页的程序

B.为搜索引擎从万维网上下载网页，是搜索引擎的重要组成部分

C.爬虫从一个或若干个初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定停止条件

D.网络爬虫的行为和人们访问网站的行为是完全不同的

点击查看答案

第9题

在为禁止搜索引擎抓取网页设计的Robots.txt文件中，noindex指令标示禁止抓取。（）

点击查看答案

第10题

在为禁止搜索引擎抓取网页设计的Robots.txt文件中，哪些指令标示禁止抓取？（）

A.Allow

B.Disallow

C.nofollow

D.noindex

点击查看答案

湖南中本聪区块链科技有限公司版权所有 ©2024

湘ICP备20004669号-2 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）