关于各种网络爬虫,以下说法不正确的是()。
A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
关于网络爬虫协议文件robots.txt,说法错误的是:
A一个网站可以放多个不同robots文件
Brobots文件不可以用xml格式命名
Cdisallow用来描述不希望被访问到的一个URL
Drobots文件可以放在任何位置
A.比较适合垂直搜索或站内搜索
B.处于较浅目录层次的页面都可以首先被爬行
C.爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接,直到所有链接遍历完
D.其基本方法是按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止
关于网络爬虫协议文件robots.txt,说法正确的是:
Arobots.txt是搜索引擎中访问网站的时候要查看的第一个文件
Brobots.txt文件告诉蜘蛛程序在服务器上哪些文件不要被收录
Crobots文件不可以用xml格式命名
D一个网站可以放多个不同robots文件
A.蜘蛛就是搜索引擎的网络爬虫
B.每个搜索引擎蜘蛛名称不同
C.网站被搜索引擎降权后蜘蛛永远不会光临此网站
D.站长可以通过技术等优化来吸引蜘蛛爬行抓取
A.全数据库结构备份是指备份网络管理使用的所有数据库的结构(包括库中所有数据库对象的结构)
B.网络管理不能通过系统备份任务定期自动备份基础数据和整个数据库结构。它只能手动执行数据库备份任务
C.网络管理提供了查询和监控数据库使用和各种表空间信息的功能。方法如下:主菜单->维护->系统监控
D.基础数据备份是指备份网络管理的所有基础数据,只备份数据记录,不包括历史数据答案,如表结构和历史报警、通知、日志和性能原始数据
A.物理安全风险包括火灾、水灾、地震等环境事故,造成整个系统毁灭
B.网络层面的安全风险包括系统弱点被暴露而招致攻击
C.主机层面的安全风险包括计算机病毒的侵害
D.应用安全是指用户在网络上运行的业务应用系统、办公应用系统及其他各种在线应用系统的安全。
A.社会网络是指社会成员之间通过各种关系结成的网络体系。
B.社会网络中的个体也称为节点,既可以是组织、个人等实体,也可以是网络标识等具有不同含义的虚拟个体。
C.社交网络呈现出典型的小世界特性和扩散效应。
D.社交网络呈现较为明显的社区结构,这会对信息的传播形成某种推动,但不会产生制约。
A.网络爬虫由控制节点、爬虫节点和资源库构成
B.网络爬虫中可以有多个控制节点,每个控制节点下可以有多个爬虫节点
C.控制节点之间可以互相通信,控制节点和其下的各爬虫节点之间也可以进行互相通信
D.属于同一个控制节点下的各爬虫节点间不可以互相通信