奥鹏南开大学22春学期《网络爬虫与信息提取》在线作业答案-1

[复制链接]
查看: 348|回复: 0

5万

主题

8万

帖子

18万

积分

论坛元老

Rank: 8Rank: 8

积分
189366
发表于 2022-5-5 14:27:21 | 显示全部楼层 |阅读模式
答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com)网络爬虫与信息提取-[奥鹏南开大学]22春学期(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业答案
试卷总分:100    得分:100
第1,如果使用Python的数据结构来做类比的话MongoDB中库相当于一个大字典大字典里面的每一个键值对都对应了一个集合Key为Value就是一个集合
A、字典
B、集合的名字
C、集合
D、文档
正确答案:


第2题,Redis若要进入交互环境需要打开终端输入
A、redis-cli
B、redis
C、redis-cmd
D、redis-start
正确答案:


第3题,xpath中extract方法返回值类型是
A、列表
B、元组
C、字典
D、集合
正确答案:


第4题,Scrapy自带的待爬队列是
A、deque
B、queue
C、list
D、lqueue
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),请问按哪个键可以打开Chrome自带的开发者工具
A、F10
B、F1
C、F11
D、F12
正确答案:


第6题,服务器端记录信息确定用户身份的数据是
A、session
B、cookies
C、moonpies
D、localstorage
正确答案:


第7题,以下关于Charles的说法正确的是
A、Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包
B、Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。
C、Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。
D、在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。
正确答案:


第8题,MongoDB中数据存储的形式类似于
A、列表
B、元组
C、字典
D、集合
正确答案:


第9题,一般来说在页面传输登录信息都用HTTP请求类型
A、GET
B、POST
C、PUT
D、SEND
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),使用了RedisSpider作为爬虫的父类以后爬虫会直接监控中的数据并不读取starturls中的数据
A、Redis
B、RedisSpider
C、Spider
D、MongoDB
正确答案:


第11题,当需要把Python里面的数据发送给网页时需要先转换成字符串
A、Python
B、Json
C、正则表达式
D、Ajax
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),lxml库中etree模块的方法把Selector对象转换为bytes型的源代码数据
A、etree.tostring
B、etree.convertBytes
C、etree.toBytes
D、etree.convertstring
正确答案:


第13题,Python中以下哪个容器里的元素不能重复
A、列表
B、元组
C、字典
D、集合
正确答案:


第14题,通常使用工具来模拟浏览器进行爬虫请求
A、Selenium
B、Chrome
C、ChromeDriver
D、WebDriver
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),下面Python代码输出为
defdefaultparatrappara=[]value=0paraappendvaluereturnparaprint'第一步{}'formatdefaultparatrapvalue=100print'第二步{}'formatdefaultparatrapvalue=50
A、第一步:[100]
第二步:[100,50]
B、第一步:[100]
第二步:[50]
C、第一步:[100]
第二步:[]
D、第一步:[100]
第二步:[100]
正确答案:


第16题,Python中若定义object=[12345]则printobject[3]输出
A、12
B、123
C、23
D、234
正确答案:


第17题,使用Xpath构造属性值包含相同字符串的路径采用方法
A、contain
B、contains
C、include
D、includes
正确答案:


第18题,使用UIAutomatorr长按点击的操作是得到相应控件后使用命令
A、longclick
B、long_click
C、clicklong
D、click_long
正确答案:


第19题,HTTP常用状态码表明服务器上没有请求的资源的是
A、500
B、503
C、403
D、404
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),Scrapyredis是Scrapy的""它已经封装了使用Scrapy操作Redis的各个方法
A、组件
B、模块
C、控件
D、单元
正确答案:


第21题,Python中有哪些实现多线程方法
A、multiprocess.dummy
B、threading.Thread
C、process
D、PyMongoDB
正确答案:


第22题,最常见的HTTP请求类型有
A、GET
B、POST
C、SEND
D、RECEIVE
正确答案:


第23题,Redis中的值可以支持
A、列表
B、哈希
C、集合
D、有序集合
正确答案:,B,C,D


第24题,常用的会话跟踪技术是
A、session
B、cookies
C、moonpies
D、localstorage
正确答案:,B


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),以下哪种方法是MongoDB的查找方法
A、find
B、find_one
C、finds
D、find_all
正确答案:


第26题,针对解析源代码的BeautifulSoup对象构造时BeautifulSoup网页源代码'解析器'中的解析器可以为
A、html
B、html.parser
C、lxml
D、xml
正确答案:


第27题,Python中一个函数可以有个return语句
A、0
B、1
C、多个
D、2
正确答案:,B,C,D


第28题,Python中的容器有
A、列表
B、元组
C、字典
D、集合
正确答案:


第29题,Python中一个函数没有返回值则可以写
A、没有return
B、return
C、return None
D、return NULL
正确答案:,B,C


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),下列关于在IOS上配置charles的说法正确的是
A、不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B、手机和电脑需要在同一个局域网下。
C、HTTP代理可以使用"自动"选项。
D、安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案:,D


第31题,Python中使用下面代码打开文件也需要对文件进行close关闭操作
withopen'文件路径''文件操作方式'encoding='utf8'asf
T、对
F、错
正确答案:


第32题,在charles中使用CTRL+F搜索JSON里面的中文是可以直接搜索到的
T、对
F、错
正确答案:F


第33题,Scrapy每一次发起请求之前都会在这里检查网址是否重复因此如果确实需要再一次爬取数据在Redis中把这个Key删除即可
T、对
F、错
正确答案:


第34题,插入数据时MongoDB会自动添加一列"id"也就是自增ID每次自动加1
T、对
F、错
正确答案:F


第35题,Python正则表达式中"*"是贪婪模式获取最长的满足条件的字符串
T、对
F、错
正确答案:


第36题,使用Scrapyd可以实现一键部署Scrapy爬虫访问一个网址就启动/停止爬虫
T、对
F、错
正确答案:


第37题,Python中元组生成以后还可以往里面继续添加数据也可以从里面删除数据
T、对
F、错
正确答案:


第38题,如果目标网站本身就是提供公众查询服务的网站那么使用爬虫是合法合规的
T、对
F、错
正确答案:


第39题,HTTP状态码302与307完全同义
T、对
F、错
正确答案:


第40题,如果元组里面只有整数、浮点数、字符串、一个列表就既不能添加数据也不能删除数据还不能修改里面数据的值
T、对
F、错
正确答案:F


第41题,HTTP状态码302表示资源永久重定向
T、对
F、错
正确答案:F


第42题,使用异步加载技术的网站被加载的内容可以在源代码中找到
T、对
F、错
正确答案:F


第43题,Python中条件语句在使用and连接的多个表达式中只要有一个表达式不为真那么后面的表达式就不会执行
T、对
F、错
正确答案:


第44题,当运行爬虫代码后出现"Forbiddenbyrobotstxt"提示后说明当前时间段被爬取的网站雅法访问
T、对
F、错
正确答案:


第45题,在请求头中设置UserAgent即可正常请求网站
T、对
F、错
正确答案:F


第46题,爬虫中间件的激活需要另外写一个文件来进行
T、对
F、错
正确答案:F


第47题,在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redisserverexerediswindowsconf启动Redis
T、对
F、错
正确答案:F


第48题,当使用Charles监控iOS设备或者Android设备的数据包以后打开微信小程序小程序的数据包不能自动被Charles抓住需要另作处理
T、对
F、错
正确答案:


第49题,charles配置中安装完成证书以后在设置中打开"关于本机"找到最下面的"证书信任设置"并在里面启动对Charles证书的完全信任
T、对
F、错
更多答案下载:雅宝题库QV同步1144766066网(www.ybaotk.com)


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),Python中写CSV文件的writerows方法参数为字典类型
T、对
F、错
正确答案:F





上一篇:奥鹏南开大学22春学期《网络支付与电子银行》在线作业答案
下一篇:奥鹏南开大学22春学期《网络爬虫与信息提取》在线作业答案-2
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图