南开22年5月《网络爬虫与信息提取》在线作业参考非答案

[复制链接]
查看: 282|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
72280
发表于 2023-4-4 09:23:56 | 显示全部楼层 |阅读模式
答案来自:www.ybaotk.com
22春学期(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业


1.[单选题] 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。


答案资料下载请参考
说明


    A.字典


    B.集合的名字


    C.集合


    D.文档


    答:——B——


2.[单选题] Redis若要进入交互环境,需要打开终端输入()


    A.redis-cli


    B.redis


    C.redis-cmd


    D.redis-start


    答:——A——


3.[单选题] xpath中extract方法返回值类型是()


    A.列表


    B.元组


    C.字典


    D.集合


    答:——A——


4.[单选题] Scrapy自带的待爬队列是()


    A.deque


    B.queue


    C.list


    D.lqueue   
答案
整理


5.[单选题] 请问按哪个键可以打开Chrome自带的开发者工具()


    A.F10


    B.F1


    C.F11


    D.F12


6.[单选题] 服务器端记录信息确定用户身份的数据是


    A.session


    B.cookies


    C.moonpies


    D.localstorage


    答:————


7.[单选题] 以下关于Charles的说法正确的是( )


    A.Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包


    B.Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。


    C.Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。


    D.在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。


8.[单选题] MongoDB中数据存储的形式类似于()


    A.列表


    B.元组


    C.字典


    D.集合


    答:————


9.[单选题] 一般来说在页面传输登录信息都用HTTP()请求类型


    A.GET


    B.POST


    C.PUT


    D.SEND


10.[单选题] 使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。


    A.Redis


    B.RedisSpider


    C.Spider


    D.MongoDB


    答:————


11.[单选题] 当需要把Python里面的数据发送给网页时,需要先转换成()字符串


    A.Python


    B.Json


    C.正则表达式


    D.Ajax


    答:————


12.[单选题] lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据


    A.etree.tostring


    B.etree.convertBytes


    C.etree.toBytes


    D.etree.convertstring


    答:————


13.[单选题] Python中以下哪个容器里的元素不能重复()


    A.列表


    B.元组


    C.字典


    D.集合


    答:————


14.[单选题] 通常使用()工具来模拟浏览器进行爬虫请求


    A.Selenium


    B.Chrome


    C.ChromeDriver


    D.WebDriver


    答:————


15.[单选题] 下面Python代码输出为():

def default_para_trap(para=[], value=0):

    para.append(value)

    return para



print('第一步:{}'.format(default_para_trap(value=100)))



print('第二步:{}'.format(default_para_trap(value=50)))


    A.第一步:[100]

第二步:[100,50]


    B.第一步:[100]

第二步:[50]


    C.第一步:[100]

第二步:[]


    D.第一步:[100]

第二步:[100]


    答:————


16.[单选题] Python中若定义object=[1, 2, 3, 4, 5],则print(object[:3])输出()


    A.12


    B.123


    C.23


    D.234


17.[单选题] 使用Xpath构造属性值包含相同字符串的路径采用()方法


    A.contain


    B.contains


    C.include


    D.includes


18.[单选题] 使用UI Automatorr长按点击的操作是得到相应控件后使用命令()


    A.longclick


    B.long_click


    C.clicklong


    D.click_long


19.[单选题] HTTP常用状态码表明服务器上没有请求的资源的是()


    A.500


    B.503


    C.403


    D.404


    答:————


20.[单选题] Scrapy_redis是Scrapy的“()”,它已经封装了使用Scrapy操作Redis的各个方法


    A.组件


    B.模块


    C.控件


    D.单元


21.[多选题] Python中有哪些实现多线程方法()


    A.multiprocess.dummy


    B.threading.Thread


    C.process


    D.PyMongoDB


    答:————


22.[多选题] 最常见的HTTP请求类型有()


    A.GET


    B.POST


    C.SEND


    D.RECEIVE


    答:————


23.[多选题] Redis中的值可以支持()


    A.列表


    B.哈希


    C.集合


    D.有序集合


    答:————


24.[多选题] 常用的会话跟踪技术是


    A.session


    B.cookies


    C.moonpies


    D.localstorage


    答:————


25.[多选题] 以下哪种方法是MongoDB的查找方法()


    A.find


    B.find_one


    C.finds


    D.find_all


    答:————


26.[多选题] 针对解析源代码的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为()


    A.html


    B.html.parser


    C.lxml


    D.xml


    答:————


27.[多选题] Python中一个函数可以有()个return语句


    A.0


    B.1


    C.多个


    D.2


    答:————


28.[多选题] Python中的容器有()


    A.列表


    B.元组


    C.字典


    D.集合


    答:————


29.[多选题] Python中一个函数没有返回值则可以写()


    A.没有return


    B.return


    C.return None


    D.return NULL


    答:————


30.[多选题] 下列关于在IOS上配置charles的说法正确的是()


    A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。


    B.手机和电脑需要在同一个局域网下。


    C.HTTP代理可以使用“自动”选项。


    D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动


    答:————


31.[判断题] Python中使用下面代码打开文件也需要对文件进行close关闭操作

with open('文件路径', '文件操作方式', encoding='utf-8') as f


    A.对


    B.错


    答:————


32.[判断题] 在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。


    A.对


    B.错


    答:————


33.[判断题] Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。


    A.对


    B.错


    答:————


34.[判断题] 插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1


    A.对


    B.错


    答:————


35.[判断题] Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。


    A.对


    B.错


    答:————


36.[判断题] 使用Scrapyd,可以实现一键部署Scrapy爬虫,访问一个网址就启动/停止爬虫


    A.对


    B.错


    答:————


37.[判断题] Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;


    A.对


    B.错


    答:————


38.[判断题] 如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。


    A.对


    B.错


    答:————


39.[判断题] HTTP状态码302与307完全同义。


    A.对


    B.错


    答:————


40.[判断题] 如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。


    A.对


    B.错


41.[判断题] HTTP状态码302表示资源永久重定向。


    A.对


    B.错


    答:————


42.[判断题] 使用异步加载技术的网站,被加载的内容可以在源代码中找到


    A.对


    B.错


    答:————


43.[判断题] Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。


    A.对


    B.错


44.[判断题] 当运行爬虫代码后,出现"Forbidden by robots.txt"提示后,说明当前时间段被爬取的网站无法访问。


    A.对


    B.错


    答:————


45.[判断题] 在请求头中设置User-Agent即可正常请求网站


    A.对


    B.错


    答:————


46.[判断题] 爬虫中间件的激活需要另外写一个文件来进行


    A.对


    B.错


    答:————


47.[判断题] 在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis


    A.对


    B.错


    答:————


48.[判断题] 当使用Charles监控iOS设备或者Android设备的数据包以后,打开微信小程序,小程序的数据包不能自动被Charles抓住,需要另作处理。


    A.对


    B.错


49.[判断题] charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。


    A.对


    B.错


    答:————


50.[判断题] Python中写CSV文件的writerows方法参数为字典类型


    A.对


    B.错


    答:————






答案无忧答案网发布



答案来自:www.ybaotk.com

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x





上一篇:南开22年5月《网络安全技术》在线作业资料非答案
下一篇:南开22年5月《网络信息文献检索》在线作业_100分_1非答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图