[南开大学]21秋学期《网络爬虫与信息提取》在线作业-1

[复制链接]
查看: 641|回复: 2

4万

主题

4万

帖子

13万

积分

论坛元老

Rank: 8Rank: 8

积分
137661
发表于 2022-1-4 22:32:57 | 显示全部楼层 |阅读模式
答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com)网络爬虫与信息提取-[南开大学]21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业
试卷总分:100    得分:100
第1,Python操作CSV文件可通过容器的方式操作单元格
A、列表
B、元组
C、字典
D、集合
正确答案:


第2题,以下关于Charles的说法正确的是
A、Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包
B、Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。
C、Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。
D、在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。
正确答案:


第3题,Redis中写数据到列表中使用关键字
A、push
B、append
C、lpush
D、lappend
正确答案:


第4题,使用UIAutomator使屏幕向上滚动一屏的操作是得到相应控件后使用命令
A、scroll_forwad
B、scroll_up
C、scroll.forward
D、scroll.vert.forward
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),Python中若定义object=[12345]则printobject[4]输出
A、NULL
B、2
C、4
D、程序报错
正确答案:


第6题,Python中哪种容器一旦生成就不能修改
A、列表
B、元组
C、字典
D、集合
正确答案:


第7题,windows中创建定时任务的命令为
A、task
B、schtasks
C、createtasks
D、maketasks
正确答案:


第8题,参数headers=把请求头添加到Scrapy请求中使爬虫的请求看起来像是从浏览器发起的
A、HEADER
B、HEADERS
C、HEAD
D、BODY
正确答案:


第9题,Python中把列表转换为集合需要使用函数
A、set
B、list
C、convert
D、change
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),Redis中读取数据语句lrangechapter03那么表示读列表中个值
A、2
B、3
C、4
D、5
正确答案:


第11题,chrome默认打开开发者工具的快捷是
A、F5
B、F11
C、F12
D、F2
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的哪些数据是不可以爬取的
A、robot.txt
B、robot.html
C、robots.txt
D、robots.html
正确答案:


第13题,PyMongo中逻辑查询表示等于的符号是
A、$gt
B、$lt
C、$eq$$ne
正确答案:


第14题,使用Xpath获取文本使用
A、text
B、text()
C、content
D、content()
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),Python中以下哪个容器里的元素不能重复
A、列表
B、元组
C、字典
D、集合
正确答案:


第16题,HTTP状态码401表示
A、请求报文中可能存在语法错误
B、请求需要通过HTTP认证
C、请求资源的访问被拒绝
D、服务器上没有请求的资源
正确答案:


第17题,MongoDB中数据存储的形式类似于
A、列表
B、元组
C、字典
D、集合
正确答案:


第18题,HTTP常用状态码表明服务器上没有请求的资源的是
A、500
B、503
C、403
D、404
正确答案:


第19题,可以通过绕过网站登录
A、session
B、cookies
C、moonpies
D、localstorage
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),浏览器用来记录用户状态信息的数据叫
A、session
B、cookies
C、moonpies
D、selenium
正确答案:


第21题,如果目标网站有反爬虫声明那么对方在被爬虫爬取以后可以根据来起诉使用爬虫的公司
A、服务器日志
B、数据库日志记录
C、程序日志记录
D、服务器监控
正确答案:,B,C,D


第22题,requests中post请求方法的第二个参数可以为
A、字典
B、列表
C、json数据
D、字符串
正确答案:


第23题,BS4可以用来从中提取数据
A、HTML
B、XML
C、数据库
D、JSON
正确答案:,B


第24题,MongoDB中获取名字为db的库的语句为
A、client.db
B、client('db')
C、client['db']
D、client{'db'}
正确答案:,C


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),要使用tesseract来进行图像识别需要安装两个第三方库
A、requests
B、beautifulsoup
C、Pillow
D、pytesseract
正确答案:


第26题,Python中容器有推导式
A、列表
B、元组
C、字典
D、集合
正确答案:,C,D


第27题,网络爬虫的用途有
A、收集数据
B、尽职调查
C、提高流量
D、攻击服务器
正确答案:


第28题,cookies的缺点是
A、实现自动登录
B、跟踪用户状态
C、http中明文传输
D、增加http请求的流量
正确答案:,D


第29题,PyMongo删除操作有
A、delete
B、delete_all
C、delete_one
D、delete_many
正确答案:,D


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),下载器中间件的作用有哪些
A、更换代理IP
B、更换Cookies
C、更换User-Agent
D、自动重试
正确答案:,B,C,D


第31题,processspideroutputresponseresultoutput是在下载器中间件处理完成后马上要进入某个回调函数parsexxx前调用
T、对
F、错
正确答案:


第32题,processspiderinputresponsespider是在爬虫运行yielditem或者yieldscrapyRequest的时候调用
T、对
F、错
正确答案:F


第33题,在安装Scarpy的依赖库时由于VisualC++BuildTools的安装速度很慢为了节省时间可以和安装Twisted同时进行
T、对
F、错
正确答案:F


第34题,当Charles抓包以后在MacOS系统下可以按Command+F组合键在Windows系统下按Ctrl+F组合键打开Charles进行搜索
T、对
F、错
更多答案下载:雅宝题库QV同步1144766066网(www.ybaotk.com)


第35题,MongoDB是一个关系数据库产品
T、对
F、错
正确答案:F


第36题,RoboMongo是MongoDB的管理软件
T、对
F、错
更多答案下载:雅宝题库QV同步1144766066网(www.ybaotk.com)


第37题,UIAutomatorViewer与Pythonuiautomator可以同时使用
T、对
F、错
正确答案:F


第38题,需要实名认证的打码网站更加安全可靠
T、对
F、错
正确答案:F


第39题,PyMongoDB中排序方法sort第二个参数1表示降序
T、对
F、错
正确答案:F


第40题,代理中间件的可用代理列表一定要写在settingspy里面
T、对
F、错
正确答案:


第41题,在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致因为这样才能隐藏好自己达到获取数据的目的
T、对
F、错
正确答案:F


第42题,如果通过爬虫抓取某公司网站的公开数据分析以后发现这个公司业绩非常好于是将数据或者分析结果出售给某基金公司从而获得销售收入这是合法的
T、对
F、错
正确答案:


第43题,使用Charles可以轻松截获手机App和微信小程序的数据包从而开发出直接抓取App后台和小程序后台的爬虫
T、对
F、错
正确答案:


第44题,mitmproxy的强大之处在于它还自带一个mitmdump命令这个命令可以用来运行符合一定规则的Python脚本
T、对
F、错
更多答案下载:雅宝题库QV同步1144766066网(www.ybaotk.com)


第45题,当运行爬虫代码后出现"Forbiddenbyrobotstxt"提示后说明当前时间段被爬取的网站雅法访问
T、对
F、错
正确答案:


第46题,Python中直接对浮点数进行计算有print01+02则结果为03
T、对
F、错
正确答案:F


第47题,如果目标网站本身就是提供公众查询服务的网站那么使用爬虫是合法合规的
T、对
F、错
正确答案:


第48题,Linux环境中Virtualenv创建的虚拟Python环境中执行pip命令安装第三方库就不需要使用sudo命令了
T、对
F、错
正确答案:


第49题,通用搜索引擎的目标是尽可能大的网络覆盖率搜索引擎服务器资源与网络数据资源互相匹配
T、对
F、错
正确答案:


答案来源:雅宝题库QV同步1144766066网(www.ybaotk.com),requests中get请求方法的使用为requestsget'网址'data=data
T、对
F、错
正确答案:





上一篇:[南开大学]21秋学期《网络支付与电子银行》在线作业
下一篇:[南开大学]21秋学期《网络爬虫与信息提取》在线作业
回复

使用道具 举报

0

主题

3561

帖子

5342

积分

论坛元老

Rank: 8Rank: 8

积分
5342
发表于 2022-3-13 00:23:53 | 显示全部楼层
国家开放大学形考可以代做吗?
回复

使用道具 举报

0

主题

3489

帖子

5234

积分

论坛元老

Rank: 8Rank: 8

积分
5234
发表于 2022-3-13 02:56:39 | 显示全部楼层
中国医科大学作业有答案吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图