中国大学moocpython爬虫技术辅导资料

[复制链接]
查看: 10|回复: 0

24万

主题

24万

帖子

34万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
341712
发表于 2025-3-20 17:30:39 | 显示全部楼层 |阅读模式
Python爬虫技术
学校: 无
问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为()
选项:

A. F12

B. F11

C. 鼠标右击,点“检查”

D. Ctrl+Shift+I
答案: F11
问题 2: 2. 下列不属于浏览器开发者模式面板的为()
选项:

A. Elements

B. Console

C. Sources

D. headers
答案: headers
问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是()
选项:

A. 元素面板可查看元素在页面的对应位置

B. 源代码面板可以查看HTML源码

C. 网络面板可以查看HTML源码

D. 网络面板可以查看HTTP头部信息
答案: 网络面板可以查看HTML源码
问题 4: 4. 爬虫爬取的是网站后台的数据。
选项:
答案: 错误
问题 5: 5. 下列robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着可以爬虫的网页
选项:
答案: 错误
问题 6: 6. 每个网站都有robots.txt文件
选项:
答案: 错误
问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 9: 1. 下列 Python库或模块中,支持正则表达式语法的是____。
选项:

A. bs4

B. lxml

C. re

D. json
答案: 请关注ybaotk.com搜题查看答案
问题 10: 2. 下列选取节点的表达式中,代表着从根节点开始选取的是____。
选项:

A. /

B. //

C. name

D. @
答案: 请关注ybaotk.com搜题查看答案
问题 11: 3. 下列选项中,属于非结构化数据的是:
选项:

A. 图像

B. HTML

C. XML

D. JSON
答案: 请关注ybaotk.com搜题查看答案
问题 12: 4. 下列选项中,属于结构化数据的是____。
选项:

A. 图像

B. 文本

C. 办公文档

D. JSON
答案: 请关注ybaotk.com搜题查看答案
问题 13: 5. 正则表达式字符集中,( )表示数字
选项:

A. \d

B. \D

C. \s

D. \w
答案: 请关注ybaotk.com搜题查看答案
问题 14: 6. python中,正则表达式需要引入的模式是( )
选项:

A. re

B. requests

C. os

D. bs4
答案: 请关注ybaotk.com搜题查看答案
问题 15: 7. 正则表达式“[^a-z]”,可以匹配下列的字符串为( )。
选项:

A. a

B. z

C. 2

D. m
答案: 请关注ybaotk.com搜题查看答案
问题 16: 8. 如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 17: 9. 创建 BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 18: 10. 在使用bs4库调用find()方法查找节点时,只能将字符串作为参数。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 19: 11. 路径表达式是唯一的,只能从根节点开始搜索。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 21: 1. 下列selenium库的方法中,通过元素名称进行多元素定位的是()
选项:

A. find_element_by_name

B. find_elements_by_name

C. find_elements_by_id

D. find_elements_by_class_name
答案: 请关注ybaotk.com搜题查看答案
问题 22: 2. 下列方法中,获取当前页渲染后的源代码是()
选项:

A. close()

B. quit()

C. page_source

D. title
答案: 请关注ybaotk.com搜题查看答案
问题 23: 3. 查看下面表单的示例程序:
...
若要使用WebDriver定位上述元素,可以使用如下()方法实现。
选项:

A. find_element_by_id

B. find_element_by_name

C. find_elements_by_link_text

D. find_elements_by_tag_name
答案: 请关注ybaotk.com搜题查看答案
问题 24: 4. seleinum支持浏览器的功能,可以直接被用来执行命令。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中,如果页面没有加载完,此方法会一直阻塞等待。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 26: 1. 下列关于python连接MySql数据库错误的为()
选项:

A. python2连接MySql数据库用到的库为MySqldb

B. python3连接MySql数据库用到的库为pymysql

C. python3连接MySql数据库的函数为connect

D. python3连接MySql数据库的函数为mysql
答案: 请关注ybaotk.com搜题查看答案
问题 27: 2. python3.在连接mysql数据库之前我们应先导入( )模块
选项:

A. MySQLdb

B. pymysql

C. mysql

D. re
答案: 请关注ybaotk.com搜题查看答案
问题 28: 3. python3可以使用MySqldb库,实现对MySql数据库的操作。
选项:
答案: 请关注ybaotk.com搜题查看答案

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x





上一篇:中国大学mooc_食品营养与食品安全辅导资料
下一篇:学起plus毛泽东思想和中国特色社会主义理论体系概论_毛泽东思想和中国特色社会主义理论体系概论2辅导资料
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图