中国大学moocpython爬虫技术辅导资料

1144766066 · 发表于 2025-3-20 17:30:39

Python爬虫技术
学校: 无
问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为（）
选项:
•
A. F12
•
B. F11
•
C. 鼠标右击，点“检查”
•
D. Ctrl+Shift+I
答案: F11
问题 2: 2. 下列不属于浏览器开发者模式面板的为（）
选项:
•
A. Elements
•
B. Console
•
C. Sources
•
D. headers
答案: headers
问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是（）
选项:
•
A. 元素面板可查看元素在页面的对应位置
•
B. 源代码面板可以查看HTML源码
•
C. 网络面板可以查看HTML源码
•
D. 网络面板可以查看HTTP头部信息
答案: 网络面板可以查看HTML源码
问题 4: 4. 爬虫爬取的是网站后台的数据。
选项:
答案: 错误
问题 5: 5. 下列robots.txt文件中，User-agent后面跟的是爬虫的名称，Disallow后面跟着可以爬虫的网页
选项:
答案: 错误
问题 6: 6. 每个网站都有robots.txt文件
选项:
答案: 错误
问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 9: 1. 下列 Python库或模块中，支持正则表达式语法的是____。
选项:
•
A. bs4
•
B. lxml
•
C. re
•
D. json
答案: 请关注ybaotk.com搜题查看答案
问题 10: 2. 下列选取节点的表达式中，代表着从根节点开始选取的是____。
选项:
•
A. /
•
B. //
•
C. name
•
D. @
答案: 请关注ybaotk.com搜题查看答案
问题 11: 3. 下列选项中，属于非结构化数据的是：
选项:
•
A. 图像
•
B. HTML
•
C. XML
•
D. JSON
答案: 请关注ybaotk.com搜题查看答案
问题 12: 4. 下列选项中，属于结构化数据的是____。
选项:
•
A. 图像
•
B. 文本
•
C. 办公文档
•
D. JSON
答案: 请关注ybaotk.com搜题查看答案
问题 13: 5. 正则表达式字符集中，（）表示数字
选项:
•
A. \d
•
B. \D
•
C. \s
•
D. \w
答案: 请关注ybaotk.com搜题查看答案
问题 14: 6. python中，正则表达式需要引入的模式是（）
选项:
•
A. re
•
B. requests
•
C. os
•
D. bs4
答案: 请关注ybaotk.com搜题查看答案
问题 15: 7. 正则表达式“[^a-z]”，可以匹配下列的字符串为（）。
选项:
•
A. a
•
B. z
•
C. 2
•
D. m
答案: 请关注ybaotk.com搜题查看答案
问题 16: 8. 如果路径表达式以“/”开始，那么该路径就代表着到达某个节点的绝对路径。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 17: 9. 创建 BeautifulSoup类实例时，如果没有明确指定解析器，那么该实例肯定会选择Python标准库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 18: 10. 在使用bs4库调用find()方法查找节点时，只能将字符串作为参数。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 19: 11. 路径表达式是唯一的，只能从根节点开始搜索。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 21: 1. 下列selenium库的方法中，通过元素名称进行多元素定位的是（）
选项:
•
A. find_element_by_name
•
B. find_elements_by_name
•
C. find_elements_by_id
•
D. find_elements_by_class_name
答案: 请关注ybaotk.com搜题查看答案
问题 22: 2. 下列方法中，获取当前页渲染后的源代码是（）
选项:
•
A. close()
•
B. quit()
•
C. page_source
•
D. title
答案: 请关注ybaotk.com搜题查看答案
问题 23: 3. 查看下面表单的示例程序：
...
若要使用WebDriver定位上述元素，可以使用如下（）方法实现。
选项:
•
A. find_element_by_id
•
B. find_element_by_name
•
C. find_elements_by_link_text
•
D. find_elements_by_tag_name
答案: 请关注ybaotk.com搜题查看答案
问题 24: 4. seleinum支持浏览器的功能，可以直接被用来执行命令。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中，如果页面没有加载完，此方法会一直阻塞等待。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 26: 1. 下列关于python连接MySql数据库错误的为（）
选项:
•
A. python2连接MySql数据库用到的库为MySqldb
•
B. python3连接MySql数据库用到的库为pymysql
•
C. python3连接MySql数据库的函数为connect
•
D. python3连接MySql数据库的函数为mysql
答案: 请关注ybaotk.com搜题查看答案
问题 27: 2. python3.在连接mysql数据库之前我们应先导入( )模块
选项:
•
A. MySQLdb
•
B. pymysql
•
C. mysql
•
D. re
答案: 请关注ybaotk.com搜题查看答案
问题 28: 3. python3可以使用MySqldb库，实现对MySql数据库的操作。
选项:
答案: 请关注ybaotk.com搜题查看答案

中国大学moocpython爬虫技术辅导资料

本帖子中包含更多资源

天涯海角也要找到Ni：中国大学moocpython爬虫技术辅导资料

浏览过的版块

QQ微信同步：1144766066。

服务

网站

战略合作