|
数据采集与管理(本专)
学校: 无
问题 1: 1. 增量式爬虫的主要目标有:()。
选项:
•
A. 对以后的抓取过程给出反馈和指导
•
B. 过滤与主题无关的链接
•
C. 过滤与主题无关的链接
•
D. 提高本地页面集中页面的质量
答案: 提高本地页面集中页面的质量
问题 2: 2. 以下关于网络爬虫的说法,正确的有()。
选项:
•
A. 被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式
•
B. 网络爬虫不需要遵守任何限制
•
C. 实际上是一种自动化浏览网络”的程序
•
D. 可以自动采集所有其能够访问到的页面内容
答案: 被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式
问题 3: 3. Web 页面按存在方式可以分为()
选项:
•
A. 深层网页
•
B. 表层网页
•
C. 通用网页
•
D. 主题网页
答案: 深层网页
问题 4: 4. 在不确定性方面,()等方面是数据管理的重要要求和挑战。
选项:
•
A. 消除某些数据的错误
•
B. 分辨数据真伪
•
C. 采集大量数据
•
D. 追求高数据质量
答案: 消除某些数据的错误
问题 5: 5. 增量式爬虫中的()指的是:爬虫根据网页改变频率将其分为更新较快网页子集和更新较慢网页子集两类,然后以不同的频率访问这两类网页。
选项:
•
A. 随机更新法
•
B. 基于分类的更新法
•
C. 统一更新法
•
D. 个体更新法
答案: 基于分类的更新法
问题 6: 6. ()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。
选项:
•
A. 聚焦网络爬虫
•
B. 深层网络爬虫
•
C. 增量式网络爬虫
•
D. 通用网络爬虫
答案: 增量式网络爬虫
问题 7: 7. Deep Web 爬虫体系结构中的LVS用于()。
选项:
•
A. 初始 URL 集合
•
B. 待爬行 URL 集
•
C. 表示填充表单的数据源
•
D. 本地页面URL 集
答案: 请关注ybaotk.com搜题查看答案
问题 8: 8. ()的基本方法是按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止。
选项:
•
A. PageRank优先策略
•
B. 随机爬行策略
•
C. 广度优先策略
•
D. 深度优先策略
答案: 请关注ybaotk.com搜题查看答案
问题 9: 9. 深度优先策略的基本方法是按照深度由低到高的顺序,依次访问下一级网页链接。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 10: 10. 网络爬虫可以抓取Web网页、文档甚至图片、音频、视频等资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 11: 11. 网络爬虫总是要从某个起点开始爬,这个起点叫做种子。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 12: 12. 网络爬虫的广泛应用可能造成个人隐私泄露。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 13: 13. 聚焦网络爬虫又称全网爬虫。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 14: 14. 广度优先策略能够有效控制页面的爬行深度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 15: 15. 深层网页(Deep Web)的内容课通过静态链接获取。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 16: 16. 深层网络爬虫的LVS表是一个URL 列表 。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 17: 17. 增量式爬虫不需要对网页的重要性排序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 18: 18. 聚焦网络爬虫数量非常多,页面更新慢。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 19: 19. 网页分析算法和候选URL排序算法是决定搜索引擎所提供的服务形式和爬虫网页抓取行为的关键所在。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 20: 20. 增量式网络爬虫只会在需要的时候爬行新产生或发生更新的页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 21: 21. 聚焦爬虫需要先对抓取目标的描述或定义。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 22: 22. 如果要采集指定的数据,则需要使用到通用爬虫。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 23: 23. 网络数据采集不能处理非结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 24: 24. 现有聚焦爬虫对抓取目标的描述只包括基于目标网页特征这种方式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 25: 25. 通用网络爬虫爬取网页时,不断刷新页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 26: 26. 通用网络爬虫爬取网页时,由于待刷新的页面太多,需要较长时间才能刷新一次页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 27: 27. 聚焦网络爬虫需要对网页或数据的分析与过滤。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 28: 28. 深度优先的爬行策略按照深度逐层爬行页面,所有链接遍历完后,爬行任务结束。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 29: 29. 以下关于HTTP响应中Content-Length的说法,正确的有()。
选项:
•
A. 以字节方式存储的十进制数字来表示
•
B. 用于指明实体正文的长度
•
C. 用于指定整个实体中的一部分的插入位置
•
D. 其方式要预先在服务器中缓存所有数据,然后所有数据再一次性发给客户端
答案: 请关注ybaotk.com搜题查看答案
问题 30: 30. 下列作家中,列入“唐宋八大家”的有()。
选项:
•
A. Server指明HTTP服务器用来处理请求的软件信息
•
B. Refresh表示浏览器应该在多少时间之后刷新文档
•
C. Content-Encoding表明服务器使用的压缩方法
•
D. Content-Length指明实体正文的长度
答案: 请关注ybaotk.com搜题查看答案
问题 31: 31. 以下关于广度优先的爬行策略的说法,正确的有()
选项:
•
A. 按照网页内容目录层次深浅来爬行页面
•
B. 处于较浅目录层次的页面首先被爬行
•
C. 能够有效控制页面的爬行深度,避免遇到一个无穷深层分支时无法结束爬行的问题
•
D. 当同一层次中的页面爬行完毕后,爬虫再深入下一层继续爬行
答案: 请关注ybaotk.com搜题查看答案
问题 32: 32. 发起HTTP请求的可能是()。
选项:
•
A. 网络爬虫
•
B. 其他客户端工具
•
C. Web浏览器
•
D. 服务器
答案: 请关注ybaotk.com搜题查看答案
问题 33: 33. PageRank优先策略常用于()。
选项:
•
A. Deep Web 爬虫
•
B. 所有网络爬虫
•
C. 增量式网络爬虫
•
D. 通用网络爬虫
答案: 请关注ybaotk.com搜题查看答案
问题 34: 34. 关于表层网页及深层网页,以下说法不正确的是()。
选项:
•
A. 深层网页爬虫主要用于爬去因此在搜索表单后的深层网页。
•
B. 表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主构成的 Web 页面。
•
C. 深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的 Web 页面。
•
D. 深层网页中包含的信息远远少于表层网页。
答案: 请关注ybaotk.com搜题查看答案
问题 35: 35. 深层网络爬虫的基于网页结构分析的表单填写法一般将网页表单表示成(),从中提取表单各字段值。
选项:
•
A. DOM树
•
B. BOM树
•
C. 图像
•
D. 文本
答案: 请关注ybaotk.com搜题查看答案
问题 36: 36. 关于各种网络爬虫,以下说法不正确的是()。
选项:
•
A. 通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
•
B. 通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
•
C. 增量式爬虫在需要的时候爬行新产生或发生更新的页面 ,并重新下载所有页面
•
D. 聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
答案: 请关注ybaotk.com搜题查看答案
问题 37: 37. 可以通过使用网络爬虫,发起一个到服务器上指定端口(默认端口为80)的HTTP请求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 38: 38. 增量式网络爬虫数据下载量和时间及空间上的耗费都较大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 39: 39. 通用网络爬虫通常采用并行工作方式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 40: 40. 网络爬虫实际上是一种自动化浏览网络”的程序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 41: 41. 聚焦网络爬虫又称主题网络爬虫。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 42: 42. Deep Web 爬虫基于网页结构分析填写表单时,一般无领域知识或仅有有限的领域知识。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 43: 43. Deep Web 爬虫体系结构还包括两个爬虫内部数据结构(URL 列表、LVS 表)。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 44: 44. Deep Web 爬虫基于领域知识填写表单时,一般会维持一个本体库,通过语义分析来选取合适的关键词填写表单。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 45: 45. 通用网络爬虫对于爬行速度和存储空间要求较低。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 46: 46. 深度优先的爬行策略可以避免遇到一个无穷深层分支时无法结束爬行的问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 47: 47. 通用网络爬虫需要先对抓取目标的描述或定义。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 48: 48. 通用网络爬虫的技术细节都是公布出来的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 49: 49. 表层网页是以超链接可以到达的静态网页为主构成的 Web 页面 。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 50: 50. Deep Web 爬虫填写表单时可以基于领域知识,也可以基于网页结构分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 51: 51. 通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 52: 52. 通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 53: 53. 现有聚焦爬虫对抓取目标的描述可分为基于目标网页特征、基于目标数据模式和基于领域概念。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 54: 54. Deep Web 爬虫爬行过程中的一个重要步骤是表单填写。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 55: 55. 聚焦爬虫只需要爬行与主题相关的页面。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 56: 56. 深层网页(Deep Web)爬虫体系结构主要包含的基本功能模块有()。
选项:
•
A. 表单分析器和表单处理器
•
B. 爬行控制器
•
C. 解析器
•
D. 响应分析器和LVS 控制器
答案: 请关注ybaotk.com搜题查看答案
问题 57: 57. 网络爬虫可以爬取的资源有()
选项:
•
A. Web网页
•
B. 图像
•
C. 音频
•
D. 视频
答案: 请关注ybaotk.com搜题查看答案
问题 58: 58. HTTP的请求头域可能包含下列字段()。
选项:
•
A. Authorization
•
B. Host
•
C. User-Agent
•
D. Accept
答案: 请关注ybaotk.com搜题查看答案
问题 59: 59. 以下关于表层网页和深层网页的说法,正确的有()
选项:
•
A. 深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的网页
•
B. 表层网页是指传统搜索引擎可以索引的页面
•
C. 表层网页是以超链接可以到达的静态网页为主构成的 Web 页面
•
D. 深层网页的数量比表层网页要少的多
答案: 请关注ybaotk.com搜题查看答案
问题 60: 60. ()爬行过程中最重要部分就是表单填写及处理。
选项:
•
A. 深层网络爬虫
•
B. 通用网络爬虫
•
C. 增量式网络爬虫
•
D. 聚焦网络爬虫
答案: 请关注ybaotk.com搜题查看答案
问题 61: 61. 聚焦爬虫爬行策略实现的关键是评价()的重要性,不同的方法计算出的重要性不同,由此导致链接的访问顺序也不同。
选项:
•
A. 页面内容
•
B. 页面内容和链接
•
C. 表单信息
•
D. 链接
答案: 请关注ybaotk.com搜题查看答案
问题 62: 62. 增量式爬虫爬行所有目标页面,重新下载所有页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 63: 63. 深层网页的数量比表层网页要少的多。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 64: 64. Deep Web 爬虫体系结构包含爬行控制器、解析器、表单分析器、表单处理器、响应分析器、LVS 控制器等功能模块。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 65: 65. 网络爬虫技术不支持图片、音频、视频等文件或附件的采集。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 66: 66. 网络爬虫可以自动采集所有其能够访问到的页面内容。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 67: 67. Deep Web 爬虫爬行过程中最重要部分就是链接提取。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 68: 68. 随着网络的迅速发展,不断优化的网络爬虫技术正在有效地应对各种挑战,为高效搜索用户关注的特定领域与主题提供了有力支撑。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 69: 69. 通用网络爬虫通常采用串行工作方式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 70: 70. 表层网页(Surface Web)中可访问信息容量 是深层网页(Deep Web)的几百倍。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 71: 71. 聚焦网络爬虫爬行过程中的一个重要步骤是表单填写。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 72: 72. 增量式爬虫需要对网页的重要性排序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 73: 73. 表层网页(Surface Web)是互联网上最大、发展最快的新型信息资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 74: 74. 增量式爬虫在需要的时候爬行新产生或发生更新的页面 ,并重新下载所有页面。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 75: 75. 深层网页中存储的信息量只占互联网中信息量的极少部分。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 76: 1. 在HTTP响应信息中,若状态信息码是404则表示()。
选项:
•
A. 没有找到请求的页面
•
B. 登录失败
•
C. 访问被禁止
•
D. 所请求的页面已经转移至新的url
答案: 请关注ybaotk.com搜题查看答案
问题 77: 2. HTTP请求的响应状态码为403表示()。
选项:
•
A. 请求成功
•
B. 服务器忙
•
C. 对被请求页面的访问被禁止
•
D. 服务器连接超时
答案: 请关注ybaotk.com搜题查看答案
问题 78: 3. 以下关于HTTP请求方法GET的说法,正确的是()。
选项:
•
A. 请求获取Request-URI所标识的资源
•
B. 请求服务器回送收到的请求信息
•
C. 请求查询服务器的性能
•
D. 请求服务器删除Request-URI所标识的资源
答案: 请关注ybaotk.com搜题查看答案
问题 79: 4. HTTP请求中的()方法用于请求服务器回送收到的请求信息,主要用于测试或诊断。
选项:
•
A. PUT
•
B. DELETE
•
C. GET
•
D. TRACE
答案: 请关注ybaotk.com搜题查看答案
问题 80: 5. HTTP请求中的()方法要求被请求服务器接受附在请求后面的数据,常用于提交表单。
选项:
•
A. POST
•
B. GET
•
C. PUT
•
D. TRACE
答案: 请关注ybaotk.com搜题查看答案
问题 81: 6. 通过HTTP或者HTTPS协议请求的资源由()来标识。
选项:
•
A. URL
•
B. HTML
•
C. TCP
•
D. FTP
答案: 请关注ybaotk.com搜题查看答案
问题 82: 7. HTTP请求头中()域的内容包含发出请求的用户信息,例如使用的客户端名称和版本号等。
选项:
•
A. Host
•
B. Referer
•
C. User-Agent
•
D. Cookie
答案: 请关注ybaotk.com搜题查看答案
问题 83: 8. HTTP响应中的()表示浏览器应该在多少秒之后刷新文档。
选项:
•
A. Connection
•
B. WWW-Authenticate
•
C. Location
•
D. Refresh
答案: 请关注ybaotk.com搜题查看答案
问题 84: 9. 以下哪个HTTP响应状态表示客户端错误()。
选项:
•
A. 403
•
B. 300
•
C. 500
•
D. 200
答案: 请关注ybaotk.com搜题查看答案
问题 85: 10. 以下不属于HTTP协议的主要特点的是()。
选项:
•
A. 支持基本认证和安全认证
•
B. 简单快速
•
C. 支持客户/服务器模式
•
D. 有状态
答案: 请关注ybaotk.com搜题查看答案
问题 86: 11. HTTP请求中的Cookie表示客户端类型。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 87: 12. HTTP状态码400表示请求成功。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 88: 13. HTTP请求的PUT方法请求服务器回送收到的请求信息,主要用于测试或诊断。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 89: 14. HTTP请求中Referer头域的内容包含发出请求的用户信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 90: 15. HTTP响应中的Content-Type默认为text/html。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 91: 16. HTTP是一个客户端和服务器端请求和应答的标准。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 92: 17. HTTP响应中的Content-Type可以指定为text/html。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 93: 18. GET方法可以在Request-URI所标识的资源后附加新的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 94: 19. HTTP响应中的Content-Type不能指定为其他值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 95: 20. 大数据的应用注重相关分析而不是因果分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 96: 21. HTTP响应中的Content-Range用于指定整个实体中的一部分的插入位置,也指示了整个实体的长度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 97: 22. TRACE方法请求服务器删除Request-URI所标识的资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 98: 23. HTTP协议是无状态协议。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 99: 24. 要消除某些数据的不可预测性,去掉一些“杂乱”的“脏”数据,就涉及到数据清洗(Data Cleaning)技术。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 100: 25. 数据都是连续的值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 101: 26. 可以通过POST方法请求查询服务器的性能,或者查询与资源相关的选项和需求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 102: 27. GET提交的数据会放在URL之后,以?分割URL和传输数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 103: 28. 如果请求的uri没有自己的uri地址,Referer不能被发送。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 104: 29. 大数据是信息技术领域的又一创新浪潮,改变着人们的生活与工作方式与企业的运作模式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 105: 30. GET方法请求服务器删除Request-URI所标识的资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 106: 31. 以下属于HTTP的请求头域可能包含的字段有()。
选项:
•
A. User-Agent
•
B. Referer
•
C. Host
•
D. Range
答案: 请关注ybaotk.com搜题查看答案
问题 107: 32. 大数据采集的方式包括()。
选项:
•
A. 使用特定系统接口对接数据库
•
B. 手工记录
•
C. 系统日志
•
D. 网络数据采集
答案: 请关注ybaotk.com搜题查看答案
问题 108: 33. http的请求方法的GET方法的说法,正确的有()。
选项:
•
A. GET提交的数据大小有限制
•
B. GET提交的数据以明文发送
•
C. 使用Request.QueryString来取得变量的值
•
D. GET提交的数据大小没有限制
答案: 请关注ybaotk.com搜题查看答案
问题 109: 34. http的请求方法包括()。
选项:
•
A. HEAD
•
B. POST
•
C. TRACE
•
D. GET
答案: 请关注ybaotk.com搜题查看答案
问题 110: 35. HTTP协议是无状态协议,以下说法正确的是()。
选项:
•
A. 无状态是指协议对于事务处理没有记忆能力
•
B. 缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大
•
C. 在设计HTTP协议时规定Web服务器发送HTTP应答报文和文档时,不保存发出请求的Web浏览器进程的任何状态信息
•
D. Web服务器保存发送请求的Web浏览器进程的状态信息
答案: 请关注ybaotk.com搜题查看答案
问题 111: 36. 关于HTTP请求方法中GET和POST的区别,以下说法不正确的是()。
选项:
•
A. POST方式提交数据,会带来安全问题
•
B. GET提交的数据大小有限制
•
C. POST方法是把提交的数据放在HTTP包的Body中
•
D. GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连
答案: 请关注ybaotk.com搜题查看答案
问题 112: 37. 使用()方法提交表单数据,会带来安全问题,比如一个登录页面,通过这种方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。
选项:
•
A. GET
•
B. TRACE
•
C. DELETE
•
D. PUT
答案: 请关注ybaotk.com搜题查看答案
问题 113: 38. 以下属于HTTP协议的主要特点的是()。
选项:
•
A. HTTP只允许传输指定类型的数据对象
•
B. HTTP 1.1使用非持续连接
•
C. HTTP不支持安全认证
•
D. HTTP协议是无状态协议
答案: 请关注ybaotk.com搜题查看答案
问题 114: 39. GET和POST的区别,以下说法不正确的有()。
选项:
•
A. GET方式需要使用Request.QueryString来取得变量的值
•
B. POST方式通过Request.Form来获取变量的值
•
C. POST提交的数据会放在URL之后完
•
D. GET提交的数据会放在URL之后
答案: 请关注ybaotk.com搜题查看答案
问题 115: 40. 在HTP响应信息中,若状态信息码是200则表示()。
选项:
•
A. 访问被禁止
•
B. 登录失败
•
C. 请求成功
•
D. 所请求的页面已经转移至新的url
答案: 请关注ybaotk.com搜题查看答案
问题 116: 41. HTTP请求的()方法是在Request-URI所标识的资源后附加新的数据。
选项:
•
A. GET
•
B. POST
•
C. TRACE
•
D. PUT
答案: 请关注ybaotk.com搜题查看答案
问题 117: 42. HTTP请求中的()头域指定请求资源的Intenet主机和端口号,必须表示请求url的原始服务器或网关的位置。
选项:
•
A. Referer
•
B. User-Agent
•
C. Host
•
D. Cookie
答案: 请关注ybaotk.com搜题查看答案
问题 118: 43. 数据可以是连续的值,也可以是离散的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 119: 44. HTTP响应中的ETag用于把cookie发送到客户端浏览器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 120: 45. 视频、语音等是结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 121: 46. HTTP请求的TRACE方法请求查询服务器的性能,或者查询与资源相关的选项和需求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 122: 47. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 123: 48. GET方式需要使用Request.QueryString来取得变量的值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 124: 49. POST方式提交表单数据,会带来安全问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 125: 50. HTTP响应中的Content-Length用于指明实体正文的长度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 126: 51. DELETE 请求服务器删除Request-URI所标识的资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 127: 52. HTTP响应中的Content-Length要预先在服务器中缓存所有数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 128: 53. HTTP状态码500表示由于客户端原因造成的请求失败。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 129: 54. HTTP请求方法GET用于请求服务器回送收到的请求信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 130: 55. HTTP响应中的Content-Length以字节方式存储的十进制数字来表示。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 131: 56. HTTP的请求头域可能包含Authorization、Referer、Content-Type、Content-Encoding等部分。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 132: 57. GET方式通过Request.Form来获取变量的值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 133: 58. HTTP请求中的Range头域可以请求实体的一个或者多个子范围。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 134: 59. HTTP响应中Accept-Ranges的表示服务器支持哪些请求方法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 135: 60. 大数据一般是指数量级为GB以上的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 136: 61. http的请求方法的GET方法的说法,正确的有()。
选项:
•
A. 存在安全问题
•
B. GET提交的数据在URL之后
•
C. 参数以明文发送
•
D. GET提交的数据最多只能有1024字节
答案: 请关注ybaotk.com搜题查看答案
问题 137: 62. 以下属于非结构化数据的有()。
选项:
•
A. 视频
•
B. 文本
•
C. 图像
•
D. 音频
答案: 请关注ybaotk.com搜题查看答案
问题 138: 63. http请求包括()。
选项:
•
A. 请求行
•
B. 消息体
•
C. 消息报头
•
D. 状态码
答案: 请关注ybaotk.com搜题查看答案
问题 139: 64. 系统日志的采集工具包括有()。
选项:
•
A. Hadoop的Chukwa
•
B. Facebook的Scribe
•
C. SQL
•
D. Cloudera的Flume
答案: 请关注ybaotk.com搜题查看答案
问题 140: 65. HTTP请求中的()字段可能为类似Mozilla/5.0(iPhone;U;CPUiPhoneOS4_3_3likeMacOSX;en-us)AppleWebKit……”这样的信息。
选项:
•
A. User-Agent
•
B. Connection
•
C. Cookie
•
D. Host
答案: 请关注ybaotk.com搜题查看答案
问题 141: 66. 一次HTTP由()组成。
选项:
•
A. 一次请求和一次响应
•
B. 一次响应
•
C. 一次请求
•
D. 2次请求
答案: 请关注ybaotk.com搜题查看答案
问题 142: 67. ()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。
选项:
•
A. 聚焦网络爬虫
•
B. 深层网络爬虫
•
C. 通用网络爬虫
•
D. 增量式网络爬虫
答案: 请关注ybaotk.com搜题查看答案
问题 143: 68. HTTP响应中的()表示WEB服务器告诉浏览器自己响应的对象的类型和字符集。
选项:
•
A. Content-Length
•
B. Content-Range
•
C. Content-Type
•
D. Content-Encoding
答案: 请关注ybaotk.com搜题查看答案
问题 144: 69. 追求高数据质量是对大数据的一项重要要求,要消除某些数据的不可预测性,去掉一些杂乱”的脏”数据,就涉及到()技术。
选项:
•
A. 数据统计
•
B. 数据预测
•
C. 数据清洗
•
D. 数据采集
答案: 请关注ybaotk.com搜题查看答案
问题 145: 70. HTTP请求的()能使客户端到服务器端的连接持续有效,当出现对服务器的后继请求时,避免了建立或者重新建立连接。
选项:
•
A. Referer
•
B. Host
•
C. Keep-Alive
•
D. Cookie
答案: 请关注ybaotk.com搜题查看答案
问题 146: 71. 发出的HTTP请求由三部分组成,分别是:()。
选项:
•
A. 请求行、请求正文
•
B. 消息报头、请求正文
•
C. 应答行、消息报头、请求正文
•
D. 请求行、消息报头、请求正文
答案: 请关注ybaotk.com搜题查看答案
问题 147: 72. HTTP响应中的ETag用于WEB服务器告诉浏览器自己响应的对象的类型和字符集。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 148: 73. HTTP响应中的Expires表示消息发送的时间。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 149: 74. GET方法请求服务器存储一个资源,并用Request-URI作为其标识。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 150: 75. 数据清洗是指发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等技术。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 151: 76. HTTP请求中的“Connection: keep-alive”表示当前连接持续保持。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 152: 77. 大数据不仅仅是一种技术,更重要的是利用信息资源的思维、视角和策略。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 153: 78. HTTP响应中的Set-Cookie用于把cookie发送到客户端浏览器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 154: 79. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 155: 80. HTTP响应中的Expires指明应该在什么时候认为文档已经过期。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 156: 81. HTTP请求中的User-Agent表示发起请求的类型。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 157: 82. HTTP请求的POST方法请求服务器存储一个资源,并用Request-URI作为其标识。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 158: 83. 大数据的主要难点在于数据量太大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 159: 84. HTTP响应中的Date指明应该在什么时候认为文档已经过期。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 160: 85. HTTP响应中的Location用于指明HTTP服务器用来处理请求的软件信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 161: 86. GET提交的数据大小有限制,最多只能有1024字节。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 162: 87. HTTP协议的主要特点有()。
选项:
•
A. 无状态
•
B. 通信速度快
•
C. 支持客户/服务器模式
•
D. 支持非持续连接
答案: 请关注ybaotk.com搜题查看答案
问题 163: 88. 大数据价值链包括()。
选项:
•
A. 数据采集
•
B. 数据储存
•
C. 数据分析
•
D. 数据生成
答案: 请关注ybaotk.com搜题查看答案
问题 164: 89. http请求中请求头包括()。
选项:
•
A. 请求方法
•
B. 统一资源标识符
•
C. 请求的HTTP协议版本
•
D. 回车和换行符
答案: 请关注ybaotk.com搜题查看答案
问题 165: 90. 以下属于非结构化数据的有()。
选项:
•
A. 视频
•
B. 图像
•
C. 音频
•
D. 动画
答案: 请关注ybaotk.com搜题查看答案
问题 166: 91. 如果HTTP请求的响应信息是404,则应采取下列哪项措施()。
选项:
•
A. 向管理员请求用户名和密码
•
B. 向网管报障
•
C. 再次核对请求的页面地址是否正确
•
D. 检查浏览器权限
答案: 请关注ybaotk.com搜题查看答案
问题 167: 92. HTTP请求中()头域的内容包含发出请求的用户信息。
选项:
•
A. User-Agent
•
B. Accept
•
C. Referer
•
D. Cookie
答案: 请关注ybaotk.com搜题查看答案
问题 168: 93. 由HTTP客户端发起一个请求,建立一个到服务器指定端口的TCP连接,这个端口默认是()端口。
选项:
•
A. 88
•
B. 81
•
C. 80
•
D. 10
答案: 请关注ybaotk.com搜题查看答案
问题 169: 94. 发送了一个HTTP请求后,客户端收到一个200的响应,这表示()。
选项:
•
A. 重定向到其他URL
•
B. 请求成功
•
C. 拒绝访问
•
D. 登录失败
答案: 请关注ybaotk.com搜题查看答案
问题 170: 95. HTTP请求中的()头域允许客户端指定请求uri的源资源地址,这可以允许服务器生成回退链表,可用来登陆、优化cache等。
选项:
•
A. Cookie
•
B. Referer
•
C. Referer
•
D. User-Agent
答案: 请关注ybaotk.com搜题查看答案
问题 171: 96. HTTP响应中的()用于重定向一个新的位置。
选项:
•
A. Connection
•
B. Refresh
•
C. WWW-Authenticate
•
D. Location
答案: 请关注ybaotk.com搜题查看答案
问题 172: 97. HTTP请求中的()方法用于请求服务器存储一个资源,并用Request-URI作为其标识。
选项:
•
A. PUT
•
B. TRACE
•
C. POST
•
D. GET
答案: 请关注ybaotk.com搜题查看答案
问题 173: 98. 对发出的HTTP请求应答的服务器上存储着一些资源,比如HTML文件和图像。我们称这个应答服务器为()。
选项:
•
A. 源服务器
•
B. 用户代理
•
C. 播放器
•
D. 浏览器
答案: 请关注ybaotk.com搜题查看答案
问题 174: 99. 以下不属于HTTP协议请求方法的是()
选项:
•
A. TRACE
•
B. SUBMIT
•
C. POST
•
D. GET
答案: 请关注ybaotk.com搜题查看答案
问题 175: 100. 数据生命周期管理旨在产生效益的同时,降低生产成本。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 176: 101. HTTP响应中的Content-Encoding用于WEB服务器告诉浏览器自己响应的对象所用的自然语言。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 177: 102. HTTP中的User-Agent表示发起请求的地址。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 178: 103. HTTP响应中的Last-Modified也可用setDateHeader方法来设置。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 179: 104. 声音、图像、符号、文字等都是数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 180: 105. POST方式通过Request.Form来获取变量的值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 181: 106. HTTP请求的OPTIONS 方法请求查询服务器的性能,或者查询与资源相关的选项和需求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 182: 107. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 183: 108. HTTP的请求头域可能包含Accept、Accept-Charset、Accept-Encoding、Accept-Language等字段。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 184: 109. 计算机数据存储的容量单位,1KB>1MB>1GB。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 185: 110. POST提交的数据会放在URL之后 。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 186: 111. 大数据具有体量大、结构单一、时效性强的特征。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 187: 112. 在HTTP响应信息中状态信息码是一个重要的信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 188: 113. Keep-Alive功能虽然为客户保留打开的连接有一定的好处,但它同样影响了性能。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 189: 114. HTTP状态码200表示请求成功。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 190: 115. HTTP响应中的Date用于指示资源的最后修改日期和时间。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 191: 116. HTTP请求的PUT方法请求服务器删除Request-URI所标识的资源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 192: 117. HTTP请求方法常用的有GET、HEAD、POST。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 193: 118. 大数据技术可应用于金融、互联网、公共管理等不同的领域。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 194: 119. 大数据起源于金融行业。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 195: 120. 关于http的请求方法的POST方法,正确的有()。
选项:
•
A. 是把提交的数据放在HTTP包的Body中提交
•
B. 提交的数据以明文发送
•
C. 安全性比GET更高
•
D. 提交的数据没有大小限制
答案: 请关注ybaotk.com搜题查看答案
问题 196: 121. 以下哪些属于http的请求方法()。
选项:
•
A. POST
•
B. GET
•
C. CONNECT
•
D. PUT
答案: 请关注ybaotk.com搜题查看答案
问题 197: 122. 以下属于http的请求方法的有()。
选项:
•
A. POST
•
B. DELETE
•
C. OPTIONS
•
D. GET
答案: 请关注ybaotk.com搜题查看答案
问题 198: 123. 关于HTTP操作的主要过程,以下说法正确的有()。
选项:
•
A. 服务器接到请求后,给予相应的响应信息
•
B. 立连接后,客户机发送一个请求给服务器
•
C. 首先客户机与服务器需要建立连接
•
D. 客户端接收服务器所返回的信息通过浏览器显示
答案: 请关注ybaotk.com搜题查看答案
问题 199: 1. 字符串“aaa”可以匹配正则表达式“\w{3,}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 200: 2. 正则表达式的量词+表示0次或多次。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 201: 3. 正则表达式支持匹配边界,例如单词边界,文本的开头或末尾。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 202: 4. 正则表达式中的饥饿模式匹配尽可能少的文本。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 203: 5. 正则表达式[abc]表示字符a或b或c。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 204: 6. 数据的时效性指的是数据在需要的时侯是否有效。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 205: 7. 数据的完整性指的是所有需要的数据是否都存在。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 206: 8. 数据质量具体表现为正确性、完整性、一致性、完备性、有效性、时效性和可获取性等。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 207: 9. 数据预处理时可能要先验证数据正确性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 208: 10. 数据刷新的策略要根据业务需求和应用系统的承受能力和数据情况决定。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 209: 11. 错误的数据就是指不完整的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 210: 12. 不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 211: 13. 不同的企业有不同的业务规则、不同的数据指标,这些指标通过简单的加减、组合就能完成。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 212: 14. 进行数据预处理时,使用ETL工具比手工处理更高效。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 213: 15. 一般来说使用数据抽取和转换都用手工的方式完成。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 214: 16. 正则表达式的规则中,x|y表示匹配()
选项:
•
A. x或y
•
B. x和y
•
C. x+y
•
D. xy
答案: 请关注ybaotk.com搜题查看答案
问题 215: 17. 以下不能匹配正则表达式^[\w]+$的是()。
选项:
•
A. S1
•
B. 12
•
C. S_1
•
D. S+1
答案: 请关注ybaotk.com搜题查看答案
问题 216: 18. 正则表达式中的量词可以匹配一个表达式多次出现,其中()表示0次或多次。
选项:
•
A. ?
•
B. *
•
C. ^
•
D. +
答案: 请关注ybaotk.com搜题查看答案
问题 217: 19. 以下能匹配正则表达式^[A-Za-z]+$的是()。
选项:
•
A. abc
•
B. 3
•
C. 33
•
D. a3
答案: 请关注ybaotk.com搜题查看答案
问题 218: 20. 重叠合并数据时,使用哪个pandas库的方法?
选项:
•
A. merge()
•
B. join()
•
C. combine_first()
•
D. concat()
答案: 请关注ybaotk.com搜题查看答案
问题 219: 21. 数据质量的正确性指的是()。
选项:
•
A. 数据是否正确的表示了现实或可证实的来源
•
B. 数据之间的参照完整性是否存在或一致
•
C. 数据是否被一致的定义或理解
•
D. 所有需要的数据都存在
答案: 请关注ybaotk.com搜题查看答案
问题 220: 22. 主键合并数据时,使用哪个pandas库的方法?
选项:
•
A. merge()
•
B. join()
•
C. combine_first()
•
D. concat()
答案: 请关注ybaotk.com搜题查看答案
问题 221: 23. 对于重要信息的完整历史变更记录,在抽取需要信息等基本属性的旧有数据时,可以根据各时期的历史信息,与相应时段的信息关联得到真实的历史属性,这是()。
选项:
•
A. 数据的平台多样性问题
•
B. 数据的依赖性问题
•
C. 数据的不稳定性问题
•
D. 数据的时间差异性问题
答案: 请关注ybaotk.com搜题查看答案
问题 222: 24. 在merge()方法中,on参数用于指定什么?
选项:
•
A. 合并的方向
•
B. 用于连接的列标签
•
C. 合并的方式
•
D. 合并的结果
答案: 请关注ybaotk.com搜题查看答案
问题 223: 25. 数据质量的可获取性指的是()。
选项:
•
A. 数据是否在企业定义的可接受的范围之内
•
B. 数据在需要的时侯是有效的吗
•
C. 数据是否易于获取、易于理解和易于使用
•
D. 数据是否被一致的定义或理解
答案: 请关注ybaotk.com搜题查看答案
问题 224: 26. 正则表达式的量词*表示0次或多次。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 225: 27. 字符串“a123456”可以匹配正则表达式“\w{6}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 226: 28. 正则表达式[abc]表示字符串abc。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 227: 29. 正则表达式中,量词可以匹配一个表达式多次出现。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 228: 30. 正则表达式的量词?表示0次或多次。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 229: 31. 数据的完备性指的是所有需要的数据是否都存在。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 230: 32. 数据清洗的任务是直接删除不符合要求的数据,
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 231: 33. 数据预处理时对于空值数据直接忽略即可。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 232: 34. 数据转换时,对于空值的处理,可通过加载或替换为其他含义数据,并根据字段空值实现分流加载到不同目标库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 233: 35. 数据刷新的时间间隔越短越好。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 234: 36. 对于无效数据、缺失数据,可以从业务因素的角度分析后替换。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 235: 37. 数据转换的主要进行不一致的数据转换、数据粒度的转换,以及一些规则的计算。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 236: 38. 数据的完整性指的是数据之间的参照完整性是否存在或一致。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 237: 39. 数据的一致性指的是数据是否被一致的定义或理解。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 238: 40. 数据的完备性指的是数据是否被一致的定义或理解。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 239: 41. 正则表达式中有一些预定义的字符分类,其中,()表示任意数字。
选项:
•
A. \w
•
B. \d
•
C. $
•
D. \s
答案: 请关注ybaotk.com搜题查看答案
问题 240: 42. 正则表达式中,[abc]表示()。
选项:
•
A. 字符串abc
•
B. 字符a,b或c
•
C. 字符a
•
D. 同时包含abd的字符串
答案: 请关注ybaotk.com搜题查看答案
问题 241: 43. 正则表达式支持匹配边界。例如,()匹配行首。
选项:
•
A. ^
•
B. $
•
C. \w
•
D. \d
答案: 请关注ybaotk.com搜题查看答案
问题 242: 44. 正则表达式中的量词可以匹配一个表达式多次出现,()表示1次或多次。
选项:
•
A. ^
•
B. *
•
C. ?
•
D. +
答案: 请关注ybaotk.com搜题查看答案
问题 243: 45. 在concat()方法中,如果要进行纵向堆叠合并,并且重新编号行标签,应该设置哪个参数为True?
选项:
•
A. on
•
B. axis
•
C. ignore_index
•
D. join
答案: 请关注ybaotk.com搜题查看答案
问题 244: 46. ETL中的T表示()。
选项:
•
A. 加载
•
B. 转换
•
C. 挖掘
•
D. 抽取
答案: 请关注ybaotk.com搜题查看答案
问题 245: 47. 堆叠合并数据时,使用哪个pandas库的方法?
选项:
•
A. combine_first()
•
B. join()
•
C. concat()
•
D. merge()
答案: 请关注ybaotk.com搜题查看答案
问题 246: 48. 数据()的任务是过滤那些不符合要求的数据。
选项:
•
A. 清洗
•
B. 加载
•
C. 转换
•
D. 抽取
答案: 请关注ybaotk.com搜题查看答案
问题 247: 49. 如果在merge()方法中未指定on参数,合并时会使用哪两个表的键值?
选项:
•
A. 只有右表的键值
•
B. 交集
•
C. 并集
•
D. 只有左表的键值
答案: 请关注ybaotk.com搜题查看答案
问题 248: 50. 在merge()方法中,如果要进行右连接,how参数应该设置为什么?
选项:
•
A. left
•
B. inner
•
C. right
•
D. outer
答案: 请关注ybaotk.com搜题查看答案
问题 249: 51. 字符串“a_b”可以匹配正则表达式“\w{3}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 250: 52. 字符串“abc”可以匹配正则表达式“\w{3}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 251: 53. 字符串Chapter1可满足正则表达式Chapter [12345]”匹配要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 252: 54. 正则表达式中$ 匹配行尾。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 253: 55. 正则表达式中\d表示任意单词字符。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 254: 56. 对于空值数据的处理,可捕获字段空值,进行加载或替换为其他含义的数据,并可根据字段空值实现分流加载到不同目标库。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 255: 57. 数据量大的系统,也总是整体抽取数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 256: 58. 使用ETL工具处理数据周期较长。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 257: 59. 数据的正确性表示数据是否正确的表示了现实或可证实的来源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 258: 60. 对于数据量大的系统,必须考虑增量抽取数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 259: 61. 不同格式的数据也可以一起处理,不需要转换。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 260: 62. 对于无效数据、缺失数据,直接删除即可。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 261: 63. 数据的可获取性指数据是否易于获取、易于理解和易于使用。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 262: 64. 数据的有效性指的是数据在需要的时侯是否有效。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 263: 65. 不完整的数据主要是一些数据有的信息缺失。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 264: 66. 正则表达式的规则中,()表示匹配所有非空白字符。
选项:
•
A. \S
•
B. \w
•
C. \W
•
D. \d
答案: 请关注ybaotk.com搜题查看答案
问题 265: 67. 以下关于正则表达式中常用正则规则的说法,不正确的有()
选项:
•
A. \D 表示数字,相当于[0-9]
•
B. \w表示字母、数字、下划线
•
C. \D 表示非数字
•
D. \d 表示数字,相当于[0-9]
答案: 请关注ybaotk.com搜题查看答案
问题 266: 68. 正则表达式的规则中,()表示数字,相当于[0-9]。
选项:
•
A. ^
•
B. \w
•
C. \W
•
D. \d
答案: 请关注ybaotk.com搜题查看答案
问题 267: 69. 正则表达式[a-z]可以匹配()。
选项:
•
A. a”到z”范围内的任意小写字母字符
•
B. 字母字符a”或z”
•
C. 小写字母字符a”或z”
•
D. a”到z”范围内的任意字母字符
答案: 请关注ybaotk.com搜题查看答案
问题 268: 70. 数据质量的完备性指的是()。
选项:
•
A. 数据是否正确的表示了现实或可证实的来源
•
B. 数据之间的参照完整性是否存在或一致
•
C. 数据是否被一致的定义或理解
•
D. 所有需要的数据都存在
答案: 请关注ybaotk.com搜题查看答案
问题 269: 71. 以下不属于数据清洗要处理的对象的是()。
选项:
•
A. 不完整的数据
•
B. 错误的数据
•
C. 规范的数据
•
D. 重复的数据
答案: 请关注ybaotk.com搜题查看答案
问题 270: 72. 内连接合并时,合并结果会保留哪两个表的键值?
选项:
•
A. 只有右表的键值
•
B. 只有左表的键值
•
C. 交集
•
D. 并集
答案: 请关注ybaotk.com搜题查看答案
问题 271: 73. 在concat()方法中,如果要进行横向堆叠合并,axis参数应该设置为多少?
选项:
•
A. 1
•
B. 3
•
C. 0
•
D. 2
答案: 请关注ybaotk.com搜题查看答案
问题 272: 74. 在merge()方法中,如果要进行左连接,合并结果会包含哪些表的键值?
选项:
•
A. 左表和右表的键值并集
•
B. 左表和右表的键值交集
•
C. 只有右表的键值
•
D. 只有左表的键值
答案: 请关注ybaotk.com搜题查看答案
问题 273: 75. 数据质量的有效性指的是()。
选项:
•
A. 数据是否在企业定义的可接受的范围之内
•
B. 数据是否被一致的定义或理解
•
C. 数据在需要的时侯是有效的吗
•
D. 数据是否易于获取、易于理解和易于使用
答案: 请关注ybaotk.com搜题查看答案
问题 274: 76. 正则表达式中的\w表示任意单词字符。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 275: 77. 字符串“aaaaa”可以匹配正则表达式“\w{3,5}”
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 276: 78. 目前主流的网页开发语言都不支持正则表达式。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 277: 79. 正则表达式无法实现特殊字符的匹配。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 278: 80. 字符串d匹配正则表达式“\d{1,3}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 279: 81. 数据的完整性表示数据是否正确的表示了现实或可证实的来源。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 280: 82. 数据预处理时不需要进行数据正确性的验证。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 281: 83. 数据质量具体表现只有正确性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 282: 84. 不同系统的相同类型的数据也不需要统一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 283: 85. 对于不同格式的数据,需要规范化数据格式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 284: 86. 不符合要求的数据就是指错误的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 285: 87. 数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 286: 88. 数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 287: 89. 数据的正确性指的是数据之间的参照完整性是否存在或一致。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 288: 90. 数据清洗是一个一次性的过程。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 289: 91. 正则表达式中,()表示匹配反斜线。
选项:
•
A. ^
•
B. \
•
C. \w
•
D. \
答案: 请关注ybaotk.com搜题查看答案
问题 290: 92. 以下字符串能匹配正则表达式^[a-z][0-9]$”的是()
选项:
•
A. ab
•
B. a
•
C. a1
•
D. 1
答案: 请关注ybaotk.com搜题查看答案
问题 291: 93. 正则表达式[^A-Za-z_0-9]等价于()。
选项:
•
A. \d
•
B. \w
•
C. \W
•
D. ^
答案: 请关注ybaotk.com搜题查看答案
问题 292: 94. 正则表达式中有一些预定义的字符分类,其中,()表示任意空白字符。
选项:
•
A. \s
•
B. \d
•
C. $
•
D. \w
答案: 请关注ybaotk.com搜题查看答案
问题 293: 95. 数据质量的完整性指的是()。
选项:
•
A. 数据之间的参照完整性是否存在或一致
•
B. 数据是否被一致的定义或理解
•
C. 所有需要的数据都存在
•
D. 数据是否正确的表示了现实或可证实的来源
答案: 请关注ybaotk.com搜题查看答案
问题 294: 96. 在merge()方法中,如果要进行内连接,how参数应该设置为什么?
选项:
•
A. outer
•
B. inner
•
C. left
•
D. right
答案: 请关注ybaotk.com搜题查看答案
问题 295: 97. 数据的预处理ETL的L表示()。
选项:
•
A. 加载
•
B. 抽取
•
C. 清洗
•
D. 转换
答案: 请关注ybaotk.com搜题查看答案
问题 296: 98. 数据质量的()表示所有需要的数据是否都存在。
选项:
•
A. 完备性
•
B. 一致性
•
C. 完整性
•
D. 正确性
答案: 请关注ybaotk.com搜题查看答案
问题 297: 99. 在concat()方法中,如果要进行纵向堆叠合并,axis参数应该设置为多少?
选项:
•
A. 0
•
B. 2
•
C. 3
•
D. 1
答案: 请关注ybaotk.com搜题查看答案
问题 298: 100. 如果在堆叠合并时希望产生新的行标签,应该设置concat()方法中的哪个参数为True?
选项:
•
A. axis
•
B. join
•
C. on
•
D. ignore_index
答案: 请关注ybaotk.com搜题查看答案
问题 299: 101. 字符串a可以匹配正则表达式“[a]”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 300: 102. 正则表达式中+ 表示1次或多次。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 301: 103. 字符串a12可满足正则表达式\w”匹配要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 302: 104. 正则表达式中$ 匹配行首。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 303: 105. 正则表达式中的贪婪模式匹配尽可能少的文本。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 304: 106. 使用ETL工具处理数据后很难管理和维护。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 305: 107. 数据的正确性指的是所有需要的数据是否都存在。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 306: 108. 不同的数据库之间如果不能建立数据库链接,可以将源数据导出成.txt或者是.xls文件,然后再将这些源系统文件导入,也可以通过程序接口来完成。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 307: 109. 对于数据量大的系统,一般也常做一次性的数据抽取。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 308: 110. 较早的数据不够完整或不符合新系统的数据规范,一般可以根据规则,在存入中转区的过程中予以更新或补充。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 309: 111. 错误的数据产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 310: 112. 对于重要信息的完整历史变更记录,在抽取时也不需要与相应时段的历史信息关联。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 311: 113. 数据的有效性指的是数据是否在企业定义的可接受的范围之内。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 312: 114. 不同的数据库之间如果不能建立数据库链接,则只能手工导出再处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 313: 115. ()描述了一种字符串匹配的模式,通常被用来检索、替换那些符合某个模式(规则)的文本。
选项:
•
A. 正则表达式
•
B. 字符集
•
C. 网络爬虫
•
D. 数据采集
答案: 请关注ybaotk.com搜题查看答案
问题 314: 116. 以下关于正则表达式的说法,不正确的是()
选项:
•
A. 正则表达式的使用非常灵活性,逻辑性和功能性非常强
•
B. 主流开发语言C++、Java均不支持正则表达式
•
C. 正则表达式是对字符串操作的一种逻辑公式
•
D. 正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串
答案: 请关注ybaotk.com搜题查看答案
问题 315: 117. 正则表达式中,()匹配除了换行符之外的任意字符。
选项:
•
A. .
•
B. \w
•
C. ^
•
D. \d
答案: 请关注ybaotk.com搜题查看答案
问题 316: 118. 以下不能匹配正则表达式^[\d]+$的是()。
选项:
•
A. 123
•
B. 12abc
•
C. 12
•
D. 10
答案: 请关注ybaotk.com搜题查看答案
问题 317: 119. ETL中的L表示()。
选项:
•
A. 挖掘
•
B. 加载
•
C. 转换
•
D. 抽取
答案: 请关注ybaotk.com搜题查看答案
问题 318: 120. 纵向堆叠合并数据时,concat()方法中axis参数默认是多少?
选项:
•
A. 1
•
B. 0
•
C. 2
•
D. 3
答案: 请关注ybaotk.com搜题查看答案
问题 319: 121. 对于不完整的数据,例如一些应该有的信息缺失,如信息缺失、主表与明细表不能匹配等,应进行数据()。
选项:
•
A. 加载
•
B. 清洗
•
C. 抽取
•
D. 转换
答案: 请关注ybaotk.com搜题查看答案
问题 320: 122. 在concat()方法中,ignore_index参数设置为True时,会产生什么效果?
选项:
•
A. 无效果
•
B. 删除行标签
•
C. 产生新的行标签
•
D. 保留原来的行标签
答案: 请关注ybaotk.com搜题查看答案
问题 321: 123. 外连接合并时,合并结果会按什么顺序对键值进行排序?
选项:
•
A. 左表的键值顺序
•
B. 无序
•
C. 字典顺序
•
D. 右表的键值顺序
答案: 请关注ybaotk.com搜题查看答案
问题 322: 124. 影响质量问题的原因不包括()。
选项:
•
A. 数据的依赖性问题
•
B. 数据的不稳定性问题
•
C. 数据的获取方式多样性问题
•
D. 数据的时间差异性问题
答案: 请关注ybaotk.com搜题查看答案
问题 323: 125. 正则表达式[John]可以匹配John。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 324: 126. 正则表达式[Jj]ohn可以匹配John和john。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 325: 127. 字符串12匹配正则表达式“\d{1,3}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 326: 128. 正则表达式的量词?表示0次或1次。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 327: 129. 字符串“a_b”可以匹配正则表达式“\w{6}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 328: 130. 数据的一致性指的是所有需要的数据是否都存在。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 329: 131. 数据的有效性指数据是否易于获取、易于理解和易于使用。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 330: 132. 数据清洗是一个反复的过程。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 331: 133. 数据质量的时效性指数据是否在企业定义的可接受的范围之内。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 332: 134. 进行数据预处理,使用ETL工具比手工处理更节约时间。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 333: 135. 数据转换的主要进行不一致的数据转换、数据粒度的转换,以及一些商务规则的计算。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 334: 136. 以下关于正则表达式中数量表示规则的说法,不正确的是()
选项:
•
A. X+ 表示可以出现1次或多次
•
B. X表示必须出现一次
•
C. X* 表示可以出现0次,1次或多次
•
D. X+ 表示可以出现0次,1次或多次
答案: 请关注ybaotk.com搜题查看答案
问题 335: 137. 数据的预处理ETL的E表示()。
选项:
•
A. 抽取
•
B. 清洗
•
C. 加载
•
D. 转换
答案: 请关注ybaotk.com搜题查看答案
问题 336: 138. 数据的预处理ETL的T表示()。
选项:
•
A. 加载
•
B. 转换
•
C. 抽取
•
D. 清洗
答案: 请关注ybaotk.com搜题查看答案
问题 337: 139. ()是指发现并纠正数据文件中可识别的一些错误。
选项:
•
A. 数据清洗
•
B. 数据采集
•
C. 数据集成
•
D. 数据分析
答案: 请关注ybaotk.com搜题查看答案
问题 338: 140. 数据的()指的是数据是否易于获取、易于理解和易于使用。
选项:
•
A. 关汉卿
•
B. 李清照
•
C. 苏轼
•
D. 完备性
答案: 请关注ybaotk.com搜题查看答案
问题 339: 141. ETL中的E表示()。
选项:
•
A. 抽取
•
B. 转换
•
C. 加载
•
D. 挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 340: 142. 在抽取旧有数据时,有部分数据可能需要转换成文本文件或使用第三方工具装载入数据中转区,这部分数据主要是与数据中转区数据库平台不一致的数据库数据,这是()。
选项:
•
A. 数据的依赖性问题
•
B. 数据的平台多样性问题
•
C. 数据的时间差异性问题
•
D. 数据的不稳定性问题
答案: 请关注ybaotk.com搜题查看答案
问题 341: 143. 字符串a1234可满足正则表达式\w”匹配要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 342: 144. 正则表达式中的 \d 表示任意数字。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 343: 145. 正则表达式中,^ 匹配行首。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 344: 146. 字符串A和B都可以匹配正则表达式“A+”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 345: 147. 正则表达式中的 \s 表示任意空白字符。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 346: 148. 数据清洗直接把不符合要求的数据过滤掉即可。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 347: 149. 数据预处理时,要将不同系统的相同类型的数据统一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 348: 150. 对于重要信息的完整历史变更记录,在抽取时可以根据各时期的历史信息,在抽取需要信息等基本属性的旧有数据时,要与相应时段的信息关联得到真实的历史属性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 349: 151. 正则表达式支持匹配边界。例如()匹配行尾。
选项:
•
A. $
•
B. \d
•
C. \w
•
D. ^
答案: 请关注ybaotk.com搜题查看答案
问题 350: 152. 数据质量的时效性指的是()。
选项:
•
A. 数据在需要的时侯是有效的吗
•
B. 数据是否在企业定义的可接受的范围之内
•
C. 数据是否易于获取、易于理解和易于使用
•
D. 数据是否被一致的定义或理解
答案: 请关注ybaotk.com搜题查看答案
问题 351: 153. 在concat()方法中,如果要进行交叉堆叠合并,应该设置哪个参数?
选项:
•
A. join
•
B. axis
•
C. on
•
D. ignore_index
答案: 请关注ybaotk.com搜题查看答案
问题 352: 154. 在抽取旧有数据时,要将不同时期的数据定义统一,较早的数据不够完整或不符合新系统的数据规范,这是()。
选项:
•
A. 数据的依赖性问题
•
B. 数据的时间差异性问题
•
C. 数据的平台多样性问题
•
D. 数据的不稳定性问题
答案: 请关注ybaotk.com搜题查看答案
问题 353: 155. 横向堆叠合并数据时,concat()方法中axis参数应该设置为多少?
选项:
•
A. 2
•
B. 1
•
C. 0
•
D. 3
答案: 请关注ybaotk.com搜题查看答案
问题 354: 156. 以下不属于数据质量的规范、完整性要求的是()
选项:
•
A. 遗留系统相关信息与其他模块要一致
•
B. 参照完整性未被破坏:数据不会找不到参照
•
C. 数据在内部一致
•
D. 不存在交叉系统匹配违规,数据被很好集成
答案: 请关注ybaotk.com搜题查看答案
问题 355: 157. ETL时拆分数据可以使用()。
选项:
•
A. AVERAGE
•
B. Lookup
•
C. DELETE
•
D. SUM
答案: 请关注ybaotk.com搜题查看答案
问题 356: 158. 字符串“ab”可以匹配正则表达式“\w{3}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 357: 159. Java、Python等语言也支持正则表达式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 358: 160. 字符串Chapter12345可满足正则表达式Chapter [12345]”匹配要求。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 359: 161. 字符串“aaaaaa”可以匹配正则表达式“\w{3,}”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 360: 162. 正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 361: 163. 对于一些合并的数据字段,预处理时可以依据业务需求对字段进行分解。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 362: 164. 正则表达式中有一些预定义的字符分类,其中,()表示任意单词字符。
选项:
•
A. \d
•
B. $
•
C. \w
•
D. \s
答案: 请关注ybaotk.com搜题查看答案
问题 363: 165. 在merge()方法中,如果希望合并结果包含左表和右表的所有键值,how参数应该设置为什么?
选项:
•
A. left
•
B. right
•
C. outer
•
D. inner
答案: 请关注ybaotk.com搜题查看答案
问题 364: 166. 数据质量的一致性指的是()。
选项:
•
A. 数据是否被一致的定义或理解
•
B. 数据是否正确的表示了现实或可证实的来源
•
C. 所有需要的数据都存在
•
D. 数据之间的参照完整性是否存在或一致
答案: 请关注ybaotk.com搜题查看答案
问题 365: 167. 数据清洗主要目的是()。
选项:
•
A. 集成数据
•
B. 抽取数据
•
C. 转换数据
•
D. 清除噪声数据
答案: 请关注ybaotk.com搜题查看答案
问题 366: 168. 数据质量的()表示数据是否正确的表示了现实或可证实的来源。
选项:
•
A. 完整性
•
B. 完备性
•
C. 正确性
•
D. 一致性
答案: 请关注ybaotk.com搜题查看答案
问题 367: 169. 如果在合并数据时希望忽略原来的行标签,应该设置concat()方法中的哪个参数?
选项:
•
A. join
•
B. on
•
C. ignore_index
•
D. axis
答案: 请关注ybaotk.com搜题查看答案
问题 368: 170. ETL过程中,对于空值的处理可以是()。
选项:
•
A. 按需求替换为其他含义数据
•
B. 删除相应属性
•
C. 删除相关数据项
•
D. 忽略
答案: 请关注ybaotk.com搜题查看答案
问题 369: 171. 正则表达式中,^ 匹配行尾。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 370: 172. 正则表达式中的 \s 表示任意数字。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 371: 173. 数据的时效性指数据是否易于获取、易于理解和易于使用。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 372: 1. Python具有跨平台的特性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 373: 2. 不能将Python嵌入到C/C++等其他语言编写的程序
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 374: 3. Python目前的最新的通用版本是Python 3.x。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 375: 4. Python是开源的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 376: 5. Python是一种冷门的语言。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 377: 6. Python开发的程序不能被移植到其他平台。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 378: 7. Python的源代码容易阅读,维护相对容易。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 379: 8. Python目前的最新的通用版本是Python 2.x。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 380: 9. Python不支持在Windows下运行。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 381: 10. Python是解释型的语言。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 382: 11. Python开发的程序可被移植到多种平台。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 383: 12. Python具有易于学习的优点。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 384: 13. Python不能联结其他语言编写的模块。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 385: 14. Python是编译型的语言。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 386: 15. Python的源代码不容易阅读,不容易维护。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 387: 16. DataFrame对象排序时的参数inplace=False表示()。
选项:
•
A. 升序排列
•
B. 操作直接在原数据上操作
•
C. 当前操作不会改变原数据
•
D. 降序排列
答案: 请关注ybaotk.com搜题查看答案
问题 388: 17. DataFrame对象可以通过()方法删除相应的行或者列。
选项:
•
A. sort
•
B. insert
•
C. drop
•
D. append
答案: 请关注ybaotk.com搜题查看答案
问题 389: 18. import pandas as pd这个语句用于()。
选项:
•
A. 删除pandas包
•
B. 重启服务器
•
C. 导入pd包
•
D. 导入pandas包
答案: 请关注ybaotk.com搜题查看答案
问题 390: 19. DataFrame 对象可以进行的操作是()。
选项:
•
A. 其余均是
•
B. 添加数据
•
C. 把数据排序
•
D. 删除数据
答案: 请关注ybaotk.com搜题查看答案
问题 391: 20. DataFrame对象的insert方法用于()。
选项:
•
A. 增加数据
•
B. 新建对象
•
C. 删除数据
•
D. 排序
答案: 请关注ybaotk.com搜题查看答案
问题 392: 21. 对Series对象进行切片索引时,()。
选项:
•
A. 只可以使用值进行切片索引
•
B. 只可以使用下标来进行切片索引
•
C. 只可以使用标签进行切片索引
•
D. 既可以使用标签进行切片索引,也可以使用下标来进行切片索引
答案: 请关注ybaotk.com搜题查看答案
问题 393: 22. [1] 是Series的第()个元素。
选项:
•
A. 3
•
B. 1
•
C. 最后一个
•
D. 2
答案: 请关注ybaotk.com搜题查看答案
问题 394: 23. 读取CSV文件可以使用DataFrame的( )方法。
选项:
•
A. read_excel
•
B. read_csv
•
C. read_sql
•
D. read_json
答案: 请关注ybaotk.com搜题查看答案
问题 395: 24. 堆叠合并操作可以通过 pandas 库的( )方法完成。。
选项:
•
A. concat()
•
B. append()
•
C. drop()
•
D. insert()
答案: 请关注ybaotk.com搜题查看答案
问题 396: 25. Series对象可以通过()方法删除相应的元素值。
选项:
•
A. append
•
B. drop
•
C. sort
•
D. insert
答案: 请关注ybaotk.com搜题查看答案
问题 397: 26. Python语句:“df[df['豆瓣评分']>10]”可以输出()。
选项:
•
A. 筛选出空的值
•
B. 筛选出评分大于 10 的值
•
C. 筛选出评分等于 10 的值
•
D. 筛选出评分小于 10 的值
答案: 请关注ybaotk.com搜题查看答案
问题 398: 27. 将数据写入csv文件可以使用DataFrame的( )方法。
选项:
•
A. to_sql
•
B. to_excel
•
C. to_csv
•
D. to_json
答案: 请关注ybaotk.com搜题查看答案
问题 399: 28. pandas 可以通过下面哪个方法来判断数据是否有空值?( )。
选项:
•
A. append()
•
B. isnull()
•
C. drop()
•
D. insert()
答案: 请关注ybaotk.com搜题查看答案
问题 400: 29. DataFrame 对象调用哪个方法来查看缺失值?( )
选项:
•
A. isnull()
•
B. drop()
•
C. insert()
•
D. sum()
答案: 请关注ybaotk.com搜题查看答案
问题 401: 30. 若对象s是Series对象,则score.head可用于()。
选项:
•
A. 输出后5个元素
•
B. 输出后1个元素
•
C. 输出前5个元素
•
D. 输出前1个元素
答案: 请关注ybaotk.com搜题查看答案
问题 402: 31. 主键合并可以通过 pandas 库的( )方法完成。。
选项:
•
A. append()
•
B. merge()
•
C. drop()
•
D. insert()
答案: 请关注ybaotk.com搜题查看答案
问题 403: 32. 读取Excel文件可以使用DataFrame的( )方法。
选项:
•
A. read_json
•
B. read_csv
•
C. read_sql
•
D. read_excel
答案: 请关注ybaotk.com搜题查看答案
问题 404: 33. 将数据写入MySQL数据库可以使用DataFrame的( )方法。
选项:
•
A. to_csv
•
B. to_sql
•
C. to_excel
•
D. to_json
答案: 请关注ybaotk.com搜题查看答案
问题 405: 34. 将数据写入Excel文件可以使用DataFrame的( )方法。
选项:
•
A. to_csv
•
B. to_json
•
C. to_excel
•
D. to_sql
答案: 请关注ybaotk.com搜题查看答案
问题 406: 35. DataFrame的loc和iloc方法用于进行()。
选项:
•
A. 增加
•
B. 删除
•
C. 排序
•
D. 索引
答案: 请关注ybaotk.com搜题查看答案
问题 407: 36. 可以将Python嵌入到C/C++等其他语言编写的程序。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 408: 37. Python不是开源的
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 409: 38. Python具有一个广泛的标准库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 410: 39. Python是一种强大的、可扩展性强的面向对象编程语言。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 411: 40. Python可以在Windows、MacOS、linux等环境下运行。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 412: 41. Python具有互动模式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 413: 42. 可以通过()创建DataFrame。
选项:
•
A. 列表
•
B. 二维数组和字典
•
C. 二维数组
•
D. 字典
答案: 请关注ybaotk.com搜题查看答案
问题 414: 43. DataFrame对象的属性T表示()。
选项:
•
A. 元素的值
•
B. 列标签信息
•
C. 元素的数据类型
•
D. 元素的行列数据转换
答案: 请关注ybaotk.com搜题查看答案
问题 415: 44. 关于DataFrame的操作,下列说法不正确的是()。
选项:
•
A. False
•
B. 1表示对列操作关汉卿
•
C. 在DataFrame对象df中添加一行数据可以使用df.loc[], 添加一列数据可以使用df[],[]里面为行标签或者列标签
•
D. DataFrame对象按值排序使用sort_values方法,按标签排序使用sort_index方法
•
E. 0表示对行操作,axis
•
F. DataFrame的删除和修改操作中,如果直接对原数据进行操作,需要指定参数inplace
•
G. DataFrame的删除和修改操作中,参数axis
答案: 请关注ybaotk.com搜题查看答案
问题 416: 45. pandas中的数据结构Series是()的。
选项:
•
A. 一维
•
B. 二维
•
C. 四维
•
D. 三维
答案: 请关注ybaotk.com搜题查看答案
问题 417: 46. 如果Series对象中有N个元素,则下标的取值为()。
选项:
•
A. N-1
•
B. 0至N
•
C. 0至N-1
•
D. 0
答案: 请关注ybaotk.com搜题查看答案
问题 418: 47. Series和DataFrame对象排序时的参数ascending表示()。
选项:
•
A. 降序
•
B. 升序
•
C. 按标签
•
D. 按值
答案: 请关注ybaotk.com搜题查看答案
问题 419: 48. Series对象可以使用()方法按存储的元素的值来排序。
选项:
•
A. sort_values
•
B. drop
•
C. append
•
D. sort_index
答案: 请关注ybaotk.com搜题查看答案
问题 420: 49. DataFrame的loc方法基于()索引。
选项:
•
A. 标签
•
B. 下标
•
C. 对象名
•
D. 值
答案: 请关注ybaotk.com搜题查看答案
问题 421: 50. DataFrame的iloc方法基于()索引。
选项:
•
A. 下标
•
B. 标签
•
C. 对象名
•
D. 值
答案: 请关注ybaotk.com搜题查看答案
问题 422: 51. 将数据写入json文件可以使用DataFrame的( )方法。
选项:
•
A. to_csv
•
B. to_sql
•
C. to_json
•
D. to_excel
答案: 请关注ybaotk.com搜题查看答案
问题 423: 52. pandas中的数据结构Series若使用下标索引,[-1]表示()。
选项:
•
A. 第1个元素
•
B. 第2个元素
•
C. 最后1个元素
•
D. 中间的元素
答案: 请关注ybaotk.com搜题查看答案
问题 424: 53. 读取MySQL数据库可以使用DataFrame的( )方法。
选项:
•
A. read_excel
•
B. read_json
•
C. read_csv
•
D. read_sql
答案: 请关注ybaotk.com搜题查看答案
问题 425: 54. DataFrame对象的isnull方法用于()。
选项:
•
A. 排序
•
B. 查看数据
•
C. 判断数据是否有空值
•
D. 删除
答案: 请关注ybaotk.com搜题查看答案
问题 426: 55. DataFrame 对象调用哪个方法来删除缺失值?()。
选项:
•
A. notnull()
•
B. fillna()
•
C. dropna()
•
D. isnull()
答案: 请关注ybaotk.com搜题查看答案
问题 427: 56. Python具有丰富和强大的库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 428: 57. Python没有开源的标准库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 429: 58. Python不具有跨平台的特性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 430: 59. Python不易于初学者学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 431: 60. DataFrame对象的shape用于()。
选项:
•
A. 返回DataFrame对象的行数([0]),列数
•
B. 返回元素的值
•
C. 返回元素的数据类型
•
D. 进行元素的行列数据转换
答案: 请关注ybaotk.com搜题查看答案
问题 432: 61. 读取json文件可以使用DataFrame的( )方法。
选项:
•
A. read_excel
•
B. read_sql
•
C. read_csv
•
D. read_json
答案: 请关注ybaotk.com搜题查看答案
问题 433: 62. 关于 Series 的操作,下列说法正确的是()。
选项:
•
A. Series 对象可以通过标签来增加、删除和修改单个值
•
B. Series 对象的下标是从 1 开始的
•
C. Series 对象只能按值排序,不支持通过标签来排序
•
D. Series 对象使用下标进行切片索引时,包含下标索引结束的元素
答案: 请关注ybaotk.com搜题查看答案
问题 434: 63. ( )的目的是将存储在多张表中的数据合并为一张表,便于进行数据分析。
选项:
•
A. 数据变换
•
B. 数据清洗
•
C. 数据归约
•
D. 数据合并
答案: 请关注ybaotk.com搜题查看答案
问题 435: 64. pandas中的数据结构DataFrame是()的。
选项:
•
A. 二维
•
B. 四维
•
C. 三维
•
D. 一维
答案: 请关注ybaotk.com搜题查看答案
问题 436: 65. DataFrame是一种()维数据表结构。
选项:
•
A. 三
•
B. 二
•
C. 四
•
D. 一
答案: 请关注ybaotk.com搜题查看答案
问题 437: 66. 以下关于 Jupyter Lab 的说法,不正确的是()。
选项:
•
A. Jupyter Lab 是 Jupyter 的一个拓展
•
B. Jupyter Lab 不支持可视化调试
•
C. Jupyter Lab 提供了 Notebook 和 Console 等交互模式
•
D. Jupyter Lab 支持预览和编辑更多种类的文件
答案: 请关注ybaotk.com搜题查看答案
问题 438: 67. 读取CSV文件和TXT文件都可以使用DataFrame的( )方法。
选项:
•
A. read_json
•
B. read_csv
•
C. read_sql
•
D. read_excel
答案: 请关注ybaotk.com搜题查看答案
问题 439: 68. pandas中的数据结构Series若使用下标索引,其索引值从()开始。
选项:
•
A. 0
•
B. 2
•
C. 1
•
D. 3
答案: 请关注ybaotk.com搜题查看答案
问题 440: 69. 关于DataFrame的排序操作,以下说法不正确的是()。
选项:
•
A. 对DataFrame排序可以按值排序,也可以按行/列标签排序。,
•
B. 按值排序使用sort_values方法
•
C. 按标签排序使用sort_index方法
•
D. 按值排序使用sort_index方法
答案: 请关注ybaotk.com搜题查看答案
问题 441: 70. DataFrame对象按标签排序使用()方法。
选项:
•
A. sort_index
•
B. append
•
C. drop
•
D. sort_values
答案: 请关注ybaotk.com搜题查看答案
问题 442: 71. mountainsDF是DataFrame对象,关于以下语句的作用,说法正确的是 mountainsDF[mountainsDF['height']>1500]()。
选项:
•
A. 按height列的值筛选出大于1500的行
•
B. 按height行的值筛选出小于1500的列
•
C. 按height行的值筛选出大于1500的列
•
D. 按height列的值筛选出小于1500的行
答案: 请关注ybaotk.com搜题查看答案
问题 443: 72. Series对象的方法可以对存储的元素进行下面哪些操作()。
选项:
•
A. 增加
•
B. 删除
•
C. 修改
•
D. 其余均是
答案: 请关注ybaotk.com搜题查看答案
问题 444: 73. DataFrame的每一列都是一个()对象。
选项:
•
A. Series
•
B. 数值
•
C. 字符
•
D. 字典
答案: 请关注ybaotk.com搜题查看答案
问题 445: 74. DataFrame 对象调用哪个方法来填充缺失值?()。
选项:
•
A. dropna()
•
B. fillna()
•
C. isnull()
•
D. notnull()
答案: 请关注ybaotk.com搜题查看答案
问题 446: 75. ( )就是对“脏”数据进行的检查与纠正,目的包括补充缺失的值,解决数据的重复和不一致性等。
选项:
•
A. 数据归约
•
B. 数据变换
•
C. 数据清洗
•
D. 数据合并
答案: 请关注ybaotk.com搜题查看答案 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
上一篇:国开电大广东开放大学社交礼仪(本)作业答案下一篇:国开电大广东开放大学网络金融(专)作业答案
|