|
大数据技术(专)
学校: 无
问题 1: 1. 将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为()。所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
选项:
•
A. 关联规则
•
B. 机器学习
•
C. 聚类
•
D. 云计算
答案: 聚类
问题 2: 2. 以下哪个不是无监督学习()。
选项:
•
A. K-means
•
B. KNN
•
C. PCA
•
D. Apriori
答案: KNN
问题 3: 3. 以下哪个不属于分类算法()。
选项:
•
A. K均值算法
•
B. KNN算法
•
C. 朴素贝叶斯
•
D. 决策树
答案: K均值算法
问题 4: 4. ()分析又称为变异数分析,主要用于两个及两个以上样本均数差别的显著性检验。
选项:
•
A. 回归分析
•
B. 相关分析
•
C. 因子分析
•
D. 方差分析
答案: 方差分析
问题 5: 5. 以下哪个是聚类分析的典型算法()。
选项:
•
A. Apriori算法
•
B. SVM算法
•
C. KNN算法
•
D. K均值算法
答案: K均值算法
问题 6: 6. 以下哪些分类方法可以较好地避免样本的不平衡问题()。
选项:
•
A. 神经网络
•
B. SVM
•
C. Bayes
•
D. KNN
答案: KNN
问题 7: 7. ()分析又称为变异数分析,主要用于两个及两个以上样本均数差别的显著性检验。
选项:
•
A. 方差分析
•
B. 相关分析
•
C. 因子分析
•
D. 回归分析
答案: 请关注ybaotk.com搜题查看答案
问题 8: 8. 下面哪种不属于数据预处理的方法()。
选项:
•
A. 估计遗漏值
•
B. 变量代换
•
C. 聚集
•
D. 离散化
答案: 请关注ybaotk.com搜题查看答案
问题 9: 9. 分类与回归树(ClassificationAndRegressionTree)是一种()。
选项:
•
A. 有向图
•
B. 最小生成树
•
C. 无向图
•
D. 决策树
答案: 请关注ybaotk.com搜题查看答案
问题 10: 10. ()是在掌握大量观察数据的基础上,利用数理统计方法建立变量与自变量之间的回归关系函数表达式。
选项:
•
A. 主成分分析
•
B. 预测分析
•
C. 指数分析
•
D. 回归分析
答案: 请关注ybaotk.com搜题查看答案
问题 11: 11. ()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。
选项:
•
A. 指数分析
•
B. 预测分析
•
C. 回归分析
•
D. 主成分分析
答案: 请关注ybaotk.com搜题查看答案
问题 12: 12. 以下哪个不是决策树的算法()。
选项:
•
A. ID3
•
B. Prim
•
C. C4.5
•
D. CART
答案: 请关注ybaotk.com搜题查看答案
问题 13: 13. 可用作数据挖掘分析中的关联规则算法有()。
选项:
•
A. Apriori算法
•
B. K均值法
•
C. 决策树
•
D. 线性回归
答案: 请关注ybaotk.com搜题查看答案
问题 14: 14. 决策树中不包含一下哪种结点()。
选项:
•
A. 叶结点
•
B. 根结点
•
C. 外部结点
•
D. 内部结点
答案: 请关注ybaotk.com搜题查看答案
问题 15: 15. 以下哪些算法是基于规则的分类器()。
选项:
•
A. C4.5
•
B. KNN
•
C. 朴素贝叶斯
•
D. 人工神经网络
答案: 请关注ybaotk.com搜题查看答案
问题 16: 16. 美国沃尔玛连锁超市的真实案例:尿布与啤酒这两种风马牛不相及的商品居然摆在一起,但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。这个案例是使用了()的典型例子。
选项:
•
A. 聚类
•
B. 云计算
•
C. 关联规则
•
D. 物联网
答案: 请关注ybaotk.com搜题查看答案
问题 17: 17. 以下哪个不属于有监督学习技术()。
选项:
•
A. K-Means
•
B. CART
•
C. 朴素贝叶斯
•
D. 线性回归
答案: 请关注ybaotk.com搜题查看答案
问题 18: 18. ()的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
选项:
•
A. 数据变换
•
B. 数据集成
•
C. 数据归约
•
D. 数据清洗
答案: 请关注ybaotk.com搜题查看答案
问题 19: 19. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务()。
选项:
•
A. 建模描述
•
B. 寻找模式和规则
•
C. 预测建模
•
D. 根据内容检索
答案: 请关注ybaotk.com搜题查看答案
问题 20: 20. ()是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。
选项:
•
A. 质心
•
B. 边界点
•
C. 离群点
•
D. 核心点
答案: 请关注ybaotk.com搜题查看答案
问题 21: 21. 以下哪个不属于有监督学习技术()。
选项:
•
A. 朴素贝叶斯
•
B. CART
•
C. K-Means
•
D. 线性回归
答案: 请关注ybaotk.com搜题查看答案
问题 22: 22. 以下哪个是聚类分析的典型算法()。
选项:
•
A. SVM算法
•
B. KNN算法
•
C. K均值算法
•
D. Apriori算法
答案: 请关注ybaotk.com搜题查看答案
问题 23: 23. 分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。
选项:
•
A. 聚类分析
•
B. 时序预测
•
C. 分类与回归
•
D. 关联规则挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 24: 24. 可用作数据挖掘分析中的关联规则算法有()。
选项:
•
A. K均值法
•
B. 线性回归
•
C. Apriori算法
•
D. 决策树
答案: 请关注ybaotk.com搜题查看答案
问题 25: 25. 噪声数据处理的主要方法不包括() 。
选项:
•
A. 关联分析
•
B. 回归
•
C. 分箱
•
D. 聚类
答案: 请关注ybaotk.com搜题查看答案
问题 26: 26. 以下哪个算法是分类算法()。
选项:
•
A. EM
•
B. DBSCAN
•
C. K-Mean
•
D. C4.5
答案: 请关注ybaotk.com搜题查看答案
问题 27: 27. 为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务()。
选项:
•
A. 探索性数据分析
•
B. 预测建模
•
C. 建模描述
•
D. 寻找模式和规则
答案: 请关注ybaotk.com搜题查看答案
问题 28: 28. 以下哪些方法可用于预测分析()。
选项:
•
A. 指数平滑
•
B. 回归分析
•
C. 周期变化分析
•
D. 其余选项均是
答案: 请关注ybaotk.com搜题查看答案
问题 29: 29. ()是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。
选项:
•
A. 回归分析
•
B. 主成分分析
•
C. 预测分析
•
D. 指数分析
答案: 请关注ybaotk.com搜题查看答案
问题 30: 30. 分布式存储是指存储节点大于一个、数据保存()以及()的计算网络。
选项:
•
A. 高性能
•
B. 多副本
•
C. 安全
•
D. 完整
答案: 请关注ybaotk.com搜题查看答案
问题 31: 31. ()都属于聚类算法中簇有效性的监督度量。
选项:
•
A. 共性分类相关系数
•
B. 熵
•
C. F度量
•
D. 轮廓系数
答案: 请关注ybaotk.com搜题查看答案
问题 32: 32. 以下关于决策树的说法,正确的有()。
选项:
•
A. 决策树算法对于噪声的干扰非常敏感
•
B. 冗余属性不会对决策树的准确率造成不利的影响
•
C. 子树可能在决策树中重复多次
•
D. 寻找最佳决策树是NP完全问题
答案: 请关注ybaotk.com搜题查看答案
问题 33: 33. 数据挖掘可以应用在以下哪些领域()。
选项:
•
A. 化学分子结构分析
•
B. 传感数据
•
C. 天体/空间物理数据
•
D. 生物学基因序列分析
答案: 请关注ybaotk.com搜题查看答案
问题 34: 34. 簇有效性的面向相似性的度量包括()。
选项:
•
A. Rand统计量
•
B. 精度
•
C. 召回率
•
D. Jaccard系数
答案: 请关注ybaotk.com搜题查看答案
问题 35: 35. 机器学习综合应用了()等学科知识。
选项:
•
A. 心理学
•
B. 概率学
•
C. 神经生理学
•
D. 自动化和计算机科学
答案: 请关注ybaotk.com搜题查看答案
问题 36: 36. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务()。
选项:
•
A. 预测建模
•
B. 探索性数据分析
•
C. 寻找模式和规则
•
D. 建模描述
答案: 请关注ybaotk.com搜题查看答案
问题 37: 37. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离()。
选项:
•
A. 聚类
•
B. 聚类
•
C. 隐马尔可夫链
•
D. 分类
答案: 请关注ybaotk.com搜题查看答案
问题 38: 38. 以下哪个属于非关系型数据库()。
选项:
•
A. Access
•
B. Mysql
•
C. SQL
•
D. MonogoDB
答案: 请关注ybaotk.com搜题查看答案
问题 39: 39. 以下说法不正确的是()。
选项:
•
A. 决策树方法通常用于关联规则挖掘。
•
B. 分类是预测数据对象的离散类别。
•
C. Apriori算法是一种典型的关联规则挖掘算法。
•
D. 预测是用于数据对象的连续取值。
答案: 请关注ybaotk.com搜题查看答案
问题 40: 40. ()是在已知各种情况发生概率的基础上,通过构成树状结构来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。
选项:
•
A. 文本树
•
B. 哈夫曼树
•
C. 决策树
•
D. 生成树
答案: 请关注ybaotk.com搜题查看答案
问题 41: 41. 电商网站上的猜你喜欢”实际上是基于()原理。
选项:
•
A. 推荐系统
•
B. 物联网
•
C. 数据仓库
•
D. 网络爬虫
答案: 请关注ybaotk.com搜题查看答案
问题 42: 42. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?
选项:
•
A. 根据内容检索
•
B. 寻找模式和规则
•
C. 建模描述
•
D. 预测建模
答案: 请关注ybaotk.com搜题查看答案
问题 43: 43. ()是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析。
选项:
•
A. 数据抽取
•
B. 数据加载
•
C. 数据挖掘
•
D. 数据整合
答案: 请关注ybaotk.com搜题查看答案
问题 44: 44. 以下哪些算法是分类算法()。
选项:
•
A. C4.5
•
B. DBSCAN
•
C. EM
•
D. K-Means
答案: 请关注ybaotk.com搜题查看答案
问题 45: 45. 以下说法正确的是()。
选项:
•
A. 聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。
•
B. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
•
C. 原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的。
•
D. 可信度是对关联规则的准确度的衡量。
答案: 请关注ybaotk.com搜题查看答案
问题 46: 46. 以下哪项不属于数据挖掘的内容()。
选项:
•
A. 补充与完善路网属性
•
B. 建立道路拥堵概率与拥堵趋势变化模型
•
C. 高德地图导航躲避拥堵的功能
•
D. 多维分析统计用户出行规律
答案: 请关注ybaotk.com搜题查看答案
问题 47: 47. Kmeans算法包括如下步骤: ①在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类; ②更新中心点为每类的均值; ③随机选取k个中心点; ④j<-j+1,迭代更新,直至误差小到某个值或者到达一定的迭代步数,误差不变。 这些步骤正确的排序是()。
选项:
•
A. ①④③②
•
B. ④③②①
•
C. ③①②④
•
D. ①②③④
答案: 请关注ybaotk.com搜题查看答案
问题 48: 48. BIRCH是一种()。
选项:
•
A. 关联分析算法
•
B. 分类器
•
C. 聚类算法
•
D. 特征选择算法
答案: 请关注ybaotk.com搜题查看答案
问题 49: 49. 预测建模任务主要包括哪几大类问题?
选项:
•
A. 模式发现和模式匹配
•
B. 分类和模式匹配
•
C. 分类和模式发现
•
D. 分类和回归
答案: 请关注ybaotk.com搜题查看答案
问题 50: 50. 推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。
选项:
•
A. 客户过去的购买行为和购买记录
•
B. 客户的兴趣爱好
•
C. 客户的个人信息
•
D. 客户的朋友
答案: 请关注ybaotk.com搜题查看答案
问题 51: 51. 协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项推荐给有相似兴趣的用户。
选项:
•
A. 预测
•
B. 相同
•
C. 相似
•
D. 推荐
答案: 请关注ybaotk.com搜题查看答案
问题 52: 52. 贝叶斯学习包括()。
选项:
•
A. 参数学习
•
B. 规则学习
•
C. 结构学习
•
D. 聚类分析
答案: 请关注ybaotk.com搜题查看答案
问题 53: 53. 寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤()。
选项:
•
A. 选择一个算法过程使评分函数最优
•
B. 决定如何量化和比较不同表示拟合数据的好坏
•
C. 决定用什么样的数据管理原则以高效地实现算法
•
D. 决定要使用的表示的特征和结构
答案: 请关注ybaotk.com搜题查看答案
问题 54: 54. 以下属于聚类算法的是()。
选项:
•
A. Apriori
•
B. Jarvis-Patrick(JP)
•
C. DBSCAN
•
D. K均值
答案: 请关注ybaotk.com搜题查看答案
问题 55: 55. 机器学习常见算法有()。
选项:
•
A. 朴素贝叶斯
•
B. 决策树
•
C. 支持向量机
•
D. 随机森林
答案: 请关注ybaotk.com搜题查看答案
问题 56: 56. 传统机器学习的研究方向包括()。
选项:
•
A. 决策树
•
B. 随机森林
•
C. 贝叶斯学习
•
D. 人工神经网络
答案: 请关注ybaotk.com搜题查看答案
问题 57: 57. 在统计计算中,()算法是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。
选项:
•
A. Apriori算法
•
B. KNN算法
•
C. K-Means算法
•
D. 最大期望算法
答案: 请关注ybaotk.com搜题查看答案
问题 58: 58. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()。
选项:
•
A. 预测建模
•
B. 建模描述
•
C. 寻找模式和规则
•
D. 探索性数据分析
答案: 请关注ybaotk.com搜题查看答案
问题 59: 59. 下列关于网络用户行为的说法中,错误的是()。
选项:
•
A. 用户离散的交互痕迹能够为企业提升服务质量提供参考
•
B. 网络公司能够捕捉到用户在其网站上的所有行为
•
C. 数字轨迹用完即自动删除
•
D. 用户的隐私安全很难得以规范保护
答案: 请关注ybaotk.com搜题查看答案
问题 60: 60. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。
选项:
•
A. 分类
•
B. 聚类
•
C. 自然语言处理
•
D. 关联规则发现
答案: 请关注ybaotk.com搜题查看答案
问题 61: 61. ()是研究两个或两个以上处于同等地位的随机变量相关性的统计分析方法,包括变量之间是否存在依存关系,存在什么样的依存方向等等。
选项:
•
A. 回归分析
•
B. 相关分析
•
C. 判别分析
•
D. 主成分分析
答案: 请关注ybaotk.com搜题查看答案
问题 62: 62. 如下哪个不是最近邻分类器的特点。()
选项:
•
A. 分类一个测试样例开销很大
•
B. 最近邻分类器基于全局信息进行预测
•
C. 它使用具体的训练实例进行预测,不必维护源自数据的模型
•
D. 可以生产任意形状的决策边界
答案: 请关注ybaotk.com搜题查看答案
问题 63: 63. 用于分类与回归应用的主要算法有
选项:
•
A. RBF神经网络、K均值法、决策树
•
B. 决策树、BP神经网络、贝叶斯
•
C. K均值法、SOM神经网络
•
D. Apriori算法、HotSpot算法
答案: 请关注ybaotk.com搜题查看答案
问题 64: 64. 以下各项均是针对数据仓库的不同说法,不正确的有()。
选项:
•
A. 数据仓库就是数据库
•
B. 数据仓库是面向业务的,支持联机事务处理(OLTP)
•
C. 数据仓库是一切商业智能系统的基础
•
D. 数据仓库支持决策而非事务处理
答案: 请关注ybaotk.com搜题查看答案
问题 65: 65. 贝叶斯学习包括()。
选项:
•
A. 参数学习
•
B. 结构学习
•
C. 示例学习
•
D. 神经网络学习
答案: 请关注ybaotk.com搜题查看答案
问题 66: 66. 基于学习目标对机器学习的分类包括()。
选项:
•
A. 类别学习
•
B. 函数学习
•
C. 贝叶斯网络学习
•
D. 概念学习
答案: 请关注ybaotk.com搜题查看答案
问题 67: 67. 基于学习目标对机器学习的分类包括()。
选项:
•
A. 类别学习
•
B. 贝叶斯网络学习
•
C. 函数学习
•
D. 规则学习
答案: 请关注ybaotk.com搜题查看答案
问题 68: 68. 下面哪些属于可视化高维数据技术()。
选项:
•
A. 平行坐标系
•
B. 矩阵
•
C. Chernoff脸
•
D. 星形坐标
答案: 请关注ybaotk.com搜题查看答案
问题 69: 69. 以下关于规则学习的说法正确的有()。
选项:
•
A. 典型主要有神经网络学习
•
B. 典型的主要有决策树学习
•
C. 学习的目标和结果为规则
•
D. 是为了获得规则的学习
答案: 请关注ybaotk.com搜题查看答案
问题 70: 70. 以下关于人工神经网络(ANN)的说法,正确的有()。
选项:
•
A. 神经网络对训练数据中的噪声非常鲁棒
•
B. 可以处理冗余特征
•
C. 至少含有一个隐藏层的多层神经网络
•
D. 训练ANN是一个很耗时的过程
答案: 请关注ybaotk.com搜题查看答案
问题 71: 71. 机器学习常见算法有()。
选项:
•
A. Boosting与Bagging
•
B. 人工神经网络
•
C. 随机森林
•
D. 决策树
答案: 请关注ybaotk.com搜题查看答案
问题 72: 72. 以下关于机器学习的说法正确的有()。
选项:
•
A. 是使计算机具有智能的途径
•
B. 是一门人工智能的科学
•
C. 近年来,机器学习领域的研究发展迅速
•
D. 是对能通过经验自动改进的计算机算法的研究
答案: 请关注ybaotk.com搜题查看答案
问题 73: 73. 以下哪些算法不是分类算法()。
选项:
•
A. EM
•
B. C4.5
•
C. K-Mean
•
D. DBSCAN
答案: 请关注ybaotk.com搜题查看答案
问题 74: 74. 机器学习的应用领域有()。
选项:
•
A. 机器视觉
•
B. 非单调推理
•
C. 自然语言处理
•
D. 模式识别
答案: 请关注ybaotk.com搜题查看答案
问题 75: 75. 机器学习常见算法有()。
选项:
•
A. 关联规则
•
B. Boosting与Bagging
•
C. 人工神经网络
•
D. EM(期望最大化)
答案: 请关注ybaotk.com搜题查看答案
问题 76: 76. 贝叶斯学习包括()。
选项:
•
A. 决策树学习
•
B. 神经网络学习
•
C. 参数学习
•
D. 结构学习
答案: 请关注ybaotk.com搜题查看答案
问题 77: 77. 以下关于机器学习的说法正确的有()。
选项:
•
A. 是一门人工智能的科学
•
B. 机器学习是一门多领域交叉学科
•
C. 是对能通过经验自动改进的计算机算法的研究
•
D. 是使计算机具有智能的途径
答案: 请关注ybaotk.com搜题查看答案
问题 78: 78. 下列哪些是专门用于可视化时间空间数据的技术()。
选项:
•
A. 曲面图
•
B. 矢量场图
•
C. 饼图
•
D. 等高线图
答案: 请关注ybaotk.com搜题查看答案
问题 79: 79. 对大数据的管理和使用包括哪些方面?()。
选项:
•
A. 大数据的存储
•
B. 大数据的运营
•
C. %%25%大数据的挖掘
•
D. 大数据的应用
答案: 请关注ybaotk.com搜题查看答案
问题 80: 80. 以下关于机器学习的说法正确的有()。
选项:
•
A. 是人工智能核心
•
B. 机器学习是一门多领域交叉学科
•
C. 是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能
•
D. 是使计算机具有智能的途径
答案: 请关注ybaotk.com搜题查看答案
问题 81: 81. 基于学习目标对机器学习的分类包括()。
选项:
•
A. 贝叶斯网络学习
•
B. 概念学习
•
C. 函数学习
•
D. 规则学习
答案: 请关注ybaotk.com搜题查看答案
问题 82: 82. 数据挖掘算法的组成包括()。
选项:
•
A. 模型或模型结构
•
B. 优化和搜索方法
•
C. 评分函数
•
D. 数据管理策略
答案: 请关注ybaotk.com搜题查看答案
问题 83: 83. 机器学习的应用领域有()。
选项:
•
A. 自然语言处理
•
B. 机器视觉
•
C. 图像识别
•
D. 数据预测
答案: 请关注ybaotk.com搜题查看答案
问题 84: 84. 目前机器学习的发展说法正确的有()。
选项:
•
A. 融合了各种学习方法,且形式多样的集成学习系统研究正在兴起
•
B. 相关的学术活动空前活跃
•
C. 机器学习与人工智能各种基础问题的统一性观点正在形成
•
D. 应用范围不断扩大,部分应用研究成果已转化为产品
答案: 请关注ybaotk.com搜题查看答案
问题 85: 85. 决策树中包含以下哪种结点()。
选项:
•
A. 内部结点
•
B. 外部结点
•
C. 根结点
•
D. 叶结点
答案: 请关注ybaotk.com搜题查看答案
问题 86: 86. 机器学习的应用领域有()。
选项:
•
A. 语音识别
•
B. 自然语言处理
•
C. 机器视觉
•
D. 商业智能
答案: 请关注ybaotk.com搜题查看答案
问题 87: 87. 以下哪些聚类算法属于基于原型的聚类()。
选项:
•
A. SOM
•
B. EM算法
•
C. 模糊c均值
•
D. CLIQUE
答案: 请关注ybaotk.com搜题查看答案
问题 88: 88. 基于学习目标对机器学习的分类包括()。
选项:
•
A. 规则学习
•
B. 类别学习
•
C. 函数学习
•
D. 概念学习
答案: 请关注ybaotk.com搜题查看答案
问题 89: 89. 下面哪些是数据仓库的基本特征()。
选项:
•
A. 数据仓库的数据是反映历史变化的
•
B. 数据仓库的数据是集成的
•
C. 数据仓库的数据是相对稳定的
•
D. 数据仓库是面向主题的
答案: 请关注ybaotk.com搜题查看答案
问题 90: 90. 在现实世界的数据中,元组在某些属性上缺少值是常有的,处理这些缺失值方法可以是()。
选项:
•
A. 使用属性的平均值填充空缺值
•
B. 使用最可能的值填充空缺值
•
C. 使用一个全局常量填充空缺值
•
D. 使用与给定元组属同一类的所有样本的平均值
答案: 请关注ybaotk.com搜题查看答案
问题 91: 91. ()这些数据特性都是对聚类分析具有很强影响的。。
选项:
•
A. 稀疏性
•
B. 规模
•
C. 高维性
•
D. 噪声和离群点
答案: 请关注ybaotk.com搜题查看答案
问题 92: 92. 下面属于数据集的一般特性的有()。
选项:
•
A. 维度
•
B. 稀疏性
•
C. 分辨率
•
D. 相异性
答案: 请关注ybaotk.com搜题查看答案
问题 93: 93. 关于混合模型聚类算法的优缺点,下面说法不正确的是()。
选项:
•
A. 当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
•
B. 混合模型在有噪声和离群点时不会存在问题
•
C. 混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布
•
D. 混合模型很难发现不同大小和椭球形状的簇
答案: 请关注ybaotk.com搜题查看答案
问题 94: 94. 基于学习方式对机器学习的分类包括()。
选项:
•
A. 规则学习
•
B. 无监督学习
•
C. 结构化学习
•
D. 监督学习
答案: 请关注ybaotk.com搜题查看答案
问题 95: 95. 数据挖掘的预测建模任务主要包括哪几大类问题()。
选项:
•
A. 回归
•
B. 分类
•
C. 模式匹配
•
D. 模式发现
答案: 请关注ybaotk.com搜题查看答案
问题 96: 96. 机器学习常见算法有()。
选项:
•
A. 人工神经网络
•
B. 支持向量机
•
C. 随机森林
•
D. 决策树
答案: 请关注ybaotk.com搜题查看答案
问题 97: 97. 以下哪些学科和数据挖掘有密切联系()。
选项:
•
A. 计算机组成原理
•
B. 人工智能
•
C. 统计
•
D. 矿产挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 98: 98. 以下各项均是针对数据仓库的不同说法,正确的有()。
选项:
•
A. 数据仓库支持决策而非事务处理
•
B. 数据仓库就是数据库
•
C. 数据仓库是面向业务的
•
D. 数据仓库是一切商业智能系统的基础
答案: 请关注ybaotk.com搜题查看答案
问题 99: 99. 关于K均值和DBSCAN的比较,以下说法正确的有()。
选项:
•
A. K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
•
B. K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
•
C. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
•
D. K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
答案: 请关注ybaotk.com搜题查看答案
问题 100: 1. ()是一个由Apache基金会所开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。它实现了一个分布式文件系统,充分利用集群的威力进行高速运算和存储。
选项:
•
A. Hadoop
•
B. NoSQL
•
C. Linux
•
D. Tomcat
答案: 请关注ybaotk.com搜题查看答案
问题 101: 2. 最早提出大数据时代概念的公司是()。
选项:
•
A. 谷歌公司
•
B. 麦肯锡公司
•
C. 微软公司
•
D. 脸谱公司
答案: 请关注ybaotk.com搜题查看答案
问题 102: 3. 目前所获取的总数据量的80%以上都是()数据。。
选项:
•
A. 半结构化
•
B. 结构化
•
C. 非结构化
•
D. 文本
答案: 请关注ybaotk.com搜题查看答案
问题 103: 4. 下面哪一项不属于大数据系统的必备要素()。
选项:
•
A. 数据
•
B. 物联网
•
C. 数据库
•
D. 云平台
答案: 请关注ybaotk.com搜题查看答案
问题 104: 5. 以下哪个不属于大数据的关键技术()。
选项:
•
A. 并行化
•
B. 数据表
•
C. 可视化
•
D. 流处理
答案: 请关注ybaotk.com搜题查看答案
问题 105: 6. 大数据往往是指()及以上级别的数据量。
选项:
•
A. PB
•
B. GB
•
C. TB
•
D. MB
答案: 请关注ybaotk.com搜题查看答案
问题 106: 7. ( )反映数据的精细化程度,越细化的数据,价值越高。
选项:
•
A. 规模
•
B. 活性
•
C. 颗粒度
•
D. 关联度
答案: 请关注ybaotk.com搜题查看答案
问题 107: 8. 以下哪个不属于大数据技术的特征()。
选项:
•
A. 随机抽样
•
B. 重视数据的复杂性
•
C. 关注数据的相关性
•
D. 全面分析数据
答案: 请关注ybaotk.com搜题查看答案
问题 108: 9. 数据的不确定性的产生原因不包括()。
选项:
•
A. 数据特征描述
•
B. 缺失值处理
•
C. 数据精度转换
•
D. 数据采集与传输
答案: 请关注ybaotk.com搜题查看答案
问题 109: 10. 推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。
选项:
•
A. 客户过去的购买行为和购买记录
•
B. 客户的兴趣爱好
•
C. 客户的朋友
•
D. 客户的个人信息
答案: 请关注ybaotk.com搜题查看答案
问题 110: 11. 利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展现的关联,大大提升政府决策的科学性。()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 111: 12. 大数据一般是指数量级为GB以上的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 112: 13. 数据仓库就是数据库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 113: 14. 人们关心大数据的是数据本身。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 114: 15. 用户离散的交互痕迹能够为企业提升服务质量提供参考。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 115: 16. 大数据具有6V特征。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 116: 17. 大数据分析在分析效果要求绝对精确。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 117: 18. 宁家骏委员指出,云计算、大数据、物联网等技术主导了21世纪。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 118: 19. 大数据环境下的隐私担忧,主要表现为()。
选项:
•
A. 恶意广告推送
•
B. 个人信息的被识别与暴露
•
C. 用户画像的生成
•
D. 病毒入侵
答案: 请关注ybaotk.com搜题查看答案
问题 119: 20. 下面陈述不正确的是()。
选项:
•
A. 大数据将实现科学决策
•
B. 大数据将实现科学决策
•
C. 大数据彻底将群体性事件化解在萌芽状态
•
D. 大数据将实现预测式决策
答案: 请关注ybaotk.com搜题查看答案
问题 120: 21. 大数据的6V特征中,Volume表示()
选项:
•
A. 大量
•
B. 高速
•
C. 多样
•
D. 低价值密度
答案: 请关注ybaotk.com搜题查看答案
问题 121: 22. 下面哪一项不属于大数据关键技术()。
选项:
•
A. 关系型数据库
•
B. 分布式文件系统
•
C. 云计算
•
D. 数据众包
答案: 请关注ybaotk.com搜题查看答案
问题 122: 23. ()是研究两个或两个以上处于同等地位的随机变量相关性的统计分析方法,包括变量之间是否存在依存关系,存在什么样的依存方向等等。
选项:
•
A. 回归分析
•
B. 相关分析
•
C. 判别分析
•
D. 主成分分析
答案: 请关注ybaotk.com搜题查看答案
问题 123: 24. 大数据处理流程不包括以下哪个()。
选项:
•
A. 数据分析与挖掘
•
B. 结果展示
•
C. 抽样统计
•
D. 数据采集
答案: 请关注ybaotk.com搜题查看答案
问题 124: 25. 以下关于大数据关键问题的说法,不正确的是()。
选项:
•
A. 传统的统计理论与技术能很好地实现大数据知识发现
•
B. 大数据复杂性,不确定性特征描述的方法及大数据的系统建模是实现大数据知识发现的前提与关键
•
C. 大数据处理问题复杂多样,难以用一种单一的计算模式涵盖互联网企业表现强势
•
D. 非结构化与半结构化数据的处理是一项重要的课题
答案: 请关注ybaotk.com搜题查看答案
问题 125: 26. 以下哪个选项是目前利用大数据分析技术无法进行有效支持的()。
选项:
•
A. 个人消费习惯分析及预测
•
B. 天气情况预测
•
C. 精确预测股票价格
•
D. 新型病毒的分析判断
答案: 请关注ybaotk.com搜题查看答案
问题 126: 27. 目前,我国互联网、移动互联网用户规模居全球第(),拥有丰富的数据资源和应用市场优势。
选项:
•
A. 二
•
B. 一
•
C. 四
•
D. 三
答案: 请关注ybaotk.com搜题查看答案
问题 127: 28. 大数据的()指数据能够被组织并呈现。借助于图形化手段,清晰有效地传达和沟通信息。基于数据,借助可视化手段提高大脑利用率。
选项:
•
A. 多样性
•
B. 低价值密度
•
C. 可视化
•
D. 大量性
答案: 请关注ybaotk.com搜题查看答案
问题 128: 29. 数据仓库的最终目的是建立数据仓库逻辑模型。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 129: 30. 大数据的应用之一是,促进健康管理的个性化和多元化。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 130: 31. 大数据对提升政府决策的科学性没有依据。()
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 131: 32. 大数据最显著的特征是数据价值密度高。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 132: 33. 大数据只能处理收集到的准确的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 133: 34. 基于大数据的营销模式比传统营销模式实时性更强。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 134: 35. 在采集数据时要注意用户的隐私安全问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 135: 36. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 136: 37. 许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务水平或者避免风险,这是大数据在()的技术。
选项:
•
A. 预测分析
•
B. 知识搜索
•
C. 数据整合
•
D. 数据校验
答案: 请关注ybaotk.com搜题查看答案
问题 137: 38. 国务院于()年印发了《促进大数据发展行动纲要》,指出数据已成为国家基础性战略资源。
选项:
•
A. 2014
•
B. 2016
•
C. 2015
•
D. 2017
答案: 请关注ybaotk.com搜题查看答案
问题 138: 39. 分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。
选项:
•
A. 聚类分析
•
B. 时序预测
•
C. 分类与回归
•
D. 关联规则挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 139: 40. 以下哪个不属于大数据的技术特征()。
选项:
•
A. 关注数据的相关性
•
B. 力求数据的精确性
•
C. 重视数据的复杂性
•
D. 分析全面的数据
答案: 请关注ybaotk.com搜题查看答案
问题 140: 41. 预测建模任务主要包括哪几大类问题?
选项:
•
A. 模式发现和模式匹配
•
B. 分类和模式发现
•
C. 分类和回归
•
D. 分类和模式匹配
答案: 请关注ybaotk.com搜题查看答案
问题 141: 42. 大数据的本质是( )。
选项:
•
A. 挖掘
•
B. 洞察
•
C. 联系
•
D. 搜集
答案: 请关注ybaotk.com搜题查看答案
问题 142: 43. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 143: 44. 原始数据集来自多个数据库或数据仓库,它们的结构和规则是相同的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 144: 45. 大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,计算各种事件发生的概率。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 145: 46. 计算机数据存储的容量单位,1MB>1GB>1TB。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 146: 47. 高德地图使用大数据能进行小路的识别。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 147: 48. 数据开放一般要求要提供全部的原始数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 148: 49. 智能健康手环的应用开发,体现了传感器的数据采集技术的应用。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 149: 50. 中国大数据产业特征不包括()。
选项:
•
A. 互联网企业表现强势
•
B. 大数据基础研究受到重视
•
C. 大数据整体解决方案已成熟
•
D. 区域产业集聚现雏形
答案: 请关注ybaotk.com搜题查看答案
问题 150: 51. 现在非结构化数据大约占人类数据总量的25%。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 151: 52. 大数据的数据规模大,数据价值密度高。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 152: 53. 大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 153: 54. 大数据的应用注重因果分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 154: 55. Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 155: 56. 在不同的数据存在阶段,数据的价值是不同的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 156: 57. 2016年,国务院印发《促进大数据发展行动纲要》。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 157: 58. 人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其所蕴含的价值,从而为人们生产生活带来有益的改变。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 158: 59. 大数据的(),指的是数据有很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显、且语法或句义不连贯。
选项:
•
A. 多样性
•
B. 高速
•
C. 低价值密度
•
D. 大量性
答案: 请关注ybaotk.com搜题查看答案
问题 159: 60. 下面关于数据开放的陈述哪个是不正确的()。
选项:
•
A. 要提供应用程序开放接口
•
B. 允许公民要求数据开放数据
•
C. 要提供全部的原始数据
•
D. 允许公众免费查询、下载
答案: 请关注ybaotk.com搜题查看答案
问题 160: 61. 大数据处理难点在于“数据量大”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 161: 62. 传统营销模式比基于大数据的营销模式转化率低。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 162: 63. 内存通常是集群的最主要瓶颈。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 163: 64. 数据的关联度反映数据的精细化程度,越细化的数据,价值越高。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 164: 65. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 165: 66. 不同的数据存在阶段,数据的价值是不同的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 166: 67. 大数据起源于金融行业。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 167: 68. 数据重组实现的关键在于多源数据融合和数据集成。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 168: 69. 大数据的6V特征中,Variety表示()
选项:
•
A. 高速
•
B. 多样
•
C. 大量
•
D. 低价值密度
答案: 请关注ybaotk.com搜题查看答案
问题 169: 70. 大数据通常是指GB级以上的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 170: 71. 大数据分析中,在数据基础上倾向于典型抽样数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 171: 72. 大数据的目的在于发现新的知识与洞察并进行科学决策。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 172: 73. 躲避拥堵是高德地图导航的数据挖掘内容之一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 173: 74. 大数据分析之前首先要进行抽样分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 174: 75. 数据仓库是面向业务的,支持联机事务处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 175: 76. 数据生命周期管理旨在产生效益的同时,降低生产成本。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 176: 77. 数据再利用可挖掘数据的潜在价值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 177: 78. 大数据起源于农业。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 178: 79. 传统营销模式比基于大数据的营销模式针对性更强。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 179: 80. 大数据还是一种思维方式和新的管理、治理路径。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 180: 81. 计算机数据存储的容量单位,1KB<1MB<1GB。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 181: 82. 大数据的应用注重因果分析而不是相关分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 182: 83. 医疗健康大数据可能包括诊疗数据、个人健康管理数据等。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 183: 84. 根据数据价值的不同应该对数据采取不同的管理策略。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 184: 85. 从经济社会视角来看,大数据的重点在于“数据量大”。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 185: 86. 计算机数据存储的容量单位,1KB<1GB<1TB。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 186: 87. 处理大数据需采用新型计算架构和智能算法等新技术。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 187: 88. 数据仓库主要面向事务处理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 188: 89. 大数据的运用能够加强交通管理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 189: 90. 大数据通常结构单一。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 190: 91. 大数据的应用注重相关分析而不是因果分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 191: 92. 大数据具有体量大、结构单一、时效性强的特征。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 192: 93. 数据重组有利于实现新颖的数据模式创新。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 193: 94. 在产业发展领域,大数据加速了产业优化升级的步伐。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 194: 95. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 195: 1. K均值算法是分类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 196: 2. 高德地图中,可通过数据挖掘,多维分析统计用户出行规律。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 197: 3. 决策树方法通常用于关联规则挖掘。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 198: 4. 聚类就是分类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 199: 5. Web数据挖掘是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 200: 6. 分类模型的误差大致分为两种:训练误差和泛化误差。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 201: 7. K-means是一种聚类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 202: 8. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 203: 9. Key-value型(Redis)数据库是关系数据库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 204: 10. 回归分析分析又称为变异数分析,主要用于两个及两个以上样本均数差别的显著性检验。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 205: 11. KNN是基于规则的分类器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 206: 12. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 207: 13. 抽样统计是大数据处理的其中一项流程。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 208: 14. 分类是预测数据对象的离散类别。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 209: 15. 聚类是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 210: 16. 聚类分析时不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 211: 17. KNN算法是分类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 212: 18. 特征提取技术并不依赖于特定的领域。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 213: 19. 决策树方法通常用于关联规则挖掘。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 214: 20. 使用大数据可实现预测式决策。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 215: 21. SVM可以通过核方法(kernel method)进行非线性分类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 216: 22. 图挖掘技术在社会网络分析中扮演了重要的角色。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 217: 23. 聚类分析可以看作是一种非监督的分类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 218: 24. 聚类分析可以看作是一种非监督的分类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 219: 25. 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 220: 26. 回归算法可用于预测分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 221: 27. 线性回归可用于预测分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 222: 28. 分类与回归树是一种最小生成树。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 223: 29. 图型(Neo4j)数据库是关系数据库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 224: 30. K-means算法是有监督学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 225: 31. KNN是一种分类方法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 226: 32. KNN是一种聚类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 227: 33. 大数据分析中,在分析效果上追究精确性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 228: 34. 朴素贝叶斯是有监督学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 229: 35. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 230: 36. 监督学习的实例或数据对象没有类别标记。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 231: 37. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 232: 38. 贝叶斯分析方法是贝叶斯学习的基础,它提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 233: 39. 分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法、粗糙集法和遗传算法等。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 234: 40. 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 235: 41. Apriori算法是一种典型的关联规则挖掘算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 236: 42. 对遗漏数据的处理方法主要有:忽略该条记录;手工填补遗漏值;利用默认值填补遗漏值;利用均值填补遗漏值;利用同类别均值填补遗漏值;利用最可能的值填充遗漏值等。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 237: 43. KNN算法中,所选择的邻居都是已经正确分类的对象。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 238: 44. SVM是一类监督学习方式对数据进行二元分类的广义线性分类器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 239: 45. 基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 240: 46. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 241: 47. 神经网络对噪音数据具有高承受能力,并能对未经过训练的数据具有分类能力。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 242: 48. Apriori方法通常用于关联规则挖掘。。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 243: 49. 对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 244: 50. 聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 245: 51. 聚类是示例式的学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 246: 52. 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 247: 53. 将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 248: 54. 预测是用于数据对象的连续取值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 249: 55. KNN算法中,所选择的邻居都是还没分类的对象。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 250: 56. K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 251: 57. Apriori算法是无监督学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 252: 58. 如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 253: 59. 数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 254: 60. C4.5是一种决策树的算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 255: 61. 聚类分析是有监督学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 256: 62. Birch 算法是一种非常有效的、传统的层次聚类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 257: 63. 决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 258: 64. 大数据分析时,在分析方法上更注重相关分析而不是因果分析。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 259: 65. 聚类是观察式学习。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 260: 66. 数据挖掘可用于在地图软件中建立道路拥堵概率与拥堵趋势变化模型。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 261: 67. 特征提取技术依赖于特定的领域。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 262: 68. 数据挖掘的目标在于数据采集策略。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 263: 69. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 264: 70. 可信度是对关联规则的准确度的衡量。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 265: 71. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越好。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 266: 72. 用于分类的离散化方法之间的根本区别在于是否使用类信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 267: 73. 聚类分析所使用方法的不同也会得到相同的结论。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 268: 74. KNN算法不仅可以用于分类,还可以用于回归。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 269: 75. 基于邻近度的离群点检测方法能处理具有不同密度区域的数据集。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 270: 76. 贝叶斯法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 271: 77. K-means算法属于分类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 272: 78. BIRCH是一种分类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 273: 79. KNN算法不能用于回归。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 274: 80. 具有较高的支持度的项集具有较高的置信度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 275: 81. 朴素贝叶斯是一种分类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 276: 82. 数据分析中,脏数据是完全不能用的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 277: 83. 回归分析通常用于挖掘关联规则。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 278: 84. C4.5是基于规则的分类器。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 279: 85. “啤酒和尿布”是关联规则分析的一个典型例子。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 280: 86. 聚类分析可以看作是一种有监督的分类。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 281: 87. 如果一个对象属于某个簇,那么该对象是基于聚类的离群点。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 282: 88. 给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 283: 89. Apriori算法是一种典型的聚类分析算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 284: 90. 给定由两次运行K均值产生的两个不同的簇集,误差的平方和最小的那个应该被视为较优。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 285: 91. 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 286: 92. 聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有较大的相似性,而不同簇间的对象有较大的相异性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 287: 93. BIRCH是一种分类和回归算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 288: 94. 聚类分析所使用方法的不同,常常会得到不同的结论。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 289: 95. 在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 290: 96. DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 291: 97. 无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 292: 98. 无监督学习的实例或数据对象有类别标记。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 293: 99. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 294: 100. BIRCH是一种聚类算法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 295: 101. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 296: 102. 用于分类的离散化方法之间没有根本区别。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 297: 103. 聚类与分类的不同在于,聚类所要求划分的类是未知的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 298: 104. 监督学习的实例或数据对象有类别标记。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 299: 105. 分类模型的误差只有模型训练误差。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 300: 106. SVM是一种无监督学习的分类方法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 301: 1. 下面()程序负责 HDFS 数据存储。
选项:
•
A. NameNode
•
B. Jobtracker
•
C. Datanode
•
D. SecondaryNameNode
答案: 请关注ybaotk.com搜题查看答案
问题 302: 2. ()是数值数据分布的精确图形表示,是一个连续变量(定量变量)的概率分布的估计。它是一种条形图。
选项:
•
A. 圆环图
•
B. 折线图
•
C. 散点图
•
D. 直方图
答案: 请关注ybaotk.com搜题查看答案
问题 303: 3. MapReduce任务过程分为两个处理阶段:map阶段和()阶段。。
选项:
•
A. reduce
•
B. Map/Reduce
•
C. master
•
D. map
答案: 请关注ybaotk.com搜题查看答案
问题 304: 4. 大数据可视化可以用在以下何种场景()。
选项:
•
A. 其余所有选项均可
•
B. 电子地图
•
C. 公司财务报表、销售统计
•
D. 股票趋势
答案: 请关注ybaotk.com搜题查看答案
问题 305: 5. HDFS默认BlockSize的大小是()。
选项:
•
A. 32MB
•
B. 256MB
•
C. 128MB
•
D. 64MB
答案: 请关注ybaotk.com搜题查看答案
问题 306: 6. HDFS默认BlockSize的大小是()。
选项:
•
A. 32MB
•
B. 128MB
•
C. 64MB
•
D. 256MB
答案: 请关注ybaotk.com搜题查看答案
问题 307: 7. 下列关于MapReduce说法不正确的是()。。
选项:
•
A. MapReduce来源于google的学术论文
•
B. MapReduce是一种计算框架
•
C. MapReduce隐藏了并行计算的细节,方便使用
•
D. MapReduce程序只能用Java语言编写
答案: 请关注ybaotk.com搜题查看答案
问题 308: 8. 下列演示方式中,不属于传统统计图方式的是()。
选项:
•
A. 饼状图
•
B. 柱状图
•
C. 曲线图
•
D. 网络图
答案: 请关注ybaotk.com搜题查看答案
问题 309: 9. 以下哪个不属于大数据可视化的应用()。
选项:
•
A. 响应式表单
•
B. 医学影像
•
C. 热点地图
•
D. 天气云图
答案: 请关注ybaotk.com搜题查看答案
问题 310: 10. ()框架由一个单独的master JobTracker和每个集群节点一个slave TaskTracker共同组成。
选项:
•
A. Map/Reduce
•
B. Map
•
C. Reduce
•
D. master
答案: 请关注ybaotk.com搜题查看答案
问题 311: 11. MapReduce确保每个reducer的输入都是按键排序的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 312: 12. 高德地图中的实时路况是一种大数据可视化的应用。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 313: 13. 大数据的应用可以促进健康管理的个性化和多元化。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 314: 14. HDFS默认Block Size是256MB。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 315: 15. 可视化是大数据分析的根本目的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 316: 16. 在数据可视化中,图表越复杂,越能反映数据的细节。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 317: 17. 定量属性只能是整数值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 318: 18. 数据可视化的效果与色彩的搭配无关。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 319: 19. 在数据可视化中,一般颜色越深代表数值越大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 320: 20. 数据可视化的目的是为了让数据更易于理解。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 321: 21. ()表示数据分布的集中位置,如Mean:平均数、Median:中位数、Mode:众数等。
选项:
•
A. 数据分布形状
•
B. 数据属性
•
C. 集中趋势度量
•
D. 离中趋势度
答案: 请关注ybaotk.com搜题查看答案
问题 322: 22. 方差是衡量什么的?
选项:
•
A. 数据点的中位数
•
B. 数据点的总数
•
C. 数据点与平均数之间差异的平方的平均值
•
D. 数据集中最大值与最小值之差
答案: 请关注ybaotk.com搜题查看答案
问题 323: 23. 在统计分析中,如果数据点的权重不同,应该使用哪种集中趋势度量?
选项:
•
A. 加权平均数
•
B. 中位数
•
C. 简单平均数
•
D. 众数
答案: 请关注ybaotk.com搜题查看答案
问题 324: 24. 在统计学中,哪个度量用来衡量数据点相对于平均数的离散程度?
选项:
•
A. 众数(Mode)
•
B. 中位数(Median)
•
C. 平均数(Mean)
•
D. 标准差(Standard Deviation)
答案: 请关注ybaotk.com搜题查看答案
问题 325: 25. 标准差与方差的主要区别是什么?
选项:
•
A. 方差是标准差的平方
•
B. 它们是相同的度量
•
C. 标准差是方差的两倍
•
D. 标准差是方差的平方根
答案: 请关注ybaotk.com搜题查看答案
问题 326: 26. 大数据的特征不包含()。
选项:
•
A. 价值密度高
•
B. 规模性
•
C. 高速性
•
D. 多样性
答案: 请关注ybaotk.com搜题查看答案
问题 327: 27. 在统计分析中,如果需要计算不同数据点的加权平均值,每个数据点需要什么?
选项:
•
A. 中位数(Median)
•
B. 标准差(Standard Deviation)
•
C. 权重(Weight)
•
D. 众数(Mode)
答案: 请关注ybaotk.com搜题查看答案
问题 328: 28. 在统计学中,如果数据集的分布是对称的,通常认为其分布接近哪种分布?
选项:
•
A. 扁平分布
•
B. 正态分布
•
C. 偏态分布
•
D. 多峰分布
答案: 请关注ybaotk.com搜题查看答案
问题 329: 29. ()是一种用作显示一组数据分散情况资料的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。
选项:
•
A. 雷达图
•
B. 直方图
•
C. 折线图
•
D. 箱形图
答案: 请关注ybaotk.com搜题查看答案
问题 330: 30. ()是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。
选项:
•
A. 离群点
•
B. 质心
•
C. 核心点
•
D. 边界点
答案: 请关注ybaotk.com搜题查看答案
问题 331: 31. 以下哪个属于非关系型数据库()。
选项:
•
A. MonogoDB
•
B. Mysql
•
C. Access
•
D. SQL
答案: 请关注ybaotk.com搜题查看答案
问题 332: 32. 以下各项均是针对数据仓库的不同说法,不正确的有()。
选项:
•
A. 数据仓库就是数据库
•
B. 数据仓库是面向业务的,支持联机事务处理(OLTP)
•
C. 数据仓库是一切商业智能系统的基础
•
D. 数据仓库支持决策而非事务处理
答案: 请关注ybaotk.com搜题查看答案
问题 333: 33. 大数据的()指数据能够被组织并呈现。借助于图形化手段,清晰有效地传达和沟通信息。基于数据,借助可视化手段提高大脑利用率。
选项:
•
A. 低价值密度
•
B. 可视化
•
C. 大量性
•
D. 多样性
答案: 请关注ybaotk.com搜题查看答案
问题 334: 34. 数据可视化中实现中数据映射指的是()
选项:
•
A. 概括现实生活中用户遇到的问题
•
B. 确定数据到标记和视觉通道的映射
•
C. 视图的选择与用户交互控制的设计
•
D. 从数据源中选取有效数据
答案: 请关注ybaotk.com搜题查看答案
问题 335: 35. Hadoop框架中最核心的设计是()。
选项:
•
A. MapReduce和HDFS
•
B. ZooKeeper和HDFS
•
C. MapReduce和Hive
•
D. Hive和HDFS
答案: 请关注ybaotk.com搜题查看答案
问题 336: 36. ( )反映数据的精细化程度,越细化的数据,价值越高。
选项:
•
A. 关联度
•
B. 规模
•
C. 活性
•
D. 颗粒度
答案: 请关注ybaotk.com搜题查看答案
问题 337: 37. 数据可视化技术是指对各类型数据源的海量数据以及实时和接近实时的分布式数据进行显示。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 338: 38. 习近平总书记指出,要不断推动我国网信事业发展,让互联网更好造福人民。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 339: 39. CPU通常是集群的最主要瓶颈。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 340: 40. 一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 341: 41. Hadoop作者是Kent Beck。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 342: 42. 孤立点在数据挖掘时总是被视为异常、无用数据而丢弃。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 343: 43. 数据的清晰度是衡量数据可视化好坏的唯一标准。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 344: 44. 标称属性的属性值之间是没有顺序关系的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 345: 45. 在噪声数据中,波动数据比离群点数据偏离整体水平更大。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 346: 46. ()是目标类数据的一般特性的汇总,通常以用户指定类的数据通过数据库查询收集,其输出可以用多种形式呈现,例如饼图,条形图,折线图等等。
选项:
•
A. 数据属性
•
B. 数据采集
•
C. 数据整合
•
D. 数据特征
答案: 请关注ybaotk.com搜题查看答案
问题 347: 47. 以下哪个不是描述数据集中趋势的度量?
选项:
•
A. 平均数(Mean)
•
B. 方差(Variance)
•
C. 众数(Mode)
•
D. 中位数(Median)
答案: 请关注ybaotk.com搜题查看答案
问题 348: 48. 偏度是用来衡量什么的?
选项:
•
A. 数据的对称性
•
B. 数据的峰度
•
C. 数据的中心趋势
•
D. 数据的离散程度
答案: 请关注ybaotk.com搜题查看答案
问题 349: 49. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务()。
选项:
•
A. 数据流挖掘
•
B. 分类和预测
•
C. 数据预处理
•
D. 频繁模式挖掘
答案: 请关注ybaotk.com搜题查看答案
问题 350: 50. 偏度可以用来衡量数据的什么?
选项:
•
A. 集中趋势
•
B. 分布形状
•
C. 离中趋势
•
D. 离散程度
答案: 请关注ybaotk.com搜题查看答案
问题 351: 51. 正态分布的峰度被称为什么?
选项:
•
A. 低峰度
•
B. 高峰度
•
C. 正态峰度
•
D. 中峰度
答案: 请关注ybaotk.com搜题查看答案
问题 352: 52. 如果你要描述数据的平均增长情况,应该使用以下哪个度量?
选项:
•
A. 算术平均数(Arithmetic Mean)
•
B. 调和平均数(Harmonic Mean)
•
C. 加权平均数(Weighted Mean)
•
D. 几何平均数(Geometric Mean)
答案: 请关注ybaotk.com搜题查看答案
问题 353: 53. 中位数是数据集排序后哪个位置的数值?
选项:
•
A. 最小值
•
B. 最大值
•
C. 中间位置
•
D. 没有固定位置
答案: 请关注ybaotk.com搜题查看答案
问题 354: 54. 数据的集中趋势度量中,对异常值最不敏感的是哪一个?
选项:
•
A. 几何平均数
•
B. 中位数
•
C. 平均数
•
D. 众数
答案: 请关注ybaotk.com搜题查看答案
问题 355: 55. HDFS中的block默认保存()份
选项:
•
A. 1
•
B. 3
•
C. 不确定
•
D. 2
答案: 请关注ybaotk.com搜题查看答案
问题 356: 56. ()是一个由Apache基金会所开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。它实现了一个分布式文件系统,充分利用集群的威力进行高速运算和存储。
选项:
•
A. Hadoop
•
B. Tomcat
•
C. NoSQL
•
D. Linux
答案: 请关注ybaotk.com搜题查看答案
问题 357: 57. 以下关于大数据可视化的说法,不正确的是()
选项:
•
A. 涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术
•
B. 大数据可视化利用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行各种交互处理的理论、方法和技术
•
C. 能够把抽象、枯燥或难以理解的内容,包括看似毫无意义的数据、信息、知识等等以一种容易理解的视觉方式展示出来
•
D. 对多维数据进行切片、块、旋转等动作剖析数据,从而多角度多侧面观察数据
答案: 请关注ybaotk.com搜题查看答案
问题 358: 58. 以下哪一项不属于Hadoop可以运行的模式()。
选项:
•
A. 伪分布式模式
•
B. 互联模式
•
C. 单机(本地)模式
•
D. 分布式模式
答案: 请关注ybaotk.com搜题查看答案
问题 359: 59. 可视化实现时,根据可视化目标选择相应的图表形式,如果关注3个变量的分布情况,可选择()。
选项:
•
A. 柱状直方图
•
B. 3D区域图
•
C. 二维散点图
•
D. 折线直方图
答案: 请关注ybaotk.com搜题查看答案
问题 360: 60. HDFS中的block默认只保存1份。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 361: 61. Hadoop只有单机版运行模式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 362: 62. 大数据的概念是由谷歌公司提出的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 363: 63. 文档型(MonogoDB)数据库是关系数据库。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 364: 64. Hadoop作者是Martin Fowler。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 365: 65. 很多结构化的数据通常以文本文件存储。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 366: 66. 数据分为结构化数据与半结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 367: 67. 有些文本数据也可能是非结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 368: 68. 数据可视化仅仅是把数据以图表的形式呈现出来。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 369: 69. 标称属性的属性值可用来比较大小。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 370: 70. 极差对什么非常敏感?
选项:
•
A. 众数
•
B. 中位数
•
C. 异常值
•
D. 平均数
答案: 请关注ybaotk.com搜题查看答案
问题 371: 71. 当需要比较不同数据集的相对离散程度时,特别是当平均数差异较大时,通常使用哪个统计量?
选项:
•
A. 标准差
•
B. 变异系数(CV)
•
C. 四分位数间距(IQR)
•
D. 方差
答案: 请关注ybaotk.com搜题查看答案
问题 372: 72. 正态分布的均值和标准差分别是多少?
选项:
•
A. 均值1,标准差0
•
B. 均值1,标准差1
•
C. 均值0,标准差1
•
D. 均值0,标准差0
答案: 请关注ybaotk.com搜题查看答案
问题 373: 73. 多峰分布表明数据集中可能存在什么?
选项:
•
A. 不同的子群体或类别
•
B. 单一群体
•
C. 数据完全一致
•
D. 没有异常值
答案: 请关注ybaotk.com搜题查看答案
问题 374: 74. 标准差是方差的什么?
选项:
•
A. 平方
•
B. 两倍
•
C. 平方根
•
D. 倒数
答案: 请关注ybaotk.com搜题查看答案
问题 375: 75. 在描述数据分布形状时,如果数据分布的尾部向左延伸,这表示什么?
选项:
•
A. 正态分布
•
B. 多峰分布
•
C. 负偏态
•
D. 正偏态
答案: 请关注ybaotk.com搜题查看答案
问题 376: 76. ()主要包括偏态和峰值,常见的有正态分布、偏态分布等。
选项:
•
A. 集中趋势度量
•
B. 离中趋势度
•
C. 数据分布形状
•
D. 数据属性
答案: 请关注ybaotk.com搜题查看答案
问题 377: 77. 以下哪个选项是目前利用大数据分析技术无法进行有效支持的()。
选项:
•
A. 新型病毒的分析判断
•
B. 精确预测股票价格
•
C. 天气情况预测
•
D. 个人消费习惯分析及预测
答案: 请关注ybaotk.com搜题查看答案
问题 378: 78. ()是指对数据源进行清洗、裁剪,并共享多样化数据来加快数据分析。
选项:
•
A. 数据加载
•
B. 数据挖掘
•
C. 数据抽取
•
D. 数据整合
答案: 请关注ybaotk.com搜题查看答案
问题 379: 79. MapReduce中每个reducer的输入都是随机的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 380: 80. 2015年8月31日,国务院印发了《促进大数据发展行动纲要》。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 381: 81. 视频属于结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 382: 82. 序数属性的属性值不可用来比较大小。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 383: 83. 序数属性的属性值可以进行加减乘除等数学运算。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 384: 84. 在数据可视化中,数据的真实性无关紧要。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 385: 85. 数据可视化不涉及数据的清洗和整理。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 386: 86. 加权平均数考虑了数据点的什么?
选项:
•
A. 离散程度
•
B. 顺序
•
C. 出现次数
•
D. 权重
答案: 请关注ybaotk.com搜题查看答案
问题 387: 87. 如果一个数据集的偏度为正值,这表明数据集中存在什么?
选项:
•
A. 极端的低值
•
B. 没有极端值
•
C. 极端的高值
•
D. 均匀分布
答案: 请关注ybaotk.com搜题查看答案
问题 388: 88. 众数是数据集中什么数值?
选项:
•
A. 出现次数最多的数值
•
B. 总和
•
C. 平均数
•
D. 中位数
答案: 请关注ybaotk.com搜题查看答案
问题 389: 89. 在数据集中,如果大多数数据点都集中在较小的数值范围内,这通常意味着什么?
选项:
•
A. 大范围的离散
•
B. 小范围的集中趋势
•
C. 高方差
•
D. 低峰度
答案: 请关注ybaotk.com搜题查看答案
问题 390: 90. 数据集中的极差是指什么?
选项:
•
A. 数据集中的平均数
•
B. 数据集中的众数
•
C. 数据集中的中位数
•
D. 数据集中最大值与最小值之差
答案: 请关注ybaotk.com搜题查看答案
问题 391: 91. 了解数据的离中趋势度对于分析数据的什么非常重要?
选项:
•
A. 集中趋势
•
B. 分布形状
•
C. 稳定性和一致性
•
D. 频率分布
答案: 请关注ybaotk.com搜题查看答案
问题 392: 92. 在数据可视化中,数据的来源不重要。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 393: 93. 序数属性的属性值之间是没有顺序关系的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 394: 94. 数据可视化的效果不受显示设备的影响。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 395: 95. 数据可视化无需考虑用户的接受程度。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 396: 96. 音频属于非结构化数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 397: 97. 噪声和伪像是数据错误这一相同表述的两种叫法。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 398: 98. 饼图只能用于表示分类数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 399: 99. 离群点可以是合法的数据对象或者值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 400: 100. 脏数据是指格式不规范、编码不统一、意义不明或与实际业务关系不大的数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 401: 101. 为了对非结构化数据进行分析与挖掘,通常要进行特征提取。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 402: 102. 数据可视化的效果与数据量的大小无关。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 403: 103. 数据可视化时不需要考虑数据的来源和可靠性。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 404: 104. 数据可视化的结果可以用来支持决策。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 405: 105. 用于分类的离散化方法之间的根本区别在于是否使用类信息。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 406: 106. 数据的清晰度可以作为衡量数据可视化好坏的一种标准。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 407: 107. 非结构化数据一定不是文本数据。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 408: 108. 在数据可视化中,越复杂的数据集必然需要更简单的图表来表示。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 409: 109. 标称属性的属性值可以进行加减乘除等数学运算。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 410: 110. 离散属性可能具有无限个值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 411: 111. 数据可视化是数据分析的最后一个步骤。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 412: 112. 标称属性的属性值不可用来比较大小。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 413: 113. 噪声和数据错误是不同的。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 414: 114. 可视化大屏是数据可视化的一种形式。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 415: 115. 定量属性可以是整数值或者是连续值。
选项:
答案: 请关注ybaotk.com搜题查看答案
问题 416: 116. 可视化技术对于分析的数据类型通常是专用性的。
选项:
答案: 请关注ybaotk.com搜题查看答案 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
上一篇:国开电大广东开放大学财务会计(一)(专)作业答案下一篇:国开电大广东开放大学电算化会计(专)作业答案
|