2025年春江苏开放大学数据挖掘技术辅导资料

[复制链接]
查看: 111|回复: 0

24万

主题

24万

帖子

34万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
348890
发表于 2025-3-22 10:25:28 | 显示全部楼层 |阅读模式
文档说明:本人针对该科精心汇总了历年题库及答案,形成一个完整的题库,并且每年都在更新。该题库对考生的复习、作业和考试起着非常重要的作用,会给您节省大量的时间。做考题时,利用本文档中的查找工具,把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有期末考核试题、其他网核及教学考一体化、一网一平台复习试题与答案,敬请查看。
课程题目试题是随机的,请按题目关键词查找(或按Ctrl+F输入题目中的关键词,尽量不要输入整个题目,不要复制空格,连续的几个字就行)
本文由
江开
搜题提供,禁止复制盗取,违者必究
本文由
江开
搜题提供,禁止复制盗取,违者必究
本文由
江开
搜题提供,禁止复制盗取,违者必究
数据挖掘技术
学校: 无
问题 1: 1. 决策树中不包含以下哪种节点( )。
选项:

A.
内部节点

B.
根节点

C.
外部节点

D.
叶结点
答案: 外部节点
问题 2: 2. 以下哪种技术对于减少数据集的维度会更好( )。
选项:

A.
删除不同数据趋势的列

B.
删除数据差异较大的列

C.
删除缺少值太多的列

D.
都不是
答案: 删除缺少值太多的列
问题 3: 3. 以下哪个聚类算法不属于基于网格的聚类算法()。
选项:

A. WaveCluster

B. BIRCH

C.
MAFIA

D. STING
答案: BIRCH
问题 4: 4. 以下哪个算法是分类算法()。
选项:

A. EM

B. DBSCAN

C. C4.5

D. K-Mean
答案: C4.5
问题 5: 5. 关联规则的评价指标是( )。
选项:

A.
均方误差、均方根误差

B. Kappa
统计、显著性检验

C.
支持度、置信度

D.
平均绝对误差、相对误差
答案: 支持度、置信度
问题 6: 6. 以下哪项关于决策树的说法是错误的()。
选项:

A.
寻找最佳决策树是
NP
完全问题

B.
冗余属性不会对决策树的准确率造成不利的影响

C.
子树可能在决策树中重复多次

D.
决策树算法对于噪声的干扰非常敏感
答案: 决策树算法对于噪声的干扰非常敏感
问题 7: 7. 一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
选项:

A. K-
中心点聚类问题

B.
二分类问题

C.
多分类问题

D.
层次聚类问题
答案
:
请关注
查看答案
问题 8: 8. 以下哪个分类方法可以较好地避免样本的不平衡问题()。
选项:

A. Bayes

B.
神经网络

C. KNN

D. SVM
答案
:
请关注
查看答案
问题 9: 9. 关于欠拟合,下面哪个说法是正确的( )。
选项:

A.
训练误差较小,测试误差较大

B.
训练误差较大,测试误差较大

C.
训练误差较大,测试误差较小

D.
训练误差不变,测试误差较大
答案
:
请关注
查看答案
问题 10: 10. 我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
选项:

A.
增加学习率

B.
减少树的深度

C.
增加树的深度

D.
减少树的数量
答案
:
请关注
查看答案
问题 11: 11. 一般,K-NN最近邻方法在( )的情况下效果较好。
选项:

A.
样本较少但典型性好

B.
样本呈团状分布

C.
样本较多但典型性不好

D.
样本呈链状分布
答案
:
请关注
查看答案
问题 12: 12. 当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
选项:

A.
主成分分析

B.
聚类

C.
关联规则

D.
分类
答案
:
请关注
查看答案
问题 13: 13. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
选项:

A.
模糊聚类

B.
划分聚类

C.
非互斥聚类

D.
层次聚类
答案
:
请关注
查看答案
问题 14: 14. BIRCH是一种()。
选项:

A.
特征选择算法

B.
关联分析算法

C.
分类器

D.
聚类算法
答案
:
请关注
查看答案
问题 15: 15. 以下不属于影响聚类算法结果的主要因素有( )。
选项:

A.
分类准则

B.
模式相似性测度

C.
已知类别的样本质量

D.
特征选取
答案
:
请关注
查看答案
问题 16: 16. 以下( )算法是关联规则挖掘。
选项:

A. K-Means

B. ID3

C. Apriori

D. DBSCAN
答案
:
请关注
查看答案
问题 17: 17. 惰性学习法主要包括:
选项:
答案
:
请关注
查看答案
问题 18: 18. 分类的基本过程:
选项:
答案
:
请关注
查看答案
问题 19: 19. 回归分析的步骤     。
选项:
答案
:
请关注
查看答案
问题 20: 20. 影响基本K-均值算法的主要因素有( )。
选项:

A.
聚类准则

B.
样本的数量

C.
样本输入顺序

D.
模式相似性测度
答案
:
请关注
查看答案
问题 21: 21. “点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
选项:

A.
模型预测准确率不高,我们需要做点什么改进模型

B.
模型预测准确率已经很高了,我们不需要做什么了

C.
无法下结论

D.
以上都不对
答案
:
请关注
查看答案
问题 22: 22. 下列哪个描述是正确的( )。
选项:

A.
回归是有指导的学习,聚类是无指导的学习

B.
回归是无指导的学习,聚类是有指导的学习

C.
回归和聚类都是有指导的学习

D.
回归和聚类都是无指导的学习
答案
:
请关注
查看答案
问题 23: 23. 下列关于凝聚层次聚类的说法,说法正确的是( )。
选项:

A.
空间复杂度

B.
一旦两个簇合并,该操作还能撤销

C.
算法的终止条件是仅剩下一个簇

D.
具有全局优化目标函数
答案
:
请关注
查看答案
问题 24: 24. 分类的基本过程:
选项:
答案
:
请关注
查看答案
问题 25: 25. 支持向量机的3种模型可分为:
选项:
答案
:
请关注
查看答案
问题 26: 26. 惰性学习法主要包括:
选项:
答案
:
请关注
查看答案
问题 27: 27. 层次聚类方法可分为:
选项:
答案
:
请关注
查看答案
问题 28: 28. 回归分析的步骤
选项:
答案
:
请关注
查看答案

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x





上一篇:2025年春江苏开放大学审计学辅导资料
下一篇:2025年春江苏开放大学数字合成辅导资料
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图