四川开放大学大数据分析与挖掘技术作业答案_已处理_1

[复制链接]
查看: 12|回复: 0

24万

主题

24万

帖子

34万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
348890
发表于 2025-12-18 14:44:22 | 显示全部楼层 |阅读模式
1. 请问在Python中缺失值通常用( )来记号。

A. NaN

B. ?

C. NA

D. na

2. 请问不是缺失值通常用的处理方式是( )。

A. 填补

B. 删除

C. 插补

D. 提取

3. 数据整合后( )。

A. 数据量会增加

B. 数据量会不变

C. 数据的波动性增加

D. 数据波动性减小

4. 数据离散化可以采用( )方式。

A. 等宽或者等频

B. 插补

C. 抽样

D. 查询

5. 下面关于主成分分析说法错误的是( )。

A. 主成分是相互正交(垂直)的

B. 主成分捕获了数据差异最大的方向

C. 是线性降维方法

D. 是非线性降维方法

6. 数据经过标准化处理后( )。

A. 数据的波动性将会增加

B. 数据的波动单位为1

C. 数据的波动性将会减小

D. 数据值将被放大

7. 白化是指( )。

A. 从相关矩阵出发求解主成分

B. 从协方差矩阵出发求解主成分

C. 将数据进行标准化

D. 剔除数据中的异常值

8. 分类模型评价时,通常采用( )损失。

A. 0-1损失

B. 指数

C. 绝对值

D. 平方

9. 不是回归模型常采用的评价指标是( )。

A. MAE

B. MSE

C. R2

D. 准确率

10. 期望预测误差是指( )。

A. 真实值与预测值在某种损失函数下的平均值

B. 真实值与预测值之差

C. 真实值与预测值在某种损失函数下的值

D. 真实值与预测值之比

11. 缺失数据的处理方法包括( )。

A. 填补

B. 删除

C. 插补

D. 提取

12. 数据抽样后( )。

A. 数据量会增加

B. 数据量会减少

C. 数据的波动性可能增加

D. 数据波动性可能减小

13. 下面关于主成分分析说法正确的是( )。

A. 主成分是相互正交(垂直)的

B. 主成分捕获了数据差异最大的方向

C. 是线性降维方法

D. 是非线性降维方法

14. 期望预测误差中的方差部分是由( )带来的。

A. 最优解所在空间假设失误

B. 数据的随机性

C. 估计值自身的波动

D. 估计值的平均可能偏离了真实值

15. 聚类分析的外部评价指标通常有( )。

A. DBI

B. 兰德指数

C. Jaccard系数

D. FM指数

E. DI

16. 分类任务的评价指标通常采用( )。

A. 准确度

B. ROC曲线

C. 特效度

D. 灵敏度

E. 错分成本

17. 主成分分析中最大的特征值对应的特征向量也就是是数据差异最大的的方向。( )

18. 白化是指将数据进行标准化。( )

19. 数据经过标准化处理后,数据的波动性将会减小。( )

20. 在Python中缺失值通常用NA来记号。( )

21. 主成分是相互正交(垂直)的。( )

22. 回归模型评价时,通常采用0-1损失。( )

23. 兰德指数是聚类分析的内部评价指标。( )

24. 期望预测误差中的偏差部分是由估计值的平均可能偏离了真实值带来的。( )

25. 分类模型评价时,通常采用平方损失。( )

26. 由于最优解所在空间假设失误将会造成期望预测误差中的方差部分。





上一篇:四川开放大学外国文学专题作业答案_已处理_1
下一篇:四川开放大学实用写作作业答案_已处理_1
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图