|
楼主 |
发表于 2024-4-15 22:19:46
|
显示全部楼层
DIV/0!
D.1
19.19、数据清洗时,处理缺失值的方法不包括( )。
A.删除单元格
B.删除记录
C.数据补齐
D.不处理
20.20、数据逻辑错误不包括( )。
A.数据不合理
B.数据自相矛盾
C.数据不符合规则
D.数据格式错误
21.21、下列选项中,关于数据预处理说法正确的是()。
A.数据清洗包含了数据标准化、数据合并和缺失值处理
B.数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接
C.数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D.数据标准化的主要对象是类别型特征
22.22、检测出异常值之后,通常会采用哪些方式处理它们?()
A.直接将含有异常值的记录删除
B.用具体的值来进行替换,可用前后两个观测值的平均值修正该异常值
C.不处理,直接在具有异常值的数据集上进行统计分析
D.以上全部
23.23、下列函数中,可以对数据进行的合并的是()。
A.concat()
B..join()
C..merge()
D.以上全部
24.24、下列方法中,可以修改数据类型的是()。
A.desc()
B.to_numberic()
C.dim()
D.type()
25.25、下列关于重复值处理的说法中,错误的是()。
A.duplicated()方法可以标记重复数据
B.drop_duplicates()方法用于删除重复数据
C.重复数据的判断标准是两个数据中所有条目的值都相等
D.duplicated()方法支持从前向后和从后向前两种查找模式
26.二、判断题
1、数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作。它一方面保论文作业答案请联系 : 证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
27.2、重复数据会影响数据处理结果的正确性,从而导致数据分析出现偏差,因此需要将其删除。
28.3、具有多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。
29.4、使用merge()函数进行数据合并时,不需要指定合并键。
30.5、fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。
31.6、dropna()方法可以删除数据中所有的缺失值。
32.7、drop_duplicated()方法可以删除重复值。
33.8、rename()方法可以重命名索引名。
34.9、通过merge()函数合并数据时可以指定多个键。
35.10、join()方法可以使用左连接和右连接两种方式连接数据。
36.11、关于Pandas中的数据重塑,stack()方法可以将列索引转换为行索引。
37.12、关于预处理中的数据合并,concat()函数是最常用的主键合并函数,可以通过内连接和外连接的方式堆叠合并数据。
38.13、关于预处理中的数据合并,merge()函数是最常用的主键合并的函数,但不能够通过左连接和右连接的方式合并数据。
39.14、关于预处理中的数据合并,join()方法是最常用的主键合并方法之一,但不能够通过左连接和右连接的方式合并数据。
40.15、Pandas中可以使用boxplot()方法绘制箱形图,以实现对数据中的异常值进行检测。
41.16、关于空值和缺失值,NaN和None是完全一样的。
42.17、notnull()与isnull()方法都可以判断数据中是否存在空值或缺失值。
43.18、dropna()方法可以删除空值和缺失值
44.19、异常值处理中可以基于不同字段的均值和标准差求出异常数据分布范围,然后再对异常范围外 的数据做处理,例如填充为均值
45.20、数据处理中,大多数情况下重复值是需要去除的,使用数据框的drop_duplicates方法即可实现。
46.21、随机抽样即随机的抽取样本,可使用数据框的sample实现,并可通过参数n设置指 定抽样数量,或通过frac指定抽样比例。
47.22、字符串和日期的转换,可通过time或datetime库的strptime和strftime实现。
48.23、数据标准化通过将数据按比例缩放,使之落入一个小的特定区间 对象的操作。
49.24、MaxMin方法则是根据原始数据的最大值和最小值做数据处理,它将数据缩 放为特定范围[0,1]内。
50.25、丢弃缺失值是直接将含有NA值的记录丢弃,适用于NA值的记录较少,且整体 样本量较大的情况。
。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|