1. 下列关于数据预处理的描述中,描述不正确的是( )。
A. 数据清洗的目的是为了提高数据质量
B. 空值一定要删除
C. 数据预处理包括数据的清洗、合并、重塑与转换
D. 在Pandas中,缺失值使用NaN表示
2. 下面关于dropna()的axis参数描述中,说法正确的是( )。
A. 默认axis=0,删除包含缺失值的列
B. 默认axis=0,删除包含缺失值的行
C. 默认axis=1,删除包含缺失值的列
D. 默认axis=1,删除包含缺失值的行
3. 下列关于Matplotlib库的描述中,说法不正确的是()。
A. Matplotlib是当前用于数据可视化的最流行的Python包之一
B. Matplotlib提供了绘制散点图、条形图、折线图、饼图、直方图的方法
C. 可通过交互方式实现数据可视化
D. Matplotlib不能支持中文显示
4. plot(x,y)的命令含义是( )。
A. 打印
B. 输出
C. 绘图
D. 计算
5. 想要在数据集df第1列前插入一列[88,90,69,65,89,82],列标签是“C语言”。下列代码正确的是( )。
A. df.insert(1,"C语言",[88,90,69,65,89,82])
B. df.insert(0,"C语言",[88,90,69,65,89,82])
C. df.add(1,"C语言",[88,90,69,65,89,82])
D. df.append(1,"C语言",[88,90,69,65,89,82])
6. Pandas提供了isnull()函数和notnull()函数来检测数据中是否存在缺失值。
7. 在Pandas中可以实现数据合并的方法只有concat()。
8. 数据转置是指对数据的行列进行互换,在这个过程中数据集的形状发生改变。
9. 有如下数据集df,
要增加一列“总成绩”,实现如下图的效果:
那么正确的代码是( )。
A. df['总成绩']=0
B. df[总成绩]=0
C. df['总成绩']=[0,0,0,0,0,0]
D. 总成绩=0 |