奥鹏_国开(软件学院)24春《电子商务数据分析与应用》形考作业4【标准答案】

[复制链接]
查看: 7|回复: 0

23万

主题

23万

帖子

32万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
329354
发表于 2024-4-15 22:19:46 | 显示全部楼层 |阅读模式


形考任务5
试卷总分:100 得分:100
1.1、电子商务数据的获取途径不包括()
A.产品自有数据
B.调查问卷
C.互联网数据导入
D.从别人数据库窃取
2.2、请判断下面各项数据的结构化类型:()
A.结构化数据
B.半结构化数据
C.非结构化数据
D.以上都不对
3.3、以下哪个不是基于电商平台的基础数据?
A.商品数据
B.客户基本信息数据
C.客户评价数据
D.互联网金融数据
4.4、电子商务数据的主要来源包括()
A.电子商务平台
B.社交电商平台
C.O2O 数据
D.以上全部
5.5、数据处理一般指对数据进行()、()、()、和()的过程。
A.采集、分析、分析、可视化表达
B.整理、采集、分析、可视化表达
C.采集、整理、分析、可视化表达
D.整理、可视化表达、分析、采集
6.6、数据有不同的表现形式,数据的来源也多种多样,因此数据采集的()、采集的()、和采集后 的()也不尽相同。
A.工具、方法、存储方式
B.方法、工具、存储方式
C.方法、过程、存储方式
D.工具、过程、存储方式
7.7、以下关于数据采集说法正确的()
A.同一数据如果有多个来源途径,可以选择其中的任一个来源进行采集
B.数据采集人员需要针对数据采集需求、背景等对数据采集渠道进行可信度划分,优先选择可信度更高的数据采集渠道
C.数据采集渠道可信度与数据采集的背景和指标无关,属于独立的体系
D.数据采集渠道无所谓优劣,主要看能否获取到所需数据
8.8、某网店准备按照店铺产品的引流能力及盈利能力两项数据分别对产品进行排序,将两项数据指标排名均靠后的5款产品进行下架处理。根据以上情景可确定数据分析目标为()
A.分析店铺商品的引流能力和盈利能力
B.分店铺商品中能够稳定获利的商品
C.分析店铺商品的展现量
D.分析店铺商品的推广效果
9.9、在数据采集过程中并非所有需要的数据指标都可以采集到,在这种情况下以下做法正确的是()。
A.可以使用能够反映该指标的其他数据替代
B.不需要采集
C.想尽一切办法寻找可以采集到该指标的数据数据渠道
D.忽略该数据的采集任务
10.10、通过网站公开的API接口采集数据属于( )。
A.网络数据采集法
B.传感器采集法
C.访问记录采集法
D.系统日志采集法
11.11、下列关于为什么要做数据清理描述错误的是( )
A.数据有重复
B.数据有错误
C.数据有缺失
D.数据量太大
12.12、下列关于数据清理描述错误的是( )
A.数据清理能完全解决数据质量差的问题
B.数据清理在数据分析过程中是不可或缺的一个环节
C.数据清理的目的是提高数据质量
D.可以借助Kettle来完成大量的数据清理工作
13.13、某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误需要进行( )。
A.缺失值清洗
B.重复值清洗
C.逻辑值清洗
D.无价值数据清洗
14.14、数据清洗时,运营数据中出现“下单时间2088-12-12”,属于( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.重复数据清洗
15.15、以下说法错误的是( )
A.数据预处理的主要流程为数据清理、数据集成、数据变换与数据归约
B.数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用
C.冗余数据的删除既是一种数据清理形式,也是一种数据归约
D.整个预处理过程要尽量人机结合,尤其要注重和客户以及专家多交流
16.16、kettle是什么编程语言编写的?
A.C论文作业答案请联系 :
B.JAVA
C.Python
D.以上都不对
17.17、如何在window操作系统上启动kettle?()
A.双击Spoon.bat
B.Pan.bat
C.runSamples.bat
18.18、kettle转换的核心对象,下面哪项不正确?
A.输入
B.输出
C.流程
D.DB连接
19.19、数据分析的一般流程为()
A.明确目的和思路、数据收集、数据处理、数据分析、数据展现
B.明确目的和思路、数据收集、数据分析、数据展现
C.数据收集、数据处理、数据分析、数据展现
D.明确目的和思路、数据处理、数据分析、数据展现
20.20、s = list(“壮丽七十年奋斗新时代”),给出如下代码以下选项中能输出字符“奋”第一次出现的索引位置的
A.print(s.index(“奋”),1,len(s))
B.print(s.index(“奋”))
C.print(s.count(“奋”))
D.print(s.index(“奋”),1)
21.二、多选题
1、电子商务数据具有以下哪些作用?
A.电子商务数据具有诊断作用
B.电子商务数据具有预测作用
C.电子商务数据具有决定作用
D.电子商务数据具有传播作用
22.2、下列选项中,关于数据预处理说法错误的是()。
A.数据清洗包含了数据标准化、数据合并和缺失值处理
B.数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接
C.数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D.数据标准化的主要对象是类别型特征
23.3、检测出异常值之后,通常会采用哪些方式处理它们?()
A.直接将含有异常值的记录删除
B.用具体的值来进行替换,可用前后两个观测值的平均值修正该异常值
C.不处理,直接在具有异常值的数据集上进行统计分析
D.视为缺失值,利用缺失值的处理方法修正该异常值
24.4、商务数据包括()
A.电子商务平台的基础数据
B.电子商务专业网站的研究数据
C.电子商务媒体报道
D.评论数据
25.5、数据分析中市场类指标主要用于描述行业情况和企业在行业中的发展情况,下列属于市场类指标的是()
A.行业增长率
B.平均购买次数
C.竞争对手销售额
D.活跃客户比率
26.6、以下属于产品类数据指标的是()?
A.SKU
B.商品数
C.商品访客数
D.跳失率
27.7、对淘宝平台某类商品销量数据进行分析,以下数据采集方式可行的是()
A.使用爬虫类工具对平台上该类商品的销量数据持续进行采集
B.使用生意参谋
C.使用1688指数工具
D.使用百度指数工具
28.8、数据清洗的主要内容包括( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.重复数据清洗
29.9、kettle包含的部份?
A.Chef— — 任务(job)设计工具(GUI方式)
B.Kitchen— — 任务(job)执行器(命令行方式)
C.Spoon— — 转换(transform)设计工具(GUI方式)
D.Span— — 转换(transform)执行器(命令行方式)
30.10、下面的语句的循环是有限的( )
A.for a in range(10):
time.sleep(10)
B.while 1<10:
time.sleep(10)
C.while True:
break
D.a = [3,-1,’,’]
for i in a[:]:
if not a:
break
31.三、判断题
1、Jupyter Notebook的优点是可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。
32.2、CDA-验证性数据分析,用于找到数据间的模式,相关性。是一种“参考答案”的获取。场景包括典型的“啤酒尿布”这类数据挖掘应用,工具包括SAS,SPSS这类数据挖掘软件以及python语言这类语言工具。
33.3、通过大数据进行维度分析展现品牌印象关键词,和产品的运营方式,帮助企业更好的掌握发展趋势。
34.4、商家获取会员数据后,可以充分利用这些数据对会员的情况进行分析,包括会员的分布情况,如年龄分布、性别分布、地区分布,各地区会员的增长、流失情况,以及挖掘每一位会员的价值潜力等。
35.5、数据采集时需要数据采集人员不惜任何手段获取所有需要的数据。
36.6、在分析全店某段时间内的客单价时,需要采集的数据指标有该段时间内店铺成交客户数及成交总额。
37.7、某网店准备分析一段时间内的全店转化率,需要采集的数据指标有该段时间内的店铺访客数及成交访客数。
38.8、价格会或价格决策关系到企业的利润、成本补偿、以及是否有利于产品销售、促销等问题,可以说价格在一定程度上影响着产品的生命力。
39.9、把实际完成值与目标值进行对比,属于纵比。
40.10、AB测试是指设计两个版本(A和B),A为目前的版本,B是猜想更好的版本或者新的版本。然后,通过测试比较这两个版本之间你所关心的数据,最后选择效果最好的版本。
41.11、杜邦分析法利用几种主要的财务比率之间的关系综合地分析企业的财务状况。具体来说,它是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的经典方法。
42.12、用漏斗图分析法不能直观地看到每个环节的情况,不能看到每个环节的转化情况、流失情况。
43.13、像账号密码这种私密的信息,网站基本不会使用 GET 请求去处理,而更多会使用 POST 请求去提交这些数据。GET 请求更多用于获取网页内容。
44.14、数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作。它一方面保证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
45.15、fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。
46.16、drop_duplicated()方法可以删除重复值。
47.17、转化漏斗模型可以在消费者访问店铺到最终成交的各个环节,一层层过滤转化人数,分析各个环节的转化情况。
48.18、Kettle是一个Java程序,因此,运行此工具,必须安装Sun公司(已被Oracle公司收购)的Java运行环境1.4或者更高版本。
49.19、Kettle连接Mysql数据库,需要另外导入相应的jar。
50.20、在Kettle中,在一个转换中,一个步骤可以有多个连接,一个连接也可以有多个步骤。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x





上一篇:奥鹏_国开(软件学院)24春《电子商务数据分析与应用》形考作业3【标准答案】
下一篇:奥鹏_国开(软件学院)24春《电子商务数据分析与应用》形考作业5【标准答案】
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图