[南开大学]20春学期《大数据开发技术(一)》在线作业(答案100分)

[复制链接]
查看: 796|回复: 1

5万

主题

8万

帖子

18万

积分

论坛元老

Rank: 8Rank: 8

积分
189003
发表于 2020-6-27 21:13:11 | 显示全部楼层 |阅读模式
答案来源:雅宝题库交流网(www.ybaotk.com)-[南开大学]20春学期(1109、1803、1809、1903、1909、2003)《大数据开发技术(一)》在线作业
试卷总分:100    得分:100
第1,Modest Maps是哪种可视化工具()
A、信息图表
B、地图工具
C、时间线工具
D、分析工具
正确答案:


第2题,UMP系统借助于()来实现分布式数据库服务
A、Mnesia
B、LVS
C、RabbitMQ
D、Zookeeper
正确答案:


第3题,Hbase中采用()保证系统出错时及时恢复
A、MemStore
B、Hlog
C、StoreFile
D、客户端
正确答案:


第4题,以下亚马逊的产品中哪个是数据仓库
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正确答案:D


答案来源:雅宝题库交流网(www.ybaotk.com),HDFS中ClientProtocal的()方法可以查找下一个数据块
A、getBlock
B、getBlockLocations
C、getLocation
D、nextBlock
正确答案:


第 题,对于不同顶点之间的信息交换,Pregel采用了()
A、远程数据读取
B、共享内存
C、纯消息传递模型
D、共享消息
正确答案:


第1题,UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能
A、Controller服务器
B、Procy服务器
C、愚公系统
D、Agent服务器
正确答案:


第8题,批处理系统关注(),流处理系统关注()。
A、吞吐率,延时
B、延时,吞吐率
C、延时,速度
D、速度,吞吐率
正确答案:


第9题,()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A、DistributedFileSystem
B、GFSSystem
C、FileSystem
D、HDFSSystem
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移
A、Controller服务器
B、Procy服务器
C、愚公系统
D、Agent服务器
正确答案:


第11题,列式数据库采用()存储模型
A、NSM
B、DSM
C、Hbase
D、MySQL
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案:


第13题,UMP系统借助于()来实现高效和可靠的协同工作
A、Mnesia
B、LVS
C、RabbitMQ
D、Zookeeper
正确答案:D


第14题,UMP系统中面对分库分表用户如何进行资源调度()
A、可以共享同一个MySQL实例
B、每个用户独占一个MySQL实例
C、会占用多个独立的MySQL实例
D、随机分配MySQL实例
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正确答案:


第1 题,关于Hadoop集群网络拓扑,以下说法错误的是()。
A、普通的Hadoop集群结构由一个两阶网络构成
B、Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器
C、在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和
D、一般来说机架内部网络环境比机架间网络环境好
正确答案:


第11题,Gephi是哪种可视化工具()
A、信息图表
B、地图工具
C、时间线工具
D、分析工具
正确答案:D


第18题,MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A、数据向计算靠拢
B、计算向数据靠拢
C、计算向网络靠拢
D、计算与数据并行
正确答案:


第19题,Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),以下哪个是HDFS的局限性()。
A、吞吐率
B、数据集
C、兼容性
D、延迟
正确答案:D


第21题,HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A、Master
B、Region
C、Zookeeper
D、Chubby
正确答案:


第22题,优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A、列族数据库
B、键值数据库
C、图数据库
D、文档数据库
正确答案:D


第23题,MapReduce中()会周期性地通过& uot;心跳& uot;将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。
A、Client
B、Job Tracker
C、Task
D、Task Tracker
正确答案:D


第24题,Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),Hbase中主服务器Master主要负责表和Region的管理工作
A、Master
B、Slaver
C、Region
D、客户端
正确答案:


第2 题,以下哪个是通过JDBS和关系数据库进行交互的()。
A、Ambari
B、Oozie
C、Hive
D、S oop
正确答案:D


第21题,UMP系通过()来实现实现管理每台物理机上的MySQL实例
A、Controller服务器
B、Procy服务器
C、愚公系统
D、Agent服务器
正确答案:D


第28题,()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A、NameNode
B、SecondaryNameNode
C、DataNode
D、Block
正确答案:


第29题,Hbase中Zookeeper可以帮助选举出一个()作为集群的总管
A、Master
B、Slaver
C、Region
D、客户端
正确答案:


答案来源:雅宝题库交流网(www.ybaotk.com),Pregel计算模型以()作为输入
A、有向图
B、雅向图
C、矢量图
D、树
正确答案:


第31题,以下哪个不是云数据库的特点
A、高可扩展性
B、高可用性
C、支持资源有效分发
D、本地存储
正确答案:D


第32题,以下哪些属于典型的大数据应用()。
A、谷歌搜索
B、谷歌流感趋势
C、谷歌统计
D、《纸牌屋》制作
E、《黑镜子》制作
正确答案:,D


第33题,MapReduce可以解决哪些计算问题()。
A、矩阵乘法
B、关系代数运算
C、聚合运算
D、关系投影运算
正确答案:,B,C,D


第34题,流计算系统的需求有()。
A、实时性
B、廉价
C、高性能
D、高带宽
E、分布式
正确答案:,C,E


第35题,以下属于Hadoop的安装方式的有()。
A、单机模式
B、多机模式
C、分布式模式
D、并行模式
E、伪分布式模式
正确答案:,C,E


第3 题,已得到广泛应用的分布式文件系统主要包括()。
A、GFS
B、MapReduce
C、Hbase
D、HDFS
正确答案:,D


第31题,Hbase中Zookeeper提供了()
A、分布式同步
B、组服务
C、域名服务
D、配置维护
正确答案:,B,C,D


第38题,关系数据库与NoSQL数据库相比适用于哪些领域()
A、电信
B、银行
C、互联网企业大数据处理
D、传统企业的数据分析
正确答案:,B


第39题,NoSQL数据库与关系数据库相比有哪些优势()
A、支持事务ACID四性
B、可以支持超大规模数据存储
C、以完善的关系代数理论作为基础
D、具有强大的横向扩展能力
正确答案:,D


第40题,流计算处理流程三个主要阶段是()。
A、实时采集
B、实时存储
C、实时计算
D、实时查询
正确答案:,C,D


第41题,HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。
T、对
F、错
正确答案:F


第42题,HDFS使用的是传统的分级文件体系,因此,用户可以像使用普通文件系统一样,创建、删除目录和文件,在目录间转移文件,重命名文件等
T、对
F、错
更多答案下载:雅宝题库交流网(www.ybaotk.com)


第43题,云数据库不可以满足企业动态变化的数据存储需求
T、对
F、错
正确答案:F


第44题,HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
T、对
F、错
正确答案:F


第45题,MapReduce中TaskTracker使用& uot;slot& uot;等量划分本节点上的资源量。
T、对
F、错
更多答案下载:雅宝题库交流网(www.ybaotk.com)


第4 题,云数据库不可以满足大企业的海量数据存储需求
T、对
F、错
正确答案:F


第41题,HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留
T、对
F、错
更多答案下载:雅宝题库交流网(www.ybaotk.com)


第48题,HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
T、对
F、错
正确答案:F


第49题,Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
T、对
F、错
更多答案下载:雅宝题库交流网(www.ybaotk.com)


答案来源:雅宝题库交流网(www.ybaotk.com),Hbase中表在垂直方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起
T、对
F、错
正确答案:F





上一篇:[南开大学]20春学期《大数据导论》在线作业(答案100分)
下一篇:[南开大学]20春学期《大数据开发技术(二)》在线作业-1(答案100分)
回复

使用道具 举报

1

主题

3636

帖子

5468

积分

论坛元老

Rank: 8Rank: 8

积分
5468
发表于 2022-3-13 09:56:32 | 显示全部楼层
计算机和英语的统考资料有吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图