覆盖学起Plus、超星学习通等平台的全学科作业答案、历年真题与考试速查系统
【百年教育职业培训中心】大数据导论-章节资料考试资料-福建师范大学
招生简章 2025-06-22 11:12:09 2 0
中国大学MOOC作业考试答案

想要快速找到正确答案?

立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!

超新尔雅学习通
扫码关注

作业辅导
扫码关注
论文指导
轻松解决学习难题!

报名本机构合作学校,赠送复习资料,复习课程,确保录取。并且可以申请学校奖学金500元~1500元不等!

第一章单元测试(1)

1、【单选题】以下哪种技术对大数据技术的发展起了基础支撑作用?

A、数据库技术

B、云计算技术

C、物联网技术

D、信息安全技术

2、【单选题】大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征

A、体量大(Volume)

B、速度快(Velocity)

C、种类多(Variety)

D、Venture(风险大)

3、【单选题】微软研究院所提出的科学研究的第四种范式是指:

A、实验

B、理论分析

C、计算

D、数据密集型科学发现(Data Intensive Science Discovery)

4、【填空题】在大数据时代,我们将有三个重大思维的转变,要相关,________;要全体,不要抽样;要效率,允许不精确。

A、

5、【填空题】2015年9月,国务院印发《_____________________________》系统部署大数据发展工作,指出了其必要性。

A、

6、【填空题】以下是关于大数据价值的描述,请填空:大数据可以帮助发现规律,大数据可以帮助________现象,大数据可以帮助预测未来。

A、

第一章单元测试(2)

1、【单选题】在舍恩伯格的《大数据时代:生活、工作与思维的大变革》一书中指出,大数据时代对社会的最大影响就是对人们思维方式的3种转变,以下哪一项不是该书中所指出的三种思维变革( )?

A、全样而非抽样

B、效率而非精确

C、相关而非因果

D、规律而非规则

2、【单选题】以下哪种技术对大数据技术的发展起到了基础支撑作用( )?

A、数据库技术

B、云计算技术

C、物联网技术

D、人工智能技术

3、【单选题】以下哪种项不属于大数据的特点( )?

A、体量大

B、价值密度高

C、速度快

D、价值大

4、【填空题】传统科学研究的三个范式是“实验”-“理论分析”-“计算”,在大数据时代,“____________科学发现”成为科学研究的第四范式。

A、

5、【填空题】通常用“4V特性”来描述大数据的主要特点,即大数据具有体量大、________ 、速度快和价值高四大特点。

A、

6、【填空题】大数据的处理流程可以归纳为5个环节,它们分别是:数据采集、________、大数据存储与管理、大数据分析与挖掘和计算结果展示等环节。

A、

第二单元测验

1、【单选题】我们通常听某同学讲:“我在阿里云上租了一个服务器”,那么这个服务器是属于云计算的那种应用场景()

A、IAAS

B、SAAS

C、PAAS

D、以上都不是

2、【单选题】在野外部署有许多传感器,用于实时采集空气质量数据,当数据传回数据中心后,在存储之前需要进行数据的预处理操作,那么如下哪些操作部署于数据预处理所采用的方法()。

A、数据变换

B、数据不一致性检测

C、缺失数据填充

D、以上都是

3、【单选题】数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的()

A 渝粤教育 、经常修改数据项的值

B、数据大都反应历史

C、面向特定主题

D、数据来源多样

4、【多选题】为了描述数据的统计学特征,我们常用的统计学指标有()

A、均值

B、方差

C、中位数

D、分位数

5、【判断题】大数据的发展需要大规模物理资源、计算资源的支持,以及高效的调度管理,所以从某种程度上讲,云计算的发展促进了大数据的发展和应用。

A、正确

B、错误

测试

1、【单选题】对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()

A、1

B、2

C、4

D、1.8

2、【多选题】半结构化数据包括()

A、HTML文档

B、Excel表格

C、检查身体后得到的体检报告

D、银行账户上的消费记录

3、【多选题】大数据的来源途径有许多,如下哪些属于大数据来源()

A、传感器设备采集的数据

B、人在微博上发表的记录

C、计算机网络运行产生的日志

D、网络爬虫得到的数据

4、【判断题】所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1

A、正确

B、错误

5、【判断题】数据的平滑操作,其目的在于消除数据波动产生的噪声。

A、正确

B、错误

单元测验:hadoop简介

1、【单选题】那些不是大数据的特点

A、 数据量在MB,GB级别

B、可以处理结构化、半结构化数据

C、采用的数据模型为平面模型

D、数据的内部关系相对松散

2、【单选题】大数据的容量不断增长,也就要求有更加复杂的数据管理方法,为此,如下哪项不是大数据存储面临的挑战()

A、低成本

B、易扩展

C、易于使用

D、简单的数据模型

3、【单选题】假设有一个公司,分别在北京和上海都设置了一个存储中心,这两个中心分别主要服务于北方和南方的存储需求,那么这两个存储中心的布局是属于()分布式存储模式。

A、集群存储

B、P2P存储

C、云存储

D、以上都是错误的

4、【单选题】如下不是分布式文件系统的是()

A、FAT

B、NFS

C、GFS

D、HDFS

5、【单选题】有关大数据的处理可以分为多种模式,若我们想要对传感器网络实时采集的数据存储前做一定的预处理,那么选择哪种方法更合适()

A、离线批处理方式

B、实时交互方式

C、流计算

D、批处理

6、【单选题】Hadoop2.0中最基础的两个组件是()

A、HDFS,YARN

B、YARN,PIG

C、MapReduce,YARN

D、Tez,HDFS

单元测验:HDFS

1、【单选题】HDFS存储的特点中,错误的是()

A、只能有一个NameNode

B、提供了统一的访问接口

C、实现了数据的冗余存储

D、分块存储增强了数据访问的并行性

2、【单选题】利用客户端进行HDFS的数据读取时,有关叙述正确的是()

A、客户端需要详细了解HDFS的文件组织结构

B、在访问前需要了解具体文件是存储在哪个DataNode上

C、读取文件数据时,其读取的数据需来自于一个DataNode,以避免数据的不一致性

D、编程接口提供了隔离性,让用户无需深入了 成人学历 解HDFS便可以进行文件数据读写

3、【多选题】HDFS的nameNode中,存储的有关核心数据包括()

A、文件系统树

B、所有数据备份

C、文件操作日志

D、注册表

单元测验:Hbase

1、【单选题】目前被最广泛应用的数据库管理系统是()

A、关系型数据库管理系统

B、网状数据库管理系统

C、层次数据库管理系统

D、基于HDFS的HBbase

2、【单选题】关于Hbase的数据模型叙述中,正确的是()

A、Hbase表中的单元由行Key,列族名,列限定符和时间戳共同唯一确定

B、列限定符合列族名之间是一对一关系

C、同一表中每一个单元的值都只存在唯一的一个

D、每一个列都有一个时间戳

3、【单选题】HBase的访问方式有很多,如下的访问方式中,哪一种是支持直接命令行方式访问()

A、Native Java API

B、Thrift GateWay

C、Rest GateWay

D、Hbase Shell

4、【多选题】CAP理论的CAP分别代表()

A、一致性

B、事务性

C、分区容错性

D、可用性

5、【多选题】有关HBase的叙述,正确的是()

A、提供了简单的基于Key的查询方法

B、适用于日志信息的存储

C、适用于用户信息的存储

D、常用于存储大批量的数据

单元测验:Hive

1、【单选题】有关数据仓库的描述,不符合的是( )

A、面向主题的,集成的数据集合

B、主要反映历史数据变化状况的数据

C、数据常常会随着用户操作产生频繁的增、删、改、查操作

D、用于支持管理决策的

2、【单选题】有关Hive特性的描述,错误的是( )

A、目的在于为分布式存储的大数据集提供基于SQL的读、写管理

B、提供分布式存储数据到现有数据的投影

C、只提供命令行的 广东开放大学 访问方式

D、可以支持JDBC驱动供用户连接

3、【单选题】有关Hive命令行接口叙述,错误的是( )

A、DML包括LOAD,INSERT, UPDATE等操作。

B、DDL包括CREATE, DROP等操作。

C、Hive-QL提供操作用于对Hive数据仓库进行查找。

D、Hive不提供对数据的修改操作。

4、【多选题】有关Hive存储模型的叙述,正确的是( )

A、表中可以包含多个分区

B、表中可以直接包含若干个桶

C、分区可以不包含桶

D、桶可以包含多个分区

5、【判断题】Hive中的元数据,以及所存储数据集都是存储在HDFS系统中。

A、正确

B、错误

单元测验1

1、【单选题】已知有一组数据:64、65、67、70、71、75、76、77、78、80、81、85、90该组数据样本的方差为:

A、60.4

B、63.5

C、70.2

D、71.5

2、【单选题】有以下一组数据:78、80、81、85、90、64、65、67、70、71、75、76、77该组数据样本的中位数为:

A、75

B、76

C、77

D、65

3、【单选题】设x、y为向量(1)x=(1,1,2,2)(2)y=(2,2,2,3)求两个向量的Pearson相关系数:

A、0.524

B、0.561

C、0.577

D、0.512

4、【判断题】两个随机变量 X 与 Y 之间正相关,则其相关系数大于0.

A、正确

渝粤题库

B、错误

5、【判断题】正面是一组数据的偏态图示,则其偏度(Skewness)大于0.国家开放大学 p>



    文章说明
    本文标签:
    ©版权声明
    本站提供的文章均来自网上,如有侵权请邮件与我们联系处理。敬请谅解!
    评论留言

    昵称

    个人资料
    个人资料
    学通智库​ 是专为 ​学起Plus、超星学习通、安徽继续教育、云上河开​ 等主流学习平台用户打造的一站式资源中心。
    • 文章67824
    • 评论0
    • 微语0
    标签