欢迎光临,有需要请联系站长!
想要快速找到正确答案?
立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
报名本机构合作学校,赠送复习资料,复习课程,确保录取。并且可以申请学校奖学金500元~1500元不等!
第一章单元测试(1)
1、【单选题】以下哪种技术对大数据技术的发展起了基础支撑作用?
A、数据库技术
B、云计算技术
C、物联网技术
D、信息安全技术
2、【单选题】大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征
A、体量大(Volume)
B、速度快(Velocity)
C、种类多(Variety)
D、Venture(风险大)
3、【单选题】微软研究院所提出的科学研究的第四种范式是指:
A、实验
B、理论分析
C、计算
D、数据密集型科学发现(Data Intensive Science Discovery)
4、【填空题】在大数据时代,我们将有三个重大思维的转变,要相关,________;要全体,不要抽样;要效率,允许不精确。
A、
5、【填空题】2015年9月,国务院印发《_____________________________》系统部署大数据发展工作,指出了其必要性。
A、
6、【填空题】以下是关于大数据价值的描述,请填空:大数据可以帮助发现规律,大数据可以帮助________现象,大数据可以帮助预测未来。
A、
第一章单元测试(2)
1、【单选题】在舍恩伯格的《大数据时代:生活、工作与思维的大变革》一书中指出,大数据时代对社会的最大影响就是对人们思维方式的3种转变,以下哪一项不是该书中所指出的三种思维变革( )?
A、全样而非抽样
B、效率而非精确
C、相关而非因果
D、规律而非规则
2、【单选题】以下哪种技术对大数据技术的发展起到了基础支撑作用( )?
A、数据库技术
B、云计算技术
C、物联网技术
D、人工智能技术
3、【单选题】以下哪种项不属于大数据的特点( )?
A、体量大
B、价值密度高
C、速度快
D、价值大
4、【填空题】传统科学研究的三个范式是“实验”-“理论分析”-“计算”,在大数据时代,“____________科学发现”成为科学研究的第四范式。
A、
5、【填空题】通常用“4V特性”来描述大数据的主要特点,即大数据具有体量大、________ 、速度快和价值高四大特点。
A、
6、【填空题】大数据的处理流程可以归纳为5个环节,它们分别是:数据采集、________、大数据存储与管理、大数据分析与挖掘和计算结果展示等环节。
A、
第二单元测验
1、【单选题】我们通常听某同学讲:“我在阿里云上租了一个服务器”,那么这个服务器是属于云计算的那种应用场景()
A、IAAS
B、SAAS
C、PAAS
D、以上都不是
2、【单选题】在野外部署有许多传感器,用于实时采集空气质量数据,当数据传回数据中心后,在存储之前需要进行数据的预处理操作,那么如下哪些操作部署于数据预处理所采用的方法()。
A、数据变换
B、数据不一致性检测
C、缺失数据填充
D、以上都是
3、【单选题】数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的()
A、经常修改数据项的值
B、数据大都反应历史
C、面向特定主题
D、数据来源多样
4、【多选题】为了描述数据的统计学特征,我们常用的统计学指标有()
A、均值
B、方差
C、中位数
D、分位数
5、【判断题】大数据的发展需要大规模物理资源、计算资源的支持,以及高效的调度管理,所以从某种程度上讲,云计算的发展促进了大数据的发展和应用。
A、正确
B、错误
测试
1、【单选题】对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()
A、1
B、2
C、4
D、1.8
2、【多选题】半结构化数据包括()
A、HTML文档
B、Excel表格
C、检查身体后得到的体检报告
D、银行账户上的消费记录
3、【多选题】大数据的来源途径有许多,如下哪些属于大数据来源()
A、传感器设备采集的数据
B、人在微博上发表的记录
C、计算机网络运行产生的日志
D、网络爬虫得到的数据
4、【判断题】所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1
A、正确
B、错误
5、【判断题】数据的平滑操作,其目的在于消除数据波动产生的噪声。
A、正确
B、错误
单元测验:hadoop简介
1、【单选题】那些不是大数据的特点
A、 数据量在MB,GB级别
B、可以处理结构化、半结构化数据
C、采用的数据模型为平面模型
D、数据的内部关系相对松散
2、【单选题】大数据的容量不断增长,也就要求有 国家开放大学 更加复杂的数据管理方法,为此,如下哪项不是大数据存储面临的挑战()
A、低成本
B、易扩展
C、易于使用
D、简单的数据模型
3、【单选题】假设有一个公司,分别在北京和上海都设置了一个存储中心,这两个中心分别主要服务于北方和南方的存储需求,那么这两个存储中心的布局是属于()分布式存储模式。
A、集群存储
B、P2P存储
C、云存储
D、以上都是错误的
4、【单选题】如下不是分布式文件系统的是()
A、FAT
B、NFS
C、GFS
D、HDFS
5、【单选题】有关大数据的处理可以分为多种模式,若我们想要对传感器网络实时采集的数据存储前做一定的预处理,那么选择哪种方法更合适()
A、离线批处理方式
B、实时交互方式
C、流计算
D、批处理
6、【单选题】Hadoop2.0中最基础的两个组件是()
A、HDFS,YARN
B、YARN,PIG
C、MapReduce,YARN
D、Tez,HDFS
单元测验 广东开放大学 :HDFS
1、【单选题】HDFS存储的特点中,错误的是()
A、只能有一个NameNode
B、提供了统一的访问接口
C、实现了数据的冗余存储
D、分块存储增强了数据访问的并行性
2、【单选题】利用客户端进行HDFS的数据读取时,有关叙述正确的是()
A、客户端需要详细了解HDFS的文件组织结构
B、在访问前需要了解具体文件是存储在哪个DataNode上
C、读取文件数据时,其读取的数据需来自于一个DataNode,以避免数据的不一致性
D、编程接口提供了隔离性,让用户无需深入了解HDFS便可以进行文件数据读写
3、【多选题】HDFS的nameNode中,存储的有关核心数据包括()
A、文件系统树
B、所有数据备份
C、文件操作日志
D、注册表
单元测验:Hbase
1、【单选题】目前被最广泛应用的数据库管理系统是()
A、关系型数据库管理系统
B、网状数据库管理系统
C、层次数据库管理系统
D、基于HDFS的HBbase
2、【单选题】关于Hbase的数据模型叙述中,正确的是()
A、Hbase表中的单元由行Key,列族名,列限定符和时间戳共同唯一确定
B、列限定符合列族名之间是一对一关系
C、同一表中每一个单元的值都只存在唯一的一个
D、每一个列都有一个时间戳
3、【单选题】HBase的访问方式有很多,如下的访问方式中,哪一种是支持直接命令行方式访问()
A、Native Java API
B、Thrift GateWay
C、Rest GateWay< 渝粤教育 /p>
D、Hbase Shell
4、【多选题】CAP理论的CAP分别代表()
A、一致性
B、事务性
C、分区容错性
D、可用性
5、【多选题】有关HBase的叙述,正确的是()
A、提供了简单的基于Key的查询方法
B、适用于日志信息的存储
C、适用于用户信息的存储
D、常用于存储大批量的数据
单元测验:Hive
1、【单选题】有关数据仓库的描述,不符合的是( )
A、面向主题的,集成的数据集合
B、主要反映历史数据变化状况的数据
C、数据常常会随着用户操作产生频繁的增、删、改、查操作
D、用于支持管理决策的
2、【单选题】有关Hive特性的描述,错误的是( )
A、目的在于为分布式存储的大数据集提供基于SQL的读、写管理
B、提供分布式存储数据到现有数据的投影
C、只提供命令行的访问方式
D、可以支持JDBC驱动供用户连接
3、【单选题】有关Hive命令行接口叙述,错误的是( )
A、DML包括LOAD,INSERT, UPDATE等操作。
B、DDL包括CREATE, DROP等操作。
C、Hive-QL提供操作用于对Hive数据仓库进行查找。
D、Hive不提供对数据的修改操作。
4、【多选题】有关Hive存储模型的叙述,正确的是( )
A、表中可以包含多个分区
B、表中可以直接包含若干个桶
C、分区可以不包含桶
D、桶可以包含多个分区
5、【判断题】Hive中的元数据,以及所存储数据集都是存储在HDFS系统中。
A、正确
B、错误
单元测验1
1、【单 成人学历 选题】已知有一组数据:64、65、67、70、71、75、76、77、78、80、81、85、90该组数据样本的方差为:
A、60.4
渝粤题库B、63.5
C、70.2
D、71.5
2、【单选题】有以下一组数据:78、80、81、85、90、64、65、67、70、71、75、76、77该组数据样本的中位数为:
A、75
B、76
C、77
D、65
3、【单选题】设x、y为向量(1)x=(1,1,2,2)(2)y=(2,2,2,3)求两个向量的Pearson相关系数:
A、0.524
B、0.561
C、0.577
D、0.512
4、【判断题】两个随机变量 X 与 Y 之间正相关,则其相关系数大于0.
A、正确
B、错误
5、【判断题】正面是一组数据的偏态图示,则其偏度(Skewness)大于0.
推荐阅读