欢迎光临,有需要请联系站长!
想要快速找到正确答案?
立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
中国大学MOOC大数据导论作业答案
大数据导论
学校: 九八五题库
学校: 超星学习通
题目如下:
1. 1. 下列说法错误的是?( )
A. 大数据魔镜是一款优秀的国产数据分析软件,可以让用户真正理解探索分析数据
B. Tableau是桌面系统中最简单的商业智能工具软件,是一个用于网页作图、生成互动图形的JavaScript函数库
C. Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图
D. Modest Maps是一个小型、可扩展、交互式的免费库,提供了一套查看卫星地图的API
答案: Tableau是桌面系统中最简单的商业智能工具软件,是一个用于网页作图、生成互动图形的JavaScript函数库
2. 2. 下列说法中,哪些是正确的?( )
A. Modest Maps是一个小型、可扩展、交互式的免费库
B. Leaflet是一个小型化的地图框架,通过小型化和轻量化来满足移动网页的需要
C. Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图
D. 大数据魔镜是一款优秀的国产数据分析软件,它丰富的数据公式和算法可以让用户真正理解探索分析数据
答案: Modest Maps是一个小型、可扩展、交互式的免费库# Leaflet是一个小型化的地图框架,通过小型化和轻量化来满足移动网页的需要# Google Fusion Tables让一般使用者也可以轻松制作出专业的统计地图# 大数据魔镜是一款优秀的国产数据分析软件,它丰富的数据公式和算法可以让用户真正理解探索分析数据
3. 3. 下面关于可视化图表的描述正确的是:( )
A. 漏斗图适用于业务流程比较规范、周期长、环节多的流程分析
B. 树图是一种流行的、利用包含关系表达层次化数据的可视化方法
C. 桑基图是以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示
D. 词云对网络文本中出现频率较高的“关键词”给予视觉上的突出
答案: 漏斗图适用于业务流程比较规范、周期长、环节多的流程分析# 树图是一种流行的、利用包含关系表达层次化数据的可视化方法# 词云对网络文本中出现频率较高的“关键词”给予视觉上的突出
4. 1. 云计算包括3种类型。只为特定用户提供服务,比如大型企业出于安全考虑自建的云环境,只为企业内部提供服务,这种云计算属于:()
A. 公有云
B. 私有云
C. 混合云
D. 独立云
答案: 私有云
5. 2. 以下关于知识图谱,描述错误的是:()
A. 又称为科学知识图谱
B. 在图书情报界称为知识域可视化或知识领域映射地图
C. 知识图谱属于密码学研究范畴
D. 知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域
答案: 知识图谱属于密码学研究范畴
6. 3. 以下关于大数据、云计算和物联网的联系,描述正确的是:()
A. 从整体上看,大数据、云计算和物联网这三者是相辅相成的
B. 大数据根植于云计算,大数据分析的很多技术都来自于云计算
C. 大数据为云计算提供了“用武之地”
D. 物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理
答案: 从整体上看,大数据、云计算和物联网这三者是相辅相成的# 大数据根植于云计算,大数据分析的很多技术都来自于云计算# 大数据为云计算提供了“用武之地”# 物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理
7. 4. 下面关于比特币和区块链之间关系的描述,正确的是:()
A. 比特币和区块链没有任何关系
B. 区块链是比特币的底层技术
C. 比特币是区块链的一种应用
D. 比特币是比区块链更先进的一种技术
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 1. 大数据的简单算法比小数据的复杂算法更有效,体现了哪种大数据思维方式:()
A. 以数据为中心
B. 全样而非抽样
C. 效率而非精确
D. 相关而非因果
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 2. 目前进行数据交易的形式主要包括哪几种:()
A. 大数据交易公司
B. 数据交易所
C. API 模式
D. PPT模式
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 3. 大数据交易平台的运营模式主要包括哪两种:()
A. 具有交易实时显示功能的交易平台
B. 兼具中介和数据处理加工功能的交易平台
C. 只具备中介功能的交易平台
D. 只具备数据处理加工功能的交易平台
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 1. 以下推荐方法中,哪一个是基于内容的推荐:()
A. 由资深的专业人士来进行物品的筛选和推荐
B. 基于统计信息进行推荐
C. 通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容
D. 对多种推荐算法进行有机组合,然后给出推荐结果
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 2. 一个完整的推荐系统通常包括哪3个组成模块:()
A. 用户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 可视化模块
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 3. 大数据在金融领域的应用主要包括:()
A. 高频交易
B. 市场情绪分析
C. 信贷风险分析
D. 大数据征信
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 4. 大数据在餐饮行业的应用主要包括:()
A. 大数据驱动的团购模式
B. 利用大数据为用户推荐消费内容
C. 利用大数据调整线下门店布局
D. 利用大数据控制店内人流量
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 5. 【单选题】以下推荐方法中,哪一个是基于内容的推荐:()
A. 由资深的专业人士来进行物品的筛选和推荐
B. 基于统计信息进行推荐
C. 通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容
D. 对多种推荐算法进行有机组合,然后给出推荐结果
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 6. 【多选题】一个完整的推荐系统通常包括哪3个组成模块:()
A. 用户建模模块
B. 推荐对象建模模块
C. 推荐算法模块
D. 可视化模块
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 7. 【多选题】大数据在金融领域的应用主要包括:()
A. 高频交易
B. 市场情绪分析
C. 信贷风险分析
D. 大数据征信
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 8. 【多选题】大数据在餐饮行业的应用主要包括:()
A. 大数据驱动的团购模式
B. 利用大数据为用户推荐消费内容
C. 利用大数据调整线下门店布局
D. 利用大数据控制店内人流量
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
19. 1. 以下哪个不是Flume的核心组件:()
A. 数据块(Block)
B. 数据源(Source)
C. 数据通道(Channel)
D. 数据槽(Sink)
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
20. 2. 下面关于反爬机制描述错误的是:()
A. 简单低级的网络爬虫,数据采集速度快,伪装度低,如果没有反爬机制,它们可以很快地抓取大量数据,甚至因为请求过多,造成网站服务器不能正常工作,影响了企业的业务开展
B. 反爬机制也是一把双刃剑,一方面可以保护企业网站和网站数据,但是,另一方面,如果反爬机制过于严格,可能会误伤到真正的用户请求
C. 如果既要和“网络爬虫”死磕,又要保证很低的误伤率,那么又会增加网站研发的成本
D. 反爬机制不利于信息的自由流通,不利于网站发展,应该坚决取消
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
21. 3. 常用的规范化处理方法包括:()
A. Min-Max规范化
B. Z-Score规范化
C. 曲面规范化
D. 小数定标规范化
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
22. 4. 【单选题】以下哪个不是Flume的核心组件:()
A. 数据块(Block)
B. 数据源(Source)
C. 数据通道(Channel)
D. 数据槽(Sink)
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
23. 5. 【单选题】下面关于反爬机制描述错误的是:()
A. 简单低级的网络爬虫,数据采集速度快,伪装度低,如果没有反爬机制,它们可以很快地抓取大量数据,甚至因为请求过多,造成网站服务器不能正常工作,影响了企业的业务开展
B. 反爬机制也是一把双刃剑,一方面可以保护企业网站和网站数据,但是,另一方面,如果反爬机制过于严格,可能会误伤到真正的用户请求
C. 如果既要和“网络爬虫”死磕,又要保证很低的误伤率,那么又会增加网站研发的成本
D. 反爬机制不利于信息的自由流通,不利于网站发展,应该坚决取消
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
24. 6. 【多选题】常用的规范化处理方法包括:()
A. Min-Max规范化
B. Z-Score规范化
C. 曲面规范化
D. 小数定标规范化
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
25. 1. 下面关于关系数据库特点的描述,错误的是:()
A. 采用表格的储存方式,数据以行和列的方式进行存储,要读取和查询都十分方便
B. 为了规范化数据、减少重复数据以及充分利用好存储空间,把数据按照最小关系表的形式进行存储
C. 由于关系数据库将数据存储在数据表中,数据操作的瓶颈出现在多张数据表的操作中,而且数据表越多这个问题越严重
D. 关系数据库采用非结构化查询语言来对数据库进行查询
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
26. 2. 下面组件哪个是负责在Hadoop和关系数据库之间实现数据导入导出的:()
A. MySQL
B. HDFS
C. Sqoop
D. Flume
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
27. 3. 下列关于文档数据库的描述,哪些是正确的?()
A. 性能好(高并发),灵活性高
B. 具备统一的查询语法
C. 文档数据库支持文档间的事务
D. 复杂性低,数据结构灵活
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
28. 4. 下列关于数据模型的描述,哪些是正确的?()
A. HBase采用表来组织数据,表由行和列组成,列划分为若干个列族
B. 每个HBase表都由若干行组成,每个行由行键(row key)来标识
C. 列族里的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
29. 5. 【单选题】下面关于关系数据库特点的描述,错误的是:()
A. 采用表格的储存方式,数据以行和列的方式进行存储,要读取和查询都十分方便
B. 为了规范化数据、减少重复数据以及充分利用好存储空间,把数据按照最小关系表的形式进行存储
C. 由于关系数据库将数据存储在数据表中,数据操作的瓶颈出现在多张数据表的操作中,而且数据表越多这个问题越严重
D. 关系数据库采用非结构化查询语言来对数据库进行查询
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
30. 6. 【单选题】下面组件哪个是负责在Hadoop和关系数据库之间实现数据导入导出的:()
A. MySQL
B. HDFS
C. Sqoop
D. Flume
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
31. 7. 【多选题】下列关于文档数据库的描述,哪些是正确的?()
A. 性能好(高并发),灵活性高
B. 具备统一的查询语法
C. 文档数据库支持文档间的事务
D. 复杂性低,数据结构灵活
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
32. 8. 【多选题】下列关于数据模型的描述,哪些是正确的?()
A. HBase采用表来组织数据,表由行和列组成,列划分为若干个列族
B. 每个HBase表都由若干行组成,每个行由行键(row key)来标识
C. 列族里的数据通过列限定符(或列)来定位
D. 每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
33. 1. 【单选题】下列关于数据处理流程,说法有误的是?( )
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要用户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程一般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
34. 2. 【单选题】下面属于流计算技术的是:( )
A. Spark MLLib
B. GraphX
C. S4
D. Hive
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
35. 3. 【多选题】在实际应用中,大数据处理主要包括哪几种类型:( )
A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间
B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间
C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间
D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
36. 4. 【多选题】下面关于Spark SQL的描述正确的是:( )
A. Spark SQL在Hive兼容层面仅依赖HiveQL解析和Hive元数据
B. Spark SQL目前支持Scala、Java编程语言,暂时不支持Python语言
C. Spark SQL执行计划生成和优化都由Catalyst(函数式关系查询优化框架)负责
D. Spark SQL增加了DataFrame(即带有Schema信息的RDD),使用户可以在Spark SQL中执行SQL语句
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
37. 5. 下列关于数据处理流程,说法有误的是?( )
A. 在传统的数据处理流程中,存储的数据是旧的
B. 在传统的数据处理流程中,需要用户主动发出查询来获取结果
C. 传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D. 流计算的处理流程一般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
38. 6. 下面属于流计算技术的是:( )
A. Spark MLLib
B. GraphX
C. S4
D. Hive
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
39. 7. 在实际应用中,大数据处理主要包括哪几种类型:( )
A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间
B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间
C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间
D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
40. 8. 下面关于Spark SQL的描述正确的是:( )
A. Spark SQL在Hive兼容层面仅依赖HiveQL解析和Hive元数据
B. Spark SQL目前支持Scala、Java编程语言,暂时不支持Python语言
C. Spark SQL执行计划生成和优化都由Catalyst(函数式关系查询优化框架)负责
D. Spark SQL增加了DataFrame(即带有Schema信息的RDD),使用户可以在Spark SQL中执行SQL语句
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。