欢迎访问本站!这是一条测试公告。
想要快速找到正确答案?
立即关注 九八五题库微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
中国大学MOOC数据采集与预处理作业答案
数据采集与预处理
微信公众号:九八五题库
平台: 超星学习通
题目如下:
1. 1. 用设置的固定虚构值替换真值,这种方法属于()。
A. 无效化
B. 随机化
C. 以上都不是
D. 数据替换
答案: 数据替换
2. 2. 数据清洗主要是对缺失值、重复值、异常值和数据类型有误的数据进行处理( )。
A. 错误
B. 正确
答案: 正确
3. 3. 手工清洗是通过人工方式对数据进行检查,发现数据中的错误( )。
A. 正确
B. 错误
答案: 正确
4. 4. ( )对于数据仓库与数据挖掘应用来说,是核心和基础,它是获取可靠、有效数据的一个基本步骤。
A. 数据可视化
B. 数据分析
C. 数据清洗
D. 数据挖掘
答案: 数据清洗
5. 5. 在需要特殊脱敏规则时,可执行()以满足各种可能的脱敏规则。
A. 掩码屏蔽
B. 数据替换
C. 灵活编码
D. 偏移和取整
答案: 灵活编码
6. 6. 数据的价值不会因为不断被使用而削减,反而会因为不断重组而产生更大的价值()
A. 错误
B. 正确
答案: 正确
7. 7. ( )的任务主要包括数据清洗、数据集成、数据转换和数据脱敏等。
A. 以上都不是
B. 数据可视化
C. 数据分析
D. 数据预处理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 8. ( )是指对客观事件进行记录并可以鉴别的符号。
A. 数据
B. 符号
C. 信息
D. 集合
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 9. 以下哪种方式是通过对数据值的截断、加密、隐藏等方式使敏感数据脱敏,使其不再具有利用价值()。
A. 无效化
B. 随机化
C. 以上都不是
D. 数据替换
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 10. 以下哪种方式是针对账户类数据的部分信息进行脱敏( )。
A. 掩码屏蔽
B. 数据替换
C. 无效化
D. 偏移和取整
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 11. 以下哪种数据转换策略是帮助除去数据中的噪声( )。
A. 规范化处理
B. 平滑处理
C. 以上都不是
D. 数据转换
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 12. 数据脱敏是通过修改或删除敏感数据来保护数据安全的一种技术( )。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 13. Z-Score的优点是不需要知道数据集的最大值和最小值,对离群点规范化效果好()。
A. 错误
B. 正确
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 14. 以下哪个选项是决定数据质量好坏的重要因素()。
A. 数据清洗
B. 数据脱敏
C. 数据可视化
D. 数据分析
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 15. 传统的数据采集与大数据采集相比,数据类型丰富,包括结构化、半结构化和非结构化( )。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 16. 以下是主流的ETL工具的是( )
A. Datax
B. DataPipeline
C. Talend
D. Kettle
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 17. 以下是数据采集的主要数据源的是( )。
A. 传感器数据
B. 企业业务系统数据
C. 互联网数据
D. 日志文件
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 18. 以下是互联网企业常用的海量数据采集工具的是( )。
A. Hadoop的Chukwa
B. Hadoop的Hive
C. Facebook的Scribe
D. Cloudera的Flume
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
19. 19. ____是为了支持决策分析的数据集合。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
20. 20. 数据清洗主要是对____、____、____、____的数据进行处理。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
21. 21. ____一般是应用在几个数据库合并时或者多个数据源进行集成时。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
22. 22. 数据清洗的基本流程一共分为5个步骤,分别是____、____、____、____、____。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
23. 1. Python是一种( )的解释型高级编程语言。
A. 面向对象
B. 面向过程
C. 面向时间驱动
D. 以上都不是
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
24. 2. 以下关于Hadoop描述正确的是( )。
A. Hadoop是一种编程语言
B. Hadoop是一种操作系统
C. Hadoop是一个分布式计算框架
D. Hadoop是一种数据库管理系统
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
25. 3. MySQL中使用( )语法修改表中的数据。
A. SELECT 列名称 FROM表名称;
B. UPDATE表名称SET列名称 = 新值 WHERE列名称=某值;
C. DELETE EROM表名称 WHERE 列名称=某值;
D. INSERT INTO表名称(列1,列2,...) VALUES (值1,值2,...);
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
26. 4. MySQL中使用( )语法形式插入数据。
A. SELECT 列名称 FROM表名称;
B. UPDATE表名称SET列名称 = 新值 WHERE列名称=某值;
C. DELETE EROM表名称 WHERE 列名称=某值;
D. INSERT INTO表名称(列1,列2,...) VALUES (值1,值2,...);
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
27. 5. 在MySQL中可以使用( )语句打开数据库。
A. OPEN 数据库名称
B. SHOW DATABASES 数据库名称
C. USE 数据库名称
D. UPDATE DATABASE 数据库名称
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
28. 6. 以下哪个语句用于在 MySQL中创建新的数据库表( )。
A. SELECT
B. INSERT
C. CREATE DATABASE 数据库名称
D. UPDATE DATABASE 数据库名称
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
29. 7. Python中以下哪种序列存放的是不重复的的元素( )。
A. 数组
B. 元组
C. 集合
D. 字符串
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
30. 8. 以下哪个符号用于定义一个集合( )。
A. []
B. {}
C. ()
D. <>
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
31. 9. Python 的版本管理工具是( )。
A. Git
B. Sublime Text
C. PyCharm
D. Pip
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
32. 10. Python3.x中有( )个标准的数据类型。
A. 4
B. 5
C. 6
D. 7
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
33. 11. Python代码的后缀名是( )。
A. .py
B. java
C. c
D. p
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
34. 12. Python不支持跨平台,所以只能在Linux平台运行( )。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
35. 13. 在Python中,字符串是可变的数据类型( )。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
36. 14. 在Python中,字典的键必须是唯一的( )。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
37. 15. HDFS为了实现高可用性,必须使用昂贵的硬件设备()。
A. 正确
B. 错误
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
38. 16. 下列描述Python2.x和Python3.x正确的是( )。
A. Python2x和 Python 3x 的思想是共通的
B. Python2x和 Python 3x 的思想是完全不同的
C. 使用Python 3.x是大势所趋
D. Python2x和Python3x 的语法虽然存在不兼容的情况,但也只是一小部分语法不兼容
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
39. 17. 在Python中,数字类型包括( )。
A. int
B. float
C. bool
D. complex
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
40. 18. 在Python中,以下属于浮点数的是( )。
A. 3.14
B. -1.648
C. 1.3e4
D. 5.8726849267842
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
41. 19. 在Python 中,序列类型包括( )。
A. 字符串
B. 列表
C. 元组
D. 字典
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
42. 20. 在Hadoop HDFS中,用于将本地文件上传到HDFS的命令是( )。
A. hdfs dfs -put
B. hdfs dfs -get
C. hdfs dfs -copyFromLocal
D. hdfs dfs -copyToLocal
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
43. 21. 删除HDFS中/user/text.txt文件的命令是____。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
44. 22. Hadoop包括三种安装模式____、____、____。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
45. 23. Hadoop包含了____和____两大核心组件。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
46. 24. Hadoop是一个开源的分布式计算框架,它使用____来处理大规模数据集。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
47. 25. 在安装JDK后,我们需要设置____环境变量来确保Java应用程序能够正常运行。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
如果觉得文章对您有用,请随意打赏。
您的支持是我们继续创作的动力!
微信扫一扫
支付宝扫一扫