覆盖学起Plus、超星学习通等平台的全学科作业答案、历年真题与考试速查系统
中国大学MOOC作业考试答案

想要快速找到正确答案?

立即关注 九八五题库微信公众号,轻松解决学习难题!

中国大学MOOC
扫码关注

作业辅导
扫码关注
论文指导
轻松解决学习难题!

中国大学MOOC数据采集与预处理作业答案

数据采集与预处理

微信公众号:九八五题库

平台: 超星学习通

题目如下:

1. 1. 用设置的固定虚构值替换真值,这种方法属于()。

A. 无效化

B. 随机化

C. 以上都不是

D. 数据替换

答案: 数据替换

2. 2. 数据清洗主要是对缺失值、重复值、异常值和数据类型有误的数据进行处理( )。

A. 错误

B. 正确

答案: 正确

3. 3. 手工清洗是通过人工方式对数据进行检查,发现数据中的错误( )。

A. 正确

B. 错误

答案: 正确

4. 4. ( )对于数据仓库与数据挖掘应用来说,是核心和基础,它是获取可靠、有效数据的一个基本步骤。

A. 数据可视化

B. 数据分析

C. 数据清洗

D. 数据挖掘

答案: 数据清洗

5. 5. 在需要特殊脱敏规则时,可执行()以满足各种可能的脱敏规则。

A. 掩码屏蔽

B. 数据替换

C. 灵活编码

D. 偏移和取整

答案: 灵活编码

6. 6. 数据的价值不会因为不断被使用而削减,反而会因为不断重组而产生更大的价值()

A. 错误

B. 正确

答案: 正确

7. 7. ( )的任务主要包括数据清洗、数据集成、数据转换和数据脱敏等。

A. 以上都不是

B. 数据可视化

C. 数据分析

D. 数据预处理

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

8. 8. ( )是指对客观事件进行记录并可以鉴别的符号。

A. 数据

B. 符号

C. 信息

D. 集合

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

9. 9. 以下哪种方式是通过对数据值的截断、加密、隐藏等方式使敏感数据脱敏,使其不再具有利用价值()。

A. 无效化

B. 随机化

C. 以上都不是

D. 数据替换

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

10. 10. 以下哪种方式是针对账户类数据的部分信息进行脱敏( )。

A. 掩码屏蔽

B. 数据替换

C. 无效化

D. 偏移和取整

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

11. 11. 以下哪种数据转换策略是帮助除去数据中的噪声( )。

A. 规范化处理

B. 平滑处理

C. 以上都不是

D. 数据转换

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

12. 12. 数据脱敏是通过修改或删除敏感数据来保护数据安全的一种技术( )。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

13. 13. Z-Score的优点是不需要知道数据集的最大值和最小值,对离群点规范化效果好()。

A. 错误

B. 正确

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

14. 14. 以下哪个选项是决定数据质量好坏的重要因素()。

A. 数据清洗

B. 数据脱敏

C. 数据可视化

D. 数据分析

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

15. 15. 传统的数据采集与大数据采集相比,数据类型丰富,包括结构化、半结构化和非结构化( )。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

16. 16. 以下是主流的ETL工具的是( )

A. Datax

B. DataPipeline

C. Talend

D. Kettle

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

17. 17. 以下是数据采集的主要数据源的是( )。

A. 传感器数据

B. 企业业务系统数据

C. 互联网数据

D. 日志文件

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

18. 18. 以下是互联网企业常用的海量数据采集工具的是( )。

A. Hadoop的Chukwa

B. Hadoop的Hive

C. Facebook的Scribe

D. Cloudera的Flume

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

19. 19. ____是为了支持决策分析的数据集合。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

20. 20. 数据清洗主要是对____、____、____、____的数据进行处理。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

21. 21. ____一般是应用在几个数据库合并时或者多个数据源进行集成时。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

22. 22. 数据清洗的基本流程一共分为5个步骤,分别是____、____、____、____、____。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

23. 1. Python是一种( )的解释型高级编程语言。

A. 面向对象

B. 面向过程

C. 面向时间驱动

D. 以上都不是

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

24. 2. 以下关于Hadoop描述正确的是( )。

A. Hadoop是一种编程语言

B. Hadoop是一种操作系统

C. Hadoop是一个分布式计算框架

D. Hadoop是一种数据库管理系统

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

25. 3. MySQL中使用( )语法修改表中的数据。

A. SELECT 列名称 FROM表名称;

B. UPDATE表名称SET列名称 = 新值 WHERE列名称=某值;

C. DELETE EROM表名称 WHERE 列名称=某值;

D. INSERT INTO表名称(列1,列2,...) VALUES (值1,值2,...);

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

26. 4. MySQL中使用( )语法形式插入数据。

A. SELECT 列名称 FROM表名称;

B. UPDATE表名称SET列名称 = 新值 WHERE列名称=某值;

C. DELETE EROM表名称 WHERE 列名称=某值;

D. INSERT INTO表名称(列1,列2,...) VALUES (值1,值2,...);

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

27. 5. 在MySQL中可以使用( )语句打开数据库。

A. OPEN 数据库名称

B. SHOW DATABASES 数据库名称

C. USE 数据库名称

D. UPDATE DATABASE 数据库名称

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

28. 6. 以下哪个语句用于在 MySQL中创建新的数据库表( )。

A. SELECT

B. INSERT

C. CREATE DATABASE 数据库名称

D. UPDATE DATABASE 数据库名称

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

29. 7. Python中以下哪种序列存放的是不重复的的元素( )。

A. 数组

B. 元组

C. 集合

D. 字符串

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

30. 8. 以下哪个符号用于定义一个集合( )。

A. []

B. {}

C. ()

D. <>

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

31. 9. Python 的版本管理工具是( )。

A. Git

B. Sublime Text

C. PyCharm

D. Pip

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

32. 10. Python3.x中有( )个标准的数据类型。

A. 4

B. 5

C. 6

D. 7

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

33. 11. Python代码的后缀名是( )。

A. .py

B. java

C. c

D. p

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

34. 12. Python不支持跨平台,所以只能在Linux平台运行( )。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

35. 13. 在Python中,字符串是可变的数据类型( )。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

36. 14. 在Python中,字典的键必须是唯一的( )。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

37. 15. HDFS为了实现高可用性,必须使用昂贵的硬件设备()。

A. 正确

B. 错误

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

38. 16. 下列描述Python2.x和Python3.x正确的是( )。

A. Python2x和 Python 3x 的思想是共通的

B. Python2x和 Python 3x 的思想是完全不同的

C. 使用Python 3.x是大势所趋

D. Python2x和Python3x 的语法虽然存在不兼容的情况,但也只是一小部分语法不兼容

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

39. 17. 在Python中,数字类型包括( )。

A. int

B. float

C. bool

D. complex

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

40. 18. 在Python中,以下属于浮点数的是( )。

A. 3.14

B. -1.648

C. 1.3e4

D. 5.8726849267842

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

41. 19. 在Python 中,序列类型包括( )。

A. 字符串

B. 列表

C. 元组

D. 字典

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

42. 20. 在Hadoop HDFS中,用于将本地文件上传到HDFS的命令是( )。

A. hdfs dfs -put

B. hdfs dfs -get

C. hdfs dfs -copyFromLocal

D. hdfs dfs -copyToLocal

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

43. 21. 删除HDFS中/user/text.txt文件的命令是____。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

44. 22. Hadoop包括三种安装模式____、____、____。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

45. 23. Hadoop包含了____和____两大核心组件。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

46. 24. Hadoop是一个开源的分布式计算框架,它使用____来处理大规模数据集。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

47. 25. 在安装JDK后,我们需要设置____环境变量来确保Java应用程序能够正常运行。

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。



    文章说明
    本文标签:
    ©版权声明
    本站提供的文章均来自网上,如有侵权请邮件与我们联系处理。敬请谅解!
    评论留言

    昵称

    邮箱

    地址