覆盖学起Plus、超星学习通等平台的全学科作业答案、历年真题与考试速查系统
中国大学MOOC作业考试答案

想要快速找到正确答案?

立即关注 九八五题库微信公众号,轻松解决学习难题!

中国大学MOOC
扫码关注

作业辅导
扫码关注
论文指导
轻松解决学习难题!

中国大学MOOC大数据分析与挖掘作业答案

大数据分析与挖掘

学校: 九八五题库

学校: 超星学习通

题目如下:

1. 1. 下列关于Pandas数据读/写说法错误的是()

A. read_csv能够读取所有文本文档的数据

B. read_sql能够读取数据库的数据

C. to_csv函数能够读取数据库的数据写入.csv文件

D. to_excel函数能够将结构化数据写入Excel文件

答案: read_csv能够读取所有文本文档的数据

2. 2. 下列loc、iloc、ix属性的用法正确的是()

A. df.loc['列名','索引名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列名']

B. df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引位置','列名']

C. df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引名','列位置']

D. df.loc['索引名','列名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列位置']

答案: df.loc['索引名','列名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列位置']

3. 3. 下列关于时间相关类错误的是()

A. Timestamp是存放某个时间点的类

B. Period是存放某个时间段的类

C. Timestamp数据可以使用标准的试卷字符串转换得来

D. 两个数值上相同的Period和Timestamp所代表的意义相同

答案: 两个数值上相同的Period和Timestamp所代表的意义相同

4. 4. 使用pivot_table函数制作透视表用下列()参数设置行分组键。

A. index

B. raw

C. values

D. data

答案: index

5. 5. 使用其本身可以达到数据透视功能的函数是()。

A. groupby

B. transform

C. crosstab

D. pivot_table

答案: pivot_table

6. 6. 下列关于groupby方法说法确的是()

A. groupby能够实现分组聚

B. proupby 方法的结果能够直接查看

C. groupby是 pandas提供的一个用来分组的方法

D. groupby方法是 pandas提供的一个用来聚合的方法

答案: groupby是 pandas提供的一个用来分组的方法

7. 7. 下列关于apply 方法说法正确的是()。

A. apply 方法是对 DataFrame每一个元素应用某个函数的

B. apply 方法能够实现所有aggregate 方法的功能

C. apply方法和 map方法都能够进行聚合操作

D. apply 方法只能够对行列进行操作

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

8. 8. 下列关于分组聚合的说法错误的是( )

A. pandas提供的分组和聚合函数分别只有一个

B. pandas分组聚合能够实现组内标准化

C. pandas 聚合时能够使用agg、apply、 transform 方法

D. pandas分组函数只有一个groupby

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

9. 9. 数据质量包含的要素有( )

A. 准确性、完整性

B. 时效性、可信性

C. 一致性、可解释性

D. 以上所有要素

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

10. 10. 以下关于数据分析预处理的过程描述正确的是()

A. 数据清洗包含广数机积准化、数据合并和缺失值处理

B. 数据合并按照合并轴方向主要分为左连接、右连接、内连接和外连接

C. 数据分析的预处理过程主要包括效据清洗, 数据合井、敏据标准化柏数据转换,它们之间存在交叉,没有严格的先后关系。

D. 数据标准化的主要对象是类别型的特征

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

11. 11. 有一份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述性分析。 下列的步骤和方法正确的是( ).

A. dtypes查看类型,astype转换类别,describe描述性统计

B. astype查看类型,dtypes转换类别,describe描述性统计

C. describe查看类型,astype转换类别,dtypes描述性统计

D. dtypes查看类型,describe转换类别,astype描述性统计

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

12. 12. 下列关于concat函数、append方法、merge函数和join方法的说法正确的是()。

A. concat 是最常用的主键合并的函数,能够实现内连按和外连接

B. append 方法只能用来做纵向堆叠,适用于所有纵向堆叠情况

C. merge 是最常用的主键合并的函数,但不能够实现左连接和右连接

D. join 是常用的主键合并方法之一,但不能够实现左连接和右连接

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

13. 13. 以下关于drop_ duplicates 函数的说法中错误的是()。

A. 仅对DataFrame和Series 类型的数据有效

B. 仅支持单-特征的数据去重

C. 数据重复时默认保留第一个数据

D. 该函数不会改变原始数据排列

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

14. 14. 以下关于缺失值检测的说法中,正确的是()。

A. mull和notnull可以对缺失值进行处理

B. dropna方法既可以删除观测记录,亦可以制徐特征

C. fillna 方法中用来若换缺失值的值只能是数据框

D. pandas库中的interpolate模块包含了多种插值方法

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

15. 15. 以下关于异常值检测的说法中错误的是()。

A. 3δ原则利用了统计学中小概率事件的原理分布

B. 使用箱线图方法时要求数据服从或近似服从正态分布

C. 基于聚类的方法可以进行离群点检测

D. 基于分类的方法可以进行离群点检测

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

16. 16. 下列与标准化方法有关的说法中错误的是()。

A. 离差标准化简单易懂,对最大值和最小值敏感度不高

B. 标准差标准化是最常用的标准化方法,又名零—匀值标准化

C. 小数定标标准化实质上就是将数据按照一定的比例缩小

D. 多个特征的数据的K-Means聚类不需要对数据进行标准化

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

17. 17. 关于标准差标准化,下列说法中错误的是()。

A. 经过该方法处理后的数据均值为0,标准差为1

B. 可能会改变数据的分布情况

C. Python中可自定义该方法实现函数: def StandardScaler(data): data=(data-data.mean())/data.std() return data

D. 计算公式为:

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。

18. 18. 以下关于pandas 数据预处理说法正确的是()。

A. pandas没有做哑变量的函数

B. 在不导入其他厍的情况下,仅仅使用 pandas就可实现聚类分析离散化

C. pandas 可以实现所有的数据预处理操作

D. cut 函数默认情况下做的是等宽法离散化

答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。



    文章说明
    本文标签:
    ©版权声明
    本站提供的文章均来自网上,如有侵权请邮件与我们联系处理。敬请谅解!
    评论留言

    昵称

    邮箱

    地址