欢迎访问本站!这是一条测试公告。
想要快速找到正确答案?
立即关注 九八五题库微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
中国大学MOOC大数据分析与挖掘作业答案
大数据分析与挖掘
学校: 九八五题库
学校: 超星学习通
题目如下:
1. 1. 下列关于Pandas数据读/写说法错误的是()
A. read_csv能够读取所有文本文档的数据
B. read_sql能够读取数据库的数据
C. to_csv函数能够读取数据库的数据写入.csv文件
D. to_excel函数能够将结构化数据写入Excel文件
答案: read_csv能够读取所有文本文档的数据
2. 2. 下列loc、iloc、ix属性的用法正确的是()
A. df.loc['列名','索引名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列名']
B. df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引位置','列名']
C. df.loc['索引名','列名'];df.iloc['索引位置','列名'];df.ix['索引名','列位置']
D. df.loc['索引名','列名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列位置']
答案: df.loc['索引名','列名'];df.iloc['索引位置','列位置'];df.ix['索引位置','列位置']
3. 3. 下列关于时间相关类错误的是()
A. Timestamp是存放某个时间点的类
B. Period是存放某个时间段的类
C. Timestamp数据可以使用标准的试卷字符串转换得来
D. 两个数值上相同的Period和Timestamp所代表的意义相同
答案: 两个数值上相同的Period和Timestamp所代表的意义相同
4. 4. 使用pivot_table函数制作透视表用下列()参数设置行分组键。
A. index
B. raw
C. values
D. data
答案: index
5. 5. 使用其本身可以达到数据透视功能的函数是()。
A. groupby
B. transform
C. crosstab
D. pivot_table
答案: pivot_table
6. 6. 下列关于groupby方法说法确的是()
A. groupby能够实现分组聚
B. proupby 方法的结果能够直接查看
C. groupby是 pandas提供的一个用来分组的方法
D. groupby方法是 pandas提供的一个用来聚合的方法
答案: groupby是 pandas提供的一个用来分组的方法
7. 7. 下列关于apply 方法说法正确的是()。
A. apply 方法是对 DataFrame每一个元素应用某个函数的
B. apply 方法能够实现所有aggregate 方法的功能
C. apply方法和 map方法都能够进行聚合操作
D. apply 方法只能够对行列进行操作
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 8. 下列关于分组聚合的说法错误的是( )
A. pandas提供的分组和聚合函数分别只有一个
B. pandas分组聚合能够实现组内标准化
C. pandas 聚合时能够使用agg、apply、 transform 方法
D. pandas分组函数只有一个groupby
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 9. 数据质量包含的要素有( )
A. 准确性、完整性
B. 时效性、可信性
C. 一致性、可解释性
D. 以上所有要素
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 10. 以下关于数据分析预处理的过程描述正确的是()
A. 数据清洗包含广数机积准化、数据合并和缺失值处理
B. 数据合并按照合并轴方向主要分为左连接、右连接、内连接和外连接
C. 数据分析的预处理过程主要包括效据清洗, 数据合井、敏据标准化柏数据转换,它们之间存在交叉,没有严格的先后关系。
D. 数据标准化的主要对象是类别型的特征
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 11. 有一份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述性分析。 下列的步骤和方法正确的是( ).
A. dtypes查看类型,astype转换类别,describe描述性统计
B. astype查看类型,dtypes转换类别,describe描述性统计
C. describe查看类型,astype转换类别,dtypes描述性统计
D. dtypes查看类型,describe转换类别,astype描述性统计
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 12. 下列关于concat函数、append方法、merge函数和join方法的说法正确的是()。
A. concat 是最常用的主键合并的函数,能够实现内连按和外连接
B. append 方法只能用来做纵向堆叠,适用于所有纵向堆叠情况
C. merge 是最常用的主键合并的函数,但不能够实现左连接和右连接
D. join 是常用的主键合并方法之一,但不能够实现左连接和右连接
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 13. 以下关于drop_ duplicates 函数的说法中错误的是()。
A. 仅对DataFrame和Series 类型的数据有效
B. 仅支持单-特征的数据去重
C. 数据重复时默认保留第一个数据
D. 该函数不会改变原始数据排列
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 14. 以下关于缺失值检测的说法中,正确的是()。
A. mull和notnull可以对缺失值进行处理
B. dropna方法既可以删除观测记录,亦可以制徐特征
C. fillna 方法中用来若换缺失值的值只能是数据框
D. pandas库中的interpolate模块包含了多种插值方法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 15. 以下关于异常值检测的说法中错误的是()。
A. 3δ原则利用了统计学中小概率事件的原理分布
B. 使用箱线图方法时要求数据服从或近似服从正态分布
C. 基于聚类的方法可以进行离群点检测
D. 基于分类的方法可以进行离群点检测
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 16. 下列与标准化方法有关的说法中错误的是()。
A. 离差标准化简单易懂,对最大值和最小值敏感度不高
B. 标准差标准化是最常用的标准化方法,又名零—匀值标准化
C. 小数定标标准化实质上就是将数据按照一定的比例缩小
D. 多个特征的数据的K-Means聚类不需要对数据进行标准化
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 17. 关于标准差标准化,下列说法中错误的是()。
A. 经过该方法处理后的数据均值为0,标准差为1
B. 可能会改变数据的分布情况
C. Python中可自定义该方法实现函数: def StandardScaler(data): data=(data-data.mean())/data.std() return data
D. 计算公式为:
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 18. 以下关于pandas 数据预处理说法正确的是()。
A. pandas没有做哑变量的函数
B. 在不导入其他厍的情况下,仅仅使用 pandas就可实现聚类分析离散化
C. pandas 可以实现所有的数据预处理操作
D. cut 函数默认情况下做的是等宽法离散化
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
如果觉得文章对您有用,请随意打赏。
您的支持是我们继续创作的动力!
微信扫一扫
支付宝扫一扫