欢迎光临,有需要请联系站长!
想要快速找到正确答案?
立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
中国大学MOOC机器学习24-25-2作业答案
机器学习24-25-2
学校: 无
平台: 超星学习通
题目如下:
1. 以下有关机器学习理解不正确的是 ( )。
A. 查询大量的操作数据去发现新的信息
B. 从大量的业务数据中分析有兴趣的新颖知识辅助决策的过程
C. 机器学习的结果不一定能辅助决策
D. 需要借助统计学或机器学习的一些算法
答案: 查询大量的操作数据去发现新的信息
2. 对于机器学习中的原始数据,存在的问题可能有( )。
A. 错误值
B. 重复
C. 异常值
D. 不完整
答案: 错误值# 重复# 异常值# 不完整
3. 数据预处理对机器学习是很重要的,下面说法正确的是( )。
A. 数据预处理的效果直接决定了机器学习的结果质量
B. 数据噪声对神经网络的训练没什么影响
C. 对于有问题的数据都直接删除即可
D. 预处理不需要花费大量的时间
答案: 数据预处理的效果直接决定了机器学习的结果质量
4. 以下哪个步骤不是机器学习所需的预处理工作( )。
A. 数值属 成人学历 性的标准化
B. 变量相关性分析
C. 异常值分析
D. 与用户讨论分析需求
答案: 与用户讨论分析需求
5. 下面哪个回归分析的说法是正确的( )。
A. 回归分析是分析一个变量与其他一个(或几个)变量之间的线性关系的统计方法
B. 回归分析不需要样本训练
C. 不可以预测非数据型属性的类别
D. 非线性回归方程一般要转化为线性回归方程才比较容易求解其中的参数
答案: 非线性回归方程一般要转化为线性回归方程才比较容易求解其中的参数
6. 分析营销投入与销售收入的关系可以使用下面哪种数据挖掘方法( )。
A. 关联分析
B. 回归分析
C. 聚类方法
D. 推荐算法
答案: 回归分析
7. 有关回归模型的系数,以下说法错误的是哪个( )。
A. 一元线性回归模型的系数可以使用最小二乘法求得
B. 多元回归模型的系数可以使用梯度下降法求得
C. 一元线性回归模型的系数大小和正负说明自变量对因变量的相对影响大小
D. 回归分析的目的是计算回归方程的系数,使得样本的输入和输出变量之间的关系能够合理拟合
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 对于非线性回归问题,以下说法错误的是哪个( )。
A. 可以分别求单个自变量与因变量的回归方程,然后简单求这些方程的加权和
B. 非线性回归方程的系数需要把其转化为线性回归方程才方便求解
C. 非线性回归模型的检验也可以使用R2
D. Logistic回归是一种典型的广义线性回归模型
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 特征选择与特征提取的关系是( )。
A. 特征提取包含特征选择
B. 特征选择包含特征提取
C. 一码事,说法不同而已
D. It is like comparing apples and oranges
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 下面有关箱图(盒图)的作用,正确的是哪些( )。
A. 作为一种常用的可视化图形,它可以展示一个变量(例如房价)的平均值、上下四分位等统计值
B. 箱图可以用于分析某个变量的不同取值对另一个变量影响的程度
C. 通过比较不同影响变量(对被影响变量)的箱图,可大致确定这些变量的相对重要性
D. 箱图可以了解一个变量的分布以及噪音情况
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 下面哪种可视化方法比较适合聚类分析( )。
A. 直方图
B. 散点图
C. 条状图
D. 箱图
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 以下有关可视化认识错误的是哪个( )。
A. 可视化是简单地把原始的数据用图的形式展示出来的方法
B. 可视化可以作为数据预处理的一种方法,找出其中的噪声
C. 可视化本身是一种数据分析方法,使用图表把数据中隐藏的规律展示出来
D. 通过数据的可视化,可以促进数据分析人员对数据的认识和规律发现
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 对在线教学的学生数据做分析,下面那个选项不是可视化的作用( )。
A. 可视化可用于分析不同类别学生的学习轨迹(流程)
B. 可视化可以动态展示不同时期学生群体的学习行为
C. 可视化可以帮助发现有问题的学生,从而可以提前做学情预警
D. 可视化可以预测一个刚选课不久的学生完成一门课程所需要的时间
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 在分类型机器学习过程中,下面有关分类算法的选择说法错误的是( )。
A. 算法参数是默认调好的,分析过程不需要修改
B. 分类算法的优劣需要通过实验比较才能确定
C. 分类算法对数据有一定的要求,一种算法不能解决所有的分类问题
D. 分类算法的结果只要训练样本准确度高就可以使用了
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 有关决策树的分类方法正确的是( )。
A. 决策树不能确定对决策属性起重要影响的变量
B. 决策树可以用于发现多种样本的特征
C. 决策树可用于确定相似的样本
D. 决策树结构越复杂越有效
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 有关决策树的说法哪个是错误的( )。
A. 可以转化为决策规则
B. 对新样本起到分类预测的作用
C. 决策树的深度越大越好
D. 决策树的算法和神经网络的原理不一样
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 从历史的样本分析中分析某个应聘者是否能适合某个岗位,以指导招聘人员选拨新员工,需要以下哪种分析( )。
A. 分类分析
B. 回归分析
C. 聚类
D. 内容检索
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 下列哪一种情况被称为过学习现象( )。
A. 在训练集上A优于B,在测试集上A也优于B
B. 在训练集上A优于B,在测试集上B优于A
C. 相对于分类数据集,决策树过于简单
D. 在训练集上决策树的误差很小
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
19. 有监督的学习和无监督的学习的根本区别在于( )。
A. 学习过程是否需要人工干预
B. 学习样本是否需要人工标记
C. 学习结果是否需要人工解释
D. 学习参数是否需要人工设置
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
20. 如果从员工的日常表现数据预测其升职的可能性可以使用下面哪种机器学习方法( )。
A. 关联分析
B. 线性回归分析
C. 聚类分析
D. 决策树 类算法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
21. 下面有关决策树剪枝的说法错误的是( )。
A. 决策树剪枝的目的是为了减少训练过程的过拟合,从而提升决策树模型的准确性
B. 决策树剪枝可以放在决策树的构造过程(预剪枝),也可以等决策树模型全部建立后再做(后剪枝)
C. 决策树剪枝的依据是看某层某个非叶节点转换成叶节点后,训练样本集的检验准确度是否提升
D. 决策树剪枝符合Occam剃刀原理(即机器学习模型越简单越好)
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
22. 下列关于随机森林的描述正确的是( )。
A. 与袋装法采用相同样本抽取方式
B. 每次从所有属性中随机抽取t个属性来训练分类器
C. 每次从所有样本中选取一定比例的样本来训练分类器
D. 可以使用不同的决策树的组合来构建分类模型
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
23. 随机森林的2个随机指的是( )。
A. 随机选取样本
B. 随机选取分类器
C. 随机选取权重
D. 随机选取属性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
24. 下列关于C4.5算法的描述不正确的是( )。
A. C4.5算法与ID3算法的总体思路是类似的
B. C4.5算法使用信息增益做为选择属性的度量标准
C. C4.5算法使用信息增益率做为选择属性的度量标准
D. 信息增益相同的属性,SplitInformation值越大,信息增益率越小
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
25. 下面有关贝叶斯网络的说法错误的有哪些( )。
A. 贝叶斯网络结构可以由机器自动完成
B. 贝叶斯网络的搭建需要考虑变量之间的因果关系,这是贝叶斯网络推理的基础
C. 作为一种监督学习算法,贝叶斯网络也需要大量的样本分析变量之间的概率
D. 贝叶斯网络的推理只能由原因变量,计算其联合概率,推出目标(分类)变量的条件概率,而不能由目标变量推出原因变量的可能性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
26. 贝叶斯网络构建的方法包括( )。
A. 根据问题和领域专家知识手工构建
B. 通过对数据进行分析得到贝叶斯网络
C. 根据问题自动创建
D. 综合领域专家知识是数据分析得到贝叶斯网络
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
27. 贝叶斯网络推理方法包括( )。
A. 从左至右
B. 自顶向下
C. 自底向上
D. 从右至左
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
28. 下面有关贝叶斯网络认识错误的是( )。
A. 叶斯网络克服了朴素贝叶斯特征之间需要相互独立等不足
B. 贝叶斯网络设计过程中主要是根据领域知识确定贝叶斯网络结构、确定网络参数(条件概率表)
C. 贝叶斯网络变量之间的因果关系和相应的概率部分是人工专家指定,不需要样本训练
D. 贝叶斯网络的参数主要是条件概率表中的概率值,可以使用最大似然估计或贝叶斯估计等方法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
29. 贝叶斯网络就是使用有向无环图来表示变量间依赖关系的概率图模型。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案 广东开放大学 。
30. 贝叶斯网络学习包括参数学习和结构学习。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
31. 对联通客户进行分组,以便根据各组的特点,策划不同的营销方案,需要客户哪些数据( )。
A. 客户人口数据
B. 收入数据
C. 家庭男女组成
D. 客户长途市话以及漫游等通话数据
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
32. 有关机器学习算法选择的说法不正确的有( )。
A. 每种算法都有其使用范围,因此选择算法需要考虑具体处理的问题
B. 判断机器学习算法好坏在数据需求阶段就可以确定
C. 在分类前可以先做聚类分析
D. 对聚类问题可以任选一种聚类算法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
33. 根据用户使用移动运营商的数据,可以为他们设计合适的套餐,使用哪种挖掘方法比较合适( )。
A. 聚类
B. 回归分析
C. 神经网络
D. 关联分析
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
34. 有关聚类算法不正确的说法是( )。
A. 把分析的样本根据距离分组
B. 必须给出聚类的组数
C. 聚类是分类的基础
D. 聚类算法可以找出每组样本不同的特征
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
35. 以下哪些数据的特征会对聚类有影响( )。
A. 高维性
B. 样本规模
C. 噪声
D. 离群点
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
36. 下列说法错误的是 ( )。
A. 在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好
B. 聚类分析可以看作是一种非监督的样本分组过程
C. k均值算法是一种常用的聚类算法,簇的个数算法不能自动确定
D. k均值算法的计算耗时与初始假设聚类中心的位置有关
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
37. 对于轮廓系数图表述正确的是( )。
A. 每个点的取值范围为[0, 1]
B. 每个点的取值越接近于0越好
C. 可以体现出簇的紧凑性
D. 对于离群点,取值可能超过1性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
38. 如何衡量聚类的质量( )。
A. 簇内数据点散布越小越好
B. 簇中心点之间的距离越大越好
C. 簇的个数越小越好
D. 需要考虑数据点间的连通性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
39. 一个好的聚类算法应当具备哪些潜质( )。
A. 能够处理非球形的数据分布
B. 能够处理噪点和离群点
C. 对样本输入序列不敏感
D. 对海量数据的可扩展性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
40. 有关k-means下列说法正确的是( )。
A. 可以确定样本属性的重要性
B. 可以处理规则分布数据的聚类
C. 适合任意数据集的分组
D. 聚类的结果与初始选择的假设聚类中心无关
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
41. K-Means算法中的初始中心点( )。
A. 可随意设置
B. 必须在每个簇的真实中心点的附近
C. 必须足够分散
D. 直接影响算法的收敛结果
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
42. 聚类中的簇与分类中的类的关系是( )。
A. 簇即是类、类即是簇
B. 簇是类的一种具体表现形式
C. 类是簇的一种具体表现形式
D. 不是一码事,但实际中有一定联系
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
43. 在市场营销中,聚类最有可能帮助经营者( )。
A. 对客户群进行划分
B. 进行商品推荐
C. 进兴趣进行分类
D. 辅助商品定价
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
44. 与K-Means相比,基于密度的DBSCAN的优点不包括( )。
A. 能妥善处理噪点和离群点
B. 能处理不规则的数据分布
C. 不需要预先设定簇的个数
D. 较低的计算复杂度
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
45. 在DBSCAN中,对数据点类型的划分中不包括( )。
A. 中心点
B. 核心点
C. 边缘点
D. 噪点
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
46. 在DBSCAN中,对数据点类型的划分中不包括( )。
A. 划分到最近的簇
B. 所有噪点单独形成一个簇
C. 直接无视
D. 不做特别区分
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
47. 在DBSCAN中,对噪音处理正确的是( )。
A. 划分到最近的簇
B. 所有噪点单独形成一个簇
C. 直接无视
D. 不做特别区分
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
48. 奥卡姆的剃刀指的是( )。
A. Entities are not to be multiplied beyond necessity.
B. Among competing hypotheses, the one with the fewest assumptions should be selected.
C. The simplest explanation is usually the correct one.
D. 中世纪英国上流社会的一种生活用品
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
49. 哪些情况下必须停止树的增长( )。
A. 当前数据子集的标签一致
B. 没有更多可用属性
C. 当前数据子集为空
D. 当前训练误差已经较低
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
50. 为什么一般不推荐在决策树中使用“生日”属性( )。
A. 星座信息更有说服力
B. 容易造成过学习
C. 可能的取值太多,计算量过大
D. 两个人可能生日相同
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
51. 决策树模型中建树的基本原则是( )。
A. 取值多的属性应放在上层
B. 取值少的属性应放在上层
C. 信息增益大的属性应放在上层
D. 应利用尽可能多的属性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
52. 在层次型聚类中( )。
A. 需要用户预先设定聚类的个 渝粤题库 数
B. 需要用户预先设定聚类个数的范围
C. 对于N个数据点,可生成1到N个簇
D. 对于N个数据点,可生成1到N/2个簇
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
53. 在层次型聚类中,两个点集之间的距离计算方法通常不包括( )。
A. 由点集间距离最近的一对点的距离决定
B. 由点集间距离最远的一对点的距离决定
C. 由点集间随机的一对点的距离决定
D. 由点集间所有点的平均距离决定
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
54. 在混合高斯模型中,每一个数据点( )。
A. 只能被某一个高斯生成
B. 可以被所有高斯等概率生成
C. 可以被任一高斯生成但概率可能不等
D. 可以被任一高斯生成且概率由高斯的权重决定
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
55. 在混合高斯模型中,每个高斯的权重( )。
A. 可以为负值
B. 相加必须等于0
C. 相加必须等于1
D. 须由用户预先设定
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
56. 在掷硬币的例子中,期望最大化算法的隐含参数指的是( )。
A. 每组实验中正面朝上的次数
B. 每组实验中选择的硬币
C. 每枚硬币正面朝上的概率
D. 每枚硬币被选中的次数
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
57. 以下有关kohonen神经网络聚类模型正确的说法是( )。
A. Kohonen神经网络的聚类过程不需要计算样本之间的距离
B. Kohonen输入层和输出层之间的权重修正不能使用梯度下降法
C. kohonon神经网络输出层的神经元计算类似BP神经网络的输出神经元计算
D. Kohonon神经网络聚类的组数事先可以确定
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
58. 下面有关朴素贝叶斯算法的认识错误的是( )。
A. 与决策树算法不同,朴素贝叶斯模型是比较各种类别出现的概率大小确定样本的类别
B. 朴素贝叶斯算法是一种使用概率理论的非监督分类算法
C. 朴素贝叶斯模型需要先确定特征,并根据样本计算相关的先验概率,再计算特征条件下的分类变量的后验概率
D. 朴素贝叶斯模型课用于垃圾邮件分类、微博用户情感的识别等场景
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
59. 有关朴素贝叶斯分类器的说法正确的是( )。
A. 朴素贝叶斯分类器的变量必须是非连续性变量
B. 朴素贝叶斯模型分类时需要计算属于各种类别的概率,取其中概率最大的类别最为分类预测值
C. 朴素贝叶斯模型中的特征和类别变量之间也要相互独立
D. 朴素贝叶斯分类器对于小样本数据集效果不如决策树好
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
60. 朴素贝叶斯分类器的朴素之处在于( )。
A. 只能处理低维属性
B. 只能处理离散型属性
C. 分类效果一般
D. 属性之间的条件独立性假设
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
61. 以下关于两个变量X和Y说法正确的是( )。
A. 若独立一定不相关
B. 若不相关一定独立
C. 若独立不一定不相关
D. 我已经晕了
国家开放大学 red">答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
62. 两个事件A和B条件独立指的是( )。
A. P(A, B)=P(A)P(B)
B. P(A, B)=P(A|B)P(B)
C. P(A|B, C)=P(A|C)
D. P(A|B)=P(A)
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
63. 以下关于拉普拉斯平滑说法正确的是( )。
A. 防止计算条件概率时分母为零
B. 防止计算条件概率时分子为零
C. 用于解决训练集中的噪声
D. 用于解决训练集中的异 渝粤教育 常值
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
64. 如果两个事件独立,那么这两个事件是不相关的。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
65. 在SVM领域中,margin的含义是( )。
A. 盈利率
B. 马金
C. 间隔
D. 保证金
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
66. 线性SVM和一般线性分类器的区别主要是( )。
A. 是否进行了空间映射
B. 是否确保间隔最大化
C. 是否能处理线性不可分问题
D. 训练误差通常较低
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
67. 为什么通常要选择margin最大的分类器( )。
A. 所需的支持向量个数最少
B. 计算复杂度最低
C. 训练误差最低
D. 望获得较低的测试误差
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
68. 假设超平面为w*x+b=0,其margin的大小为( )。
A. 1/|w|
B. 2/|w|
C. |b|/|w|
D. |b|/|w
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
69. 在SVM当中,主要的运算形式是( )。
A. 向量内积
B. 矩阵乘法
C. 矩阵转置
D. 矩阵分解
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
70. 软间隔(soft margin)的主要用途是( )。
A. 解决线性不可分问题
B. 解决不完全线性可分问题
C. 降低算法时间复杂度
D. 提高算法分类精确
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
71. 通过运用核函数,我们可以( )。
A. 提高算法的可解释性
B. 生成数量较少的支持向量
C. 生成数量较多的支持向量
D. 避免高维空间运算,降低算法复杂度
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。