欢迎光临,有需要请联系站长!
想要快速找到正确答案?
立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
中国大学MOOC机器学习进步作业答案
机器学习进步
学校: 九八五题库
学校: 超星学习通
题目如下:
1. 1. 在构建 ROC 曲线时,模型的分类结果需要按某种方式计算真阳性率(TPR)和假阳性率 (FPR)。以下哪项是正确的构建步骤?
A. 根据不同阈值计算 TPR 和 FPR,并将结果绘制成曲线
B. 直接使用分类模型的精确率和召回率绘制 ROC 曲线
C. ROC 曲线只与分类模型的最终预测类别相关,与概率预测无关
D. ROC 曲线中的面积等于模型的准确率
答案: 根据不同阈值计算 TPR 和 FPR,并将结果绘制成曲线
2. 2. 在评估分类模型时,AUC-ROC 曲线的面积可以反映模型的性能。以下关于 AUC-ROC 的描述中,哪一项是正确的?
A. AUC 的值越高,模型对正负样本的分类能力越差
B. AUC 的值为 0.5 时,表示模型的性能与随机猜测相当
C. AUC 曲线只能用于评估二分类问题,无法用于多分类问题
D. AUC 的值为 1 时,表示模型在训练集上的过拟合
答案: AUC 的值为 0.5 时,表示模型的性能与随机猜测相当
3. 3. AUC可以写成一个优化目标。
答案: 正确
4. 1. 在机器学习任务中,以下哪种情况最适合考虑“非均等代价”?
A. 数据集中的正负样本数量相等,且错误的代价相同
B. 错误预测某类别会导致比另一个类别更高的损失
C. 模型需要优化整体准确率,而不是特定类别的表现
D. 训练数据中不包含任何错误标注
答案: 错误预测某类别会导致比另一个类别更高的损失
5. 2. 在二分类问题中,如果分类器将“高风险事件”误分类为“低风险事件”,可能造成严重损失。由此,哪种策略不合理?
A. 忽略代价差异,专注于提高总体准确率
B. 为高风险事件设定更高的预测权重或代价
C. 优先选择不平衡数据采样策略而不考虑代价
D. 完全避免使用代价敏感算法
答案: 忽略代价差异,专注于提高总体准确率# 优先选择不平衡数据采样策略而不考虑代价# 完全避免使用代价敏感算法
6. 3. 在疾病预测任务中,将“患者”预测为“健康人”的代价通常低于 “健康人”预测为“患者”的代价。
答案: 错误
7. 4. 【单选题】在机器学习任务中,以下哪种情况最适合考虑“非均等代价”?
A. 数据集中的正负样本数量相等,且错误的代价相同
B. 错误预测某类别会导致比另一个类别更高的损失
C. 模型需要优化整体准确率,而不是特定类别的表现
D. 训练数据中不包含任何错误标注
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 5. 【判断题】在疾病预测任务中,将“患者”预测为“健康人”的代价通常低于 “健康人”预测为“患者”的代价。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 1. 如果一个模型具有很高的方差,那么可能出现以下哪种情况?
A. 在训练集上表现优秀,但在测试集上表现较差
B. 在训练集和测试集上表现均较差
C. 模型对数据中的噪声不敏感
D. 模型的复杂度较低
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 2. 在模型选择中,以下哪种情况可能导致高偏差?
A. 模型过于复杂
B. 模型欠拟合
C. 数据中的噪声过多
D. 使用过多的训练数据
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 3. 在偏差-方差分解中,模型的预测误差可分解为?
A. 历史误差
B. 偏差平方
C. 方差
D. 不可避免的噪声项
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 4. 【单选题】在模型选择中,以下哪种情况可能导致高偏差?
A. 模型过于复杂
B. 模型欠拟合
C. 数据中的噪声过多
D. 使用过多的训练数据
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 1. 在使用线性判别分析进行分类时,样本的类别标签对于算法的学习和分类过程是否是必需的?
A. 是,类别标签是必需的
B. 否,类别标签不是必需的
C. 只有在多类别问题中类别标签是必需的
D. 只有在二分类问题中类别标签是必需的
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 2. 在线性判别分析中,类内散度矩阵的计算方法是将每个类别的样本与其最近样本进行求差,然后对差值向量进行矩阵乘积。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 3. 线性判别分析的目标是通过最大化类内距离和最小化类间距离来实现分类。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 1. 类别不平衡问题中,什么情况需要做特殊处理?
A. 大类比小类重要
B. 小类和大类一样重要
C. 小类比大类重要
D. 任何情况
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 2. 基于纠错输出码,即使某个分类器在预测时出错,也能产生正确的最终分类结果。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 3. 【判断题】基于纠错输出码,即使某个分类器在预测时出错,也能产生正确的最终分类结果。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
19. 1. 在人工智能的发展历程中,出现了三种主要的学派:符号主义、连接主义和行为主义。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
20. 2. 【判断题】在人工智能的发展历程中,出现了三种主要的学派:符号主义、连接主义和行为主义。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
21. 1. 决策树算法一般如何对连续值进行处理?
A. 不使用这个特征
B. 划分无限个区间
C. 对连续值进行离散化处理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
22. 2. 在处理连续值的时候,n个属性值可以划分为n个候选划分,然后当做离散属性处理。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
23. 3. 【单选题】决策树算法一般如何对连续值进行处理?
A. 不使用这个特征
B. 划分无限个区间
C. 对连续值进行离散化处理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
24. 4. 【判断题】在处理连续值的时候,n个属性值可以划分为n个候选划分,然后当做离散属性处理。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
25. 1. 决策树和深度方法相比一个明显的优势是什么?
A. 可解释性
B. 运行速度
C. 结果准确率
D. 内存占用
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
26. 1. 下面有关正则化问题的说法错误的是()。
A. 结构风险描述模型本身的某些性质。
B. 经验风险描述模型与训练数据的契合程度。
C. 经验风险对应于正则化项。
D. 正则化常数用于对结构风险和经验风险进行折中。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
27. 2. 结构风险的信息有助于降低最小化训练误差的过拟合风险。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
28. 3. 常用的正则化项范数中,倾向于分量取值尽量均衡(即非零分量个数尽量稠密)的范数是L2范数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
29. 4. 正则化通过对不希望的结果施以惩罚,使得优化过程趋向于希望目标。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
30. 5. 在统计学习中通常说的正则化在贝叶斯类方法中对应于“后验”。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
31. 1. 关于表示定理的以下说法中,哪一项是正确的?
A. 表示定理仅适用于线性可分的数据集,不能扩展到非线性问题。
B. 表示定理表明,最优解总可以表示为输入样本通过核函数映射后的线性组合。
C. 表示定理指出,只有平方损失函数才能满足最优解的核表示形式。
D. 表示定理仅适用于支持向量机,而不能用于其他机器学习模型。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
32. 2. 以下关于表示定理的描述中,哪一项是不正确的?
A. 表示定理表明,在核方法中,优化问题的解可以表示为样本点核函数的线性组合。
B. 表示定理适用于任意单调递增的正则化函数和非负损失函数的优化问题。
C. 表示定理仅适用于支持向量机和岭回归等少数几种机器学习模型。
D. 表示定理为核方法提供了理论基础,使得高维特征空间的操作可以通过核函数在低维空间实现。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
33. 1. 下列关于BP算法的描述哪个是错误的?
A. BP算法适用于平方损失等许多常用损失函数
B. BP算法是迄今最成功、最常用的神经网络算法
C. BP算法的正式完整描述最早出现在1974年Werbos的博士学位论文中
D. BP算法只能用于回归任务
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
34. 2. BP算法的每一轮采用的是什么学习规则?
A. 广义感知机学习规则
B. 广义最小二乘学习规则
C. 广义决策树学习规则
D. 广义支持向量机学习规则
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
35. 3. BP算法的全称为误差逆传播算法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
36. 4. 对于标准BP算法,在误差目标函数中增加L2正则化等价于在每次参数更新时,当前权重按随机比例进行增加。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
37. 5. 【判断题】BP算法的全称为误差逆传播算法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
38. 6. 【判断题】对于标准BP算法,在误差目标函数中增加L2正则化等价于在每次参数更新时,当前权重按随机比例进行增加。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
39. 1. 关于标准BP和累积BP说法正确的是?
A. 两者更新权重的方法一样
B. 两者更新权重的步幅一样
C. 标准BP的效率低于累积BP
D. 标准BP每一步更新的方向不同于累积BP,但是总体方向一致
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
40. 2. 以下关于标准BP(Backpropagation)和累积BP(Cumulative Backpropagation)的描述,哪一项是正确的?
A. 标准BP和累积BP都在每一次样本输入后立即更新参数。
B. 累积BP在计算梯度时,会将多个样本的梯度进行累积,然后一次性更新参数。
C. 标准BP适合小批量训练,而累积BP只能用于单样本训练。
D. 累积BP比标准BP计算更高效,因为它完全跳过了梯度计算过程。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
41. 3. 在很多任务中,累计误差下降到一定程度后,进一步下降会非常缓慢,这时标准BP算法往往会获得较好的解,尤其是当训练集非常大的时候效果更明显。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
42. 1. 从图结构看,贝叶斯网是______。
A. 无向简单图
B. 有向无环图
C. 无向平面图
D. 带权无向图
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
43. 2. 在三变量典型依赖关系中,V型结构会产生条件独立性。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
44. 1. 级联相关网络将神经网络的结构也当做学习的目标之一。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
45. 2. 自组织映射(SOM)神经网络的主要特点是通过竞争学习过程将高维数据映射到低维网格,保持数据的拓扑结构。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
46. 3. 在RBF(径向基函数)神经网络中,隐藏层神经元的激活函数通常是高斯函数,其输出值依赖于输入与中心的距离。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
47. 4. 关于级联相关网络的说法正确的是?
A. 开始的时候只有输入层和输出层
B. 新的隐层节点逐渐加入
C. 级联相关网络只需训练一次
D. 新增加的节点的初始化需要最大化输出和网络误差之间的相关性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
48. 5. 下面哪一个神经网络是无监督的?
A. BP神经网络
B. RBF神经网络
C. SOM神经网络
D. Transformer
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
49. 6. 下面关于RBF神经网络的说法正确的是?
A. RBF神经网络的激活函数是线性的。
B. RBF神经网络中的隐藏层神经元采用的是高斯函数作为激活函数。
C. RBF神经网络适用于处理非线性回归问题,但不适合分类任务。
D. RBF神经网络的输出层采用的是Sigmoid激活函数。章节测试
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
50. 1. 为什么深度学习时代之前的神经网络的层数无法很多?
A. 计算资源不够
B. 由于梯度消失,靠近输入层的参数无法更新
C. 存储资源不够
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
51. 2. 下面哪一个技巧可以降低神经网络参数的Rademacher复杂度?
A. 预训练加微调
B. 权重共享
C. Dropout
D. 交叉熵损失函数
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
52. 3. 仅需一个包含足够多神经元的隐层,多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
53. 4. 标准BP和累积BP都在每一次样本输入后立即更新参数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
54. 5. ReLU函数取代Sigmoid函数可以缓解梯度消失的问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
55. 6. 【判断题】仅需一个包含足够多神经元的隐层,多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
56. 7. 【判断题】ReLU函数取代Sigmoid函数可以缓解梯度消失的问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
57. 1. 本节课的讲解中,同父结构指的是一个节点(x1)影响其他节点(x3, x4)。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
58. 2. 同父结构和V型结构都具有条件独立性。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
59. 3. 【判断题】同父结构和V型结构都具有条件独立性。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
60. 4. 【判断题】 本节课的讲解中,同父结构指的是一个节点(x1)影响其他节点(x3, x4)。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
61. 1. 吉布斯采样是一种确定性方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
62. 2. 【单选题】基于吉布斯采样的贝叶斯推断中,待推断样本的已知属性的观测值被称为?
A. 证据
B. 先验
C. 后验
D. 似然
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
63. 3. 【判断题】吉布斯采样是一种确定性方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
64. 1. 半监督聚类算法可以利用数据的监督信息。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
65. 2. 【判断题】半监督聚类算法可以利用数据的监督信息。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
66. 1. 在评估多分类模型性能时,“宏 (macro-) 平均”的计算方法是?
A. 对所有类别的查准率、查全率逐一平均
B. 将混淆矩阵中每个样本的贡献合并后计算查准率、查全率
C. 对测试集中的所有样本赋予相同权重进行计算
D. 针对主分类类别权重更高的加权平均
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
67. 2. 在机器学习任务中,若根据学习器的预测结果将样例按正例可能性从大到小排序,然后逐个将样本作为正例进行预测,这种方法可能用来评估以下哪项指标?
A. 准确率 (Accuracy)
B. 精确率-召回率曲线 (Precision-Recall Curve)
C. ROC曲线 (Receiver Operating Characteristic Curve)
D. 均方误差 (Mean Squared Error)
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
68. 1. 当假设空间中包含的模型复杂度增加时,通常会带来什么风险?
A. 模型的泛化误差降低
B. 模型的训练误差增加
C. 模型的泛化误差增加
D. 模型的计算速度增加
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
69. 2. 西瓜数据集中,每一个属性的所有取值分别组合形成所有可能性结果。 “色泽” : “青绿”、“乌黑” “根蒂” : “蜷缩”、“稍蜷” “敲声” : “浊响”、“沉闷” 请问则假设空间共有多少?
A. 8
B. 16
C. 27
D. 28
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
70. 1. 根据NFL定理(No Free Lunch Theorem),在平均意义上,总误差与算法弱相关。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
71. 2. NFL定理指出,当目标函数的分布是均匀时,任何两个学习算法在测试集上的期望性能是相等的。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
72. 3. 【判断题】根据NFL定理(No Free Lunch Theorem),在平均意义上,总误差与算法弱相关。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
73. 4. 【判断题】NFL定理指出,当目标函数的分布是均匀时,任何两个学习算法在测试集上的期望性能是相等的。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
74. 1. 决策树算法一般是如何对缺失属性进行处理的?
A. 仅使用无缺失的样例
B. 对缺失值进行随机填充
C. 用其他属性值预测缺失值
D. 利用“样本赋权,权重划分”的思想解决
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
75. 2. 决策树处理有缺失值的样本时,仅通过无缺失值的样例来判断划分属性的优劣。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
76. 3. 【判断题】决策树处理有缺失值的样本时,仅通过无缺失值的样例来判断划分属性的优劣。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
77. 1. 如果p和q密度相连,则存在样本集合中的一点o使得o密度直达p和q。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
78. 2. 【判断题】如果p和q密度相连,则存在样本集合中的一点o使得o密度直达p和q。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
79. 1. 以下关于AGNES算法说法错误的是?
A. 是一种层次聚类算法
B. 可以通过设置不同的距离度量获得不同的聚类结果
C. 可以获得聚类簇的树状结构
D. 采用自顶向下的分拆策略
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
80. 2. AGNES是一种自底向上的层次聚类方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
81. 3. 以下算法不属于层次聚类算法的有?
A. AGNES
B. GMM
C. LVQ
D. DBSCAN
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
82. 4. 【判断题】AGNES是一种自底向上的层次聚类方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
83. 1. 在SVM的优化目标中,软间隔(Soft Margin)引入了以下哪种参数来允许一定程度的误分类?
A. 正则化参数
B. 松弛变量
C. 学习率
D. 支持向量个数
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
84. 2. 以下关于替代函数的说法错误的是()。
A. 替代函数有良好的数学性质。
B. 替代函数在最优化时原来的目标也在最优化。
C. “0/1”损失函数是常用的替代损失函数。
D. 采用替代损失函数, 是在解决困难问题时的常见技巧。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
85. 3. 下面关于软间隔的说法错误的是()。
A. 现实很难确定理想的核函数, 使训练详本在特征空间中线性可分。
B. 软间隔允许在所有样本上不满足约束。
C. 即使训练集线性可分, 很难断定是否因过拟合造成。
D. “0/1损失函数”非凸非连续。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
86. 1. 下面哪些方法可以让模型跳出局部极小点?
A. 尝试不同的初始化参数
B. 模拟退火
C. 演化算法
D. 随机扰动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
87. 2. 全局最小只有一个。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
88. 1. 下面关于深度神经网络说法正确的是?
A. 深度神经网络2012年才出现
B. 深度神经网络就像人脑一样工作
C. 深度神经网络收到了人脑神经机制的启发
D. 深度神经网络的性能已经全面超过传统模型
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
89. 2. 下面哪个不是深度神经网络时代的产物?
A. 卷积神经网络(CNN)
B. 长短期记忆神经网络(LSTM)
C. BP梯度回传算法
D. Transformer
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
90. 3. 神经网络实质上是多层函数嵌形成的数学模型。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
91. 4. 【判断题】深度神经网络从2023年开始流行并被应用到诸多领域。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
92. 1. 经过有向分离所获得的图被称为道德图。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
93. 2. 【判断题】经过有向分离所获得的图被称为道德图。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
94. 1. 【判断题】多元决策树通过使用多个特征的线性组合作为分裂条件,可以形成更复杂的决策边界,例如斜线分割。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
95. 1. 【判断题】对于2-不敏感损失, 当自变量取值为 10 时, 损失为8。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
96. 1. 【判断题】朴素贝叶斯分类器与允许部分特征之间存在依赖关系,通常通过建立特征之间的局部依赖结构来提升分类性能。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
97. 1. 【判断题】搜索最优贝叶斯网结构是NP难问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
98. 1. 【单选题】以下关于EM算法的说法错误的是?
A. EM算法分为E步和M步。
B. EM算法可以应用在聚类和半监督学习中。
C. EM在估计参数时可以考虑应用极大似然估计法。
D. EM算法可能不收敛,因此不能放心使用。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
99. 2. 【判断题】EM算法用于估计模型参数和隐变量。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
100. 1. 【判断题】减小集成规模一定导致泛化性能下降。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
101. 1. 【判断题】k均值聚类算法在实施过程中,每次迭代都会重新计算所有数据点到所有中心点的距离,并将每个数据点分配给距离最远的中心点所在的簇。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
102. 1. 【单选题】假设有一个回归任务的训练数据集和若干在该数据集上使用不同学习算法训练的学习器,现在我们想要将这些学习器的预测结果进行结合,下列方法中不能直接用于该场景的是
A. 简单平均法
B. 加权平均法
C. 学习法(stacking)
D. Boosting算法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
103. 2. 【判断题】在结合多个学习器的时候,根据训练集选择误差最小的加权平均总能取得比简单平均法更高的测试性能。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
104. 1. 【判断题】Stacking难以通过不断增加层级提升效果的原因是不断增加层级会导致严重的过拟合。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
105. 1. 【判断题】多样性是集成学习的关键, 对它的理解是集成学习中的圣杯问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
106. 1. 【单选题】典型的高斯混合聚类如何获得最终的簇划分和各个成分的参数?
A. 集成多个聚类学习器的结果
B. 随机猜测
C. 使用EM算法
D. 训练神经网络
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
107. 2. 【单选题】下面哪个聚类算法可以看作高斯混合聚类的一个特例?
A. k均值
B. 学习向量量化
C. DBSCAN
D. 层次聚类
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
108. 3. 【判断题】高斯混合聚类是利用概率模型来表达聚类原型的算法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。