欢迎光临,有需要请联系站长!
想要快速找到正确答案?
立即关注 超新尔雅学习通微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
超星学习通机器学习进步作业答案
机器学习进步
学校: 无
平台: 超星学习通
题目如下:
1. 1. 当假设空间中包含的模型复杂度增加时,通常会带来什么风险?
A. 模型的泛化误差降低
B. 模型的训练误差增加
C. 模型的泛化误差增加
D. 模型的计算速度增加
答案: 模型的泛化误差增加
2. 2. 某公司希望通过机器学习模型预测产品的未来销量,在选择特征时,下列哪种特征最可能对模型预测产生重要影响?
A. 产品的生产成本
B. 产品的历史销量
C. 公司内部员工数量
D. 产品包装的颜色
答案: 产品的历史销量
3. 3. 假设空间H通常是指所有可能的特征集合。
答案: 错误
4. 1. NFL定理指出,当目标函数的分布是均匀时,任何两个学习算法在测试集上的期望性能是相等的。
答案: 正确
5. 2. 根据NFL定理(No Free Lunch Theorem),在平均意义上,总误差与算法弱相关。
答案: 错误
6. 1. 在机器学习任务中,若根据学习器的预测结果将样例按正例可能性从大到小排序,然后逐个将样本作为正例进行预测,这种方法可能用来评估以下哪项指标?
A. 准确率 (Accuracy)
B. 精确率-召回率曲线 (Precision-Recall Curve)
C. ROC曲线 (Receiver Operating Characteristic Curve)
D. 均方误差 (Mean Squared Error)
答案: 精确率-召回率曲线 (Precision-Recall Curve)
7. 2. 在评估多分类模型性能时,“宏 (macro-) 平均”的计算方法是?
A. 对所有类别的查准率、查全率逐一平均
B. 将混淆矩阵中每个样本的贡献合并后计算查准率、查全率
C. 对测试集中的所有样本赋予相同权重进行计算
D. 针对主分类类别权重更高的加权平均
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
8. 3. 微 (micro-)平均通过将混淆矩阵中所有类别的样本数合并计算,计算整体的()?
A. 查准率
B. 查全率
C. F1
D. 方差
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
9. 1. 在评估分类模型时,AUC-ROC 曲线的面积可以反映模型的性能。以下关于 AUC-ROC 的描述中,哪一项是正确的?
A. AUC 的值越高,模型对正负样本的分类能力越差
B. AUC 的值为 0.5 时,表示模型的性能与随机猜测相当
C. AUC 曲线只能用于评估二分类问题,无法用于多分类问题
D. AUC 的值为 1 时,表示模型在训练集上的过拟合
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
10. 2. 在构建 ROC 曲线时,模型的分类结果需要按某种方式计算真阳性率(TPR)和假阳性率 (FPR)。以下哪项是正确的构建步骤?
A. 根据不同阈值计算 TPR 和 FPR,并将结果绘制成曲线
B. 直接使用分类模型的精确率和召回率绘制 ROC 曲线
C. ROC 曲线只与分类模型的最终预测类别相关,与概率预测无关
D. ROC 曲线中的面积等于模型的准确率
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
11. 3. AUC可以写成一个优化目标。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
12. 1. 在机器学习任务中,以下哪种情况最适合考虑“非均等代价”?
A. 数据集中的正负样本数量相等,且错误的代价相同
B. 错误预测某类别会导致比另一个类别更高的损失
C. 模型需要优化整体准确率,而不是特定类别的表现
D. 训练数据中不包含任何错误标注
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
13. 2. 在二分类问题中,如果分类器将“高风险事件”误分类为“低风险事件”,可能造成严重损失。由此,哪种策略不合理?
A. 忽略代价差异,专注于提高总体准确率
B. 为高风险事件设定更高的预测权重或代价
C. 优先选择不平衡数据采样策略而不考虑代价
D. 完全避免使用代价敏感算法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
14. 3. 在疾病预测任务中,将“患者”预测为“健康人”的代价通常低于 “健康人”预测为“患者”的代价。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
15. 1. 在模型选择中,以下哪种情况可能导致高偏差?
A. 模型过于复杂
B. 模型欠拟合
C. 数据中的噪声过多
D. 使用过多的训练数据
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
16. 2. 如果一个模型具有很高的方差,那么可能出现以下哪种情况?
A. 在训练集上表现优秀,但在测试集上表现较差
B. 在训练集和测试集上表现均较差
C. 模型对数据中的噪声不敏感
D. 模型的复杂度较低
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
17. 3. 在偏差-方差分解中,模型的预测误差可分解为?
A. 历史误差
B. 偏差平方
C. 方差
D. 不可避免的噪声项
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
18. 1. 下列关于梯度下降法描述错误的是?
A. 可以用于求解对数几率回归
B. 是一种迭代求解的方法
C. 可以比较好的并行化
D. 可以高效地求解所有凸优化问题
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
19. 2. 对数几率回归为什么不能通过令偏导为0求解?
A. 均方损失函数太复杂
B. 均方损失非凸
C. 均方损失没有偏导为0的点
D. 均方损失没有极值点
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
20. 3. 极大似然法最大化似然函数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
21. 1. 在使用线性判别分析进行分类时,样本的类别标签对于算法的学习和分类过程是否是必需的?
A. 是,类别标签是必需的
B. 否,类别标签不是必需的
C. 只有在多类别问题中类别标签是必需的
D. 只有在二分类问题中类别标签是必需的
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
22. 2. 在线性判别分析中,类内散度矩阵的计算方法是将每个类别的样本与其最近样本进行求差,然后对差值向量进行矩阵乘积。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
23. 3. 线性判别分析的目标是通过最大化类内距离和最小化类间距离来实现分类。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
24. 1. 以下哪项属于多分类LDA的实现方法()。
A. 采用全局散度矩阵
B. 采用全局散度矩阵和类内散度矩阵
C. 采用全局散度矩阵和类间散度矩阵
D. 采用类内散度矩阵和类间散度矩阵
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
25. 1. 在构建纠错输出码时,码之间的欧几里得距离越大,系统对分类错误的容忍度越高。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
26. 2. 在ECOC方法中,N个类别被划分为M次二分类任务,其中每次将一部分类别规划为正类,另一部分规划为反类。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
27. 3. 一般来说,纠错输出码的编码越长,()?
A. 纠错能力越强
B. 纠错能力越弱
C. 计算、存储开销增大
D. 计算、存储开销减小
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
28. 1. 类别不平衡问题中,什么情况需要做特殊处理?
A. 大类比小类重要
B. 小类和大类一样重要
C. 小类比大类重要
D. 任何情况
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
29. 2. 以下哪种方法是常见的类别不平衡学习方法?
A. 过采样
B. 欠采样
C. 最小二乘法
D. 阈值移动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
30. 3. 基于纠错输出码,即使某个分类器在预测时出错,也能产生正确的最终分类结果。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
31. 1. 在人工智能的发展历程中,出现了三种主要的学派:符号主义、连接主义和行为主义。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
32. 1. 决策树算法一般如何对连续值进行处理?
A. 不使用这个特征
B. 划分无限个区间
C. 对连续值进行离散化处理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
33. 2. 在处理连续值的时候,n个属性值可以划分为n个候选划分,然后当做离散属性处理。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
34. 1. 决策树算法一般是如何对缺失属性进行处理的?
A. 仅使用无缺失的样例
B. 对缺失值进行随机填充
C. 用其他属性值预测缺失值
D. 利用“样本赋权,权重划分”的思想解决
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
35. 2. 决策树处理有缺失值的样本时,仅通过无缺失值的样例来判断划分属性的优劣。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
36. 1. 决策树和深度方法相比一个明显的优势是什么?
A. 可解释性
B. 运行速度
C. 结果准确率
D. 内存占用
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
37. 2. 下面关于树和规则的说法中正确的是?
A. 所有的树都对应一个规格集合
B. 不同的树可能对应相同的规则
C. 每一棵树都可以对应不止一个规则集合
D. 一组规则可以通过多种方式组织成不同的树结构
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
38. 3. 将树的路径归纳成规则有什么好处?
A. 改善可理解性
B. 减少运行时间
C. 进一步提升泛化能力
D. 提高准确率
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
39. 1. 关于决策树说法错误的是?
A. 所有决策树的边界都是轴平行的
B. 决策树的边界可以是斜的
C. 决策树无法处理非线性的分类问题
D. 决策树模型总是比其他机器学习模型更准确,因为它能完美地拟合所有数据
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
40. 2. 多元决策树通过使用多个特征的线性组合作为分裂条件,可以形成更复杂的决策边界,例如斜线分割。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
41. 1. 在SVM的优化目标中,软间隔(Soft Margin)引入了以下哪种参数来允许一定程度的误分类?
A. 正则化参数
B. 松弛变量
C. 学习率
D. 支持向量个数
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
42. 2. 以下关于替代函数的说法错误的是()。
A. 替代函数有良好的数学性质。
B. 替代函数在最优化时原来的目标也在最优化。
C. “0/1”损失函数是常用的替代损失函数。
D. 采用替代损失函数, 是在解决困难问题时的常见技巧。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
43. 3. 下面关于软间隔的说法错误的是()。
A. 现实很难确定理想的核函数, 使训练详本在特征空间中线性可分。
B. 软间隔允许在所有样本上不满足约束。
C. 即使训练集线性可分, 很难断定是否因过拟合造成。
D. “0/1损失函数”非凸非连续。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
44. 1. 在统计学习中,归纳偏好项通过()相关的项确定。
A. 结构风险
B. 经验风险
C. 结构风险与经验风险
D. 以上答案都不对
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
45. 2. 正则化通过对不希望的结果施以惩罚,使得优化过程趋向于希望目标。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
46. 3. 结构风险的信息有助于降低最小化训练误差的过拟合风险。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
47. 4. 常用的正则化项范数中,倾向于分量取值尽量均衡(即非零分量个数尽量稠密)的范数是L2范数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
48. 5. 在统计学习中通常说的正则化在贝叶斯类方法中对应于“后验”。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
49. 1. 对于 ϵ-不敏感损失函数, 说法正确的是
A. 当自变量的绝对值小于 ϵ 时, 没有惩罚
B. 当自变量的绝对值小于 ϵ 时, 惩罚是线性的
C. 当自变量的绝对值大于 ϵ 时, 没有惩罚
D. 当自变量的绝对值大于 ϵ 时,惩罚是二次的
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
50. 2. 下面关于支持向量回归, 说法错误的是
A. 间隔带两侧的松弛程度可有所不同
B. 支持向量回归一般要求损失为 0 当且仅当模型的输出和实际值一样
C. 支持向量回归也存在对偶问题
D. 支持向量回归模型的解仍然具有稀疏性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
51. 3. 对于2-不敏感损失, 当自变量取值为 10 时, 损失为8。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
52. 1. 关于表示定理的以下说法中,哪一项是正确的?
A. 表示定理仅适用于线性可分的数据集,不能扩展到非线性问题。
B. 表示定理表明,最优解总可以表示为输入样本通过核函数映射后的线性组合。
C. 表示定理指出,只有平方损失函数才能满足最优解的核表示形式。
D. 表示定理仅适用于支持向量机,而不能用于其他机器学习模型。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
53. 2. 以下关于表示定理的描述中,哪一项是不正确的?
A. 表示定理表明,在核方法中,优化问题的解可以表示为样本点核函数的线性组合。
B. 表示定理适用于任意单调递增的正则化函数和非负损失函数的优化问题。
C. 表示定理仅适用于支持向量机和岭回归等少数几种机器学习模型。
D. 表示定理为核方法提供了理论基础,使得高维特征空间的操作可以通过核函数在低维空间实现。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
54. 1. 以下关于核函数的说法,错误的是?
A. 核函数的定义必须满足输入空间的数据是线性可分的。
B. 核函数通过将低维空间中的数据点映射到高维空间,帮助解决非线性问题。
C. 核函数的作用是直接计算高维空间中的特征向量。
D. 只有径向基函数(RBF)可以作为核函数使用。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
55. 2. 以下关于核函数的性质,错误的是?
A. 核函数必须是线性函数,才能确保正定性。
B. 所有核函数都能映射数据到无限维空间。
C. 核函数需要满足对称性和正定性,才能被有效应用于支持向量机。
D. 核函数的具体形式与数据分布无关,选择时无需考虑实际问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
56. 3. 核函数是支持向量机等模型中的重要工具,它的作用是计算输入样本在高维特征空间中的内积,从而避免显式地进行高维空间映射。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
57. 4. 以下关于核函数的描述中,哪一项是正确的?
A. 若核函数满足 Mercer 定理,则它对应的映射必须将数据投射到有限维空间。
B. 核函数的参数 越大,核的映射能力越强,但计算复杂度也随之增加。
C. 使用核函数时,核矩阵的特征值可以为负,因为特征值的正定性不是必要条件。
D. 核函数的选择与训练样本数量无关,仅取决于输入特征的分布维度。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
58. 1. 下列关于BP算法的描述哪个是错误的?
A. BP算法适用于平方损失等许多常用损失函数
B. BP算法是迄今最成功、最常用的神经网络算法
C. BP算法的正式完整描述最早出现在1974年Werbos的博士学位论文中
D. BP算法只能用于回归任务
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
59. 2. BP算法的每一轮采用的是什么学习规则?
A. 广义感知机学习规则
B. 广义最小二乘学习规则
C. 广义决策树学习规则
D. 广义支持向量机学习规则
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
60. 3. 对于标准BP算法,在误差目标函数中增加L2正则化等价于在每次参数更新时,当前权重按随机比例进行增加。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
61. 1. 下面哪些方法可以让模型跳出局部极小点?
A. 尝试不同的初始化参数
B. 模拟退火
C. 演化算法
D. 随机扰动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
62. 2. 全局最小只有一个。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
63. 3. 全局最小一定小于局部极小。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
64. 1. 下面关于RBF神经网络的说法正确的是?
A. RBF神经网络的激活函数是线性的。
B. RBF神经网络中的隐藏层神经元采用的是高斯函数作为激活函数。
C. RBF神经网络适用于处理非线性回归问题,但不适合分类任务。
D. RBF神经网络的输出层采用的是Sigmoid激活函数。章节测试
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
65. 2. 在RBF(径向基函数)神经网络中,隐藏层神经元的激活函数通常是高斯函数,其输出值依赖于输入与中心的距离。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
66. 3. 自组织映射(SOM)神经网络的主要特点是通过竞争学习过程将高维数据映射到低维网格,保持数据的拓扑结构。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
67. 4. 级联相关网络将神经网络的结构也当做学习的目标之一。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
68. 5. 关于级联相关网络的说法正确的是?
A. 开始的时候只有输入层和输出层
B. 新的隐层节点逐渐加入
C. 级联相关网络只需训练一次
D. 新增加的节点的初始化需要最大化输出和网络误差之间的相关性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
69. 1. 下面哪个不是深度神经网络时代的产物?
A. 卷积神经网络(CNN)
B. 长短期记忆神经网络(LSTM)
C. BP梯度回传算法
D. Transformer
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
70. 2. 下面关于深度神经网络说法正确的是?
A. 深度神经网络2012年才出现
B. 深度神经网络就像人脑一样工作
C. 深度神经网络收到了人脑神经机制的启发
D. 深度神经网络的性能已经全面超过传统模型
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
71. 3. 神经网络实质上是多层函数嵌形成的数学模型。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
72. 1. 下面哪一个技巧可以降低神经网络参数的Rademacher复杂度?
A. 预训练加微调
B. 权重共享
C. Dropout
D. 交叉熵损失函数
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
73. 2. 为什么深度学习时代之前的神经网络的层数无法很多?
A. 计算资源不够
B. 由于梯度消失,靠近输入层的参数无法更新
C. 存储资源不够
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
74. 3. 标准BP和累积BP都在每一次样本输入后立即更新参数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
75. 4. 仅需一个包含足够多神经元的隐层,多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
76. 1. 统计学习属于什么主义?
A. 频率主义
B. 贝叶斯主义
C. 人文主义
D. 解构主义
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
77. 2. 贝叶斯主义认为,分布的参数是什么?
A. 点
B. 分布
C. 点同时也是分布
D. 以上都不对
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
78. 3. 贝叶斯学习就是贝叶斯分类器。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
79. 1. TAN(Tree Augmented Naive Bayes)是一种半朴素贝叶斯分类器。在TAN模型中,关于特征依赖性描述最准确的是?
A. 特征之间是完全独立的,只有类别标签与特征相关
B. 每个特征与其他所有特征之间都有相互依赖关系
C. 特征之间有完全的线性依赖关系
D. 所有特征都与类别标签之间没有任何关系
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
80. 2. 在半朴素贝叶斯分类器中,以下哪项与传统的朴素贝叶斯分类器最主要的区别?
A. 半朴素贝叶斯假设特征之间完全独立
B. 半朴素贝叶斯分类器允许特征之间存在依赖关系
C. 半朴素贝叶斯分类器使用更复杂的训练数据集
D. 半朴素贝叶斯分类器不依赖贝叶斯定理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
81. 3. 朴素贝叶斯分类器与允许部分特征之间存在依赖关系,通常通过建立特征之间的局部依赖结构来提升分类性能。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
82. 1. 从图结构看,贝叶斯网是______。
A. 无向简单图
B. 有向无环图
C. 无向平面图
D. 带权无向图
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
83. 2. 在三变量典型依赖关系中,V型结构会产生条件独立性。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
84. 1. 同父结构和V型结构都具有条件独立性。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
85. 2. 本节课的讲解中,同父结构指的是一个节点(x1)影响其他节点(x3, x4)。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
86. 1. 下列关于有向分离说法错误的是?
A. 需要将V型结构的父节点相连
B. 可能会在图中引入环结构
C. 需要将有向边变成无向边
D. 需要将无向边变成有向边
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
87. 2. 经过有向分离所获得的图被称为道德图。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
88. 1. 基于结构项减似然项的评分函数主要来源于什么理论?
A. 信息论
B. 控制论
C. 博弈论
D. 排队论
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
89. 2. 在对贝叶斯网结构进行评价时,下面哪一个选项越大越好?
A. 参数量减似然
B. 参数量
C. 似然
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
90. 3. 搜索最优贝叶斯网结构是NP难问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
91. 1. 基于吉布斯采样的贝叶斯推断中,待推断样本的已知属性的观测值被称为?
A. 证据
B. 先验
C. 后验
D. 似然
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
92. 2. 以下关于推断的说法错误的是?
A. 推理(reasoning)倾向于通过逻辑分析获得结果,推断(inference)倾向于预测和推测。
B. 变分推断属于精确推断方法。
C. 当精确推断时间开销太大时可以考虑使用近似推断方法。
D. 吉布斯采样属于近似推断方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
93. 3. 吉布斯采样是一种确定性方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
94. 1. 由于不知道隐变量Z,EM算法的出发点是在估计时考虑Z的所有可能性。这种做法也被称为最大化什么?
A. 对数似然
B. 条件熵
C. 边际似然
D. 交叉熵
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
95. 2. 以下关于EM算法的说法错误的是?
A. EM算法分为E步和M步。
B. EM算法可以应用在聚类和半监督学习中。
C. EM在估计参数时可以考虑应用极大似然估计法。
D. EM算法可能不收敛,因此不能放心使用。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
96. 3. EM算法用于估计模型参数和隐变量。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
97. 1. 假设有一个回归任务的训练数据集和若干在该数据集上使用不同学习算法训练的学习器,现在我们想要将这些学习器的预测结果进行结合,下列方法中不能直接用于该场景的是
A. 简单平均法
B. 加权平均法
C. 学习法(stacking)
D. Boosting算法
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
98. 2. 在结合多个学习器的时候,根据训练集选择误差最小的加权平均总能取得比简单平均法更高的测试性能。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
99. 1. 为了缓解Stacking的过拟合,下列属于可以采用的策略是?
A. 使用交叉验证法
B. 尽可能使用同质初级学习器
C. 增加Stacking层级来降低训练误差
D. 使用更复杂的次级学习器
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
100. 2. Stacking难以通过不断增加层级提升效果的原因是不断增加层级会导致严重的过拟合。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
101. 3. 在训练Stacking方法时为了提升性能,可以采用的方法包括
A. 构建多种多样的初级学习器
B. 采用不同的初级学习算法和次级学习算法
C. 采用相同的初级学习算法和次级学习算法
D. 对数据进行恰当的预处理
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
102. 1. 减小集成规模一定导致泛化性能下降。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
103. 2. 进行选择性集成时应该考虑什么因素?
A. 个体性能
B. 个体多样性
C. 个体互补性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
104. 3. 针对并行集成学习的选择性集成的好处包括
A. 减少存储开销
B. 提升泛化性能
C. 减少预测开销
D. 减少训练开销
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
105. 1. 下列关于多样性的描述中正确的是?
A. 多样性度量中可以考虑模型的结构差异
B. 多样性的定义是集成学习中的圣杯问题
C. 可以基于两分类器的预测结果列联表定义许多不同的多样性度量
D. 已经有公认的多样性定义
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
106. 2. 多样性是集成学习的关键, 对它的理解是集成学习中的圣杯问题。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
107. 1. 深度学习中的一种集成方法是采用多次初始化来训练深度神经网络,这属于哪一种多样性增强技术?
A. 数据样本扰动
B. 输入属性扰动
C. 输出表示扰动
D. 算法参数扰动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
108. 2. 随机森林在构建单个决策树时采用部分属性而非全部属性来训练,这属于哪一种多样性增强策略?
A. 数据样本扰动
B. 输入属性扰动
C. 输出表示扰动
D. 算法参数扰动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
109. 3. 随机森林在构建单个决策树时采用部分数据而非全部来训练,这属于哪一种多样性增强策略?
A. 数据样本扰动
B. 输入属性扰动
C. 输出表示扰动
D. 算法参数扰动
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
110. 1. k均值聚类算法在实施过程中,每次迭代都会重新计算所有数据点到所有中心点的距离,并将每个数据点分配给距离最远的中心点所在的簇。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
111. 2. 使用k均值算法的变体k-medoids算法主要是为了?
A. 强制使原型向量为训练样本
B. 处理离散属性
C. 允许每个样本属于多个原型
D. 增强对更多类型簇结构的适应性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
112. 1. LVQ字面意思为“学习向量量化”,其中“向量量化”的内涵是?
A. 利用了样本标记信息
B. 可实现数据的有损压缩
C. 是一种无监督聚类算法
D. 存在学习的过程
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
113. 2. 下列关于LVQ算法说法正确的是?
A. 需要预先为每种类别指定划分的簇数量
B. 每次选取样本后,更新距离选取的样本最近的原型向量
C. 是一种无监督聚类算法
D. 给定样本和待更新的原型向量时,更新原型向量的主要思想是,若原型向量与样本标记一致,则向样本靠拢,否则远离样本
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
114. 3. 半监督聚类算法可以利用数据的监督信息。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
115. 1. 以下说法错误的是?
A. 密度直达满足对称性
B. 密度可达满足对称性
C. 密度相连满足对称性
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
116. 2. 如果p和q密度相连,则存在样本集合中的一点o使得o密度直达p和q。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
117. 1. 以下关于AGNES算法说法错误的是?
A. 是一种层次聚类算法
B. 可以通过设置不同的距离度量获得不同的聚类结果
C. 可以获得聚类簇的树状结构
D. 采用自顶向下的分拆策略
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。
118. 2. AGNES是一种自底向上的层次聚类方法。
答案:请关注【九八五题库】微信公众号,发送题目获取正确答案。