1.判断题 (1分)
在支持向量机中,支持向量都是位于决策边界上的训练记录
2.判断题 (1分)
无论何种分类算法,其结果都是严格的函数关系,特征属性确定时,必然有唯一的类别与之对应
3.判断题 (1分)
要查找当前内存中的对象,可以通过list()函数显示
4.单选题 (1分)
R语言中可直接用于数据标准化的函数有:
5.判断题 (1分)
关联规则主要表现为项集之间的因果关系
6.单选题 (1分)
人类认知世界的基本方法,所有科学的核心问题是

 

 

7.判断题 (1分)
为了代码的整洁美观,else子句一般另起一行

8.多选题 (2分)
以下选项中属于R语言逻辑运算符的是
9.判断题 (1分)
在支持度、置信度框架之下,FP-Growth等算法,可以挖出比Apriori算法更多更好的规则

10.单选题 (1分)
在ggplot2绘图系统中,通过以下哪个函数绘制概率密度图
11.多选题 (1分)
因子适用于存储何种类型的变量?
12.判断题 (1分)
如果规则X→(Y-X)不满足置信度阈值,则对于X'→(Y-X')的规则也一定不满足置信度阈值,其中X'为X的真子集
13.判断题 (1分)
自下而上的层次聚类方法,其基本过程是每一次合并最接近的两个簇,直至仅剩下一个簇
14.判断题 (1分)
就数据空间而言,一条记录表现为数据空间的一个维度,一个特征表现为数据空间的一个点
15.判断题 (1分)
经过多年的发展,RStudio已经成为一个独立完善的R运行环境,无需基础的R Console的支持
16.判断题 (1分)
若没有任何特征、属性信息可用,可以采用因变量自身的均值、众数来进行预测
17.单选题 (1分)
语句x <- 1:3; x[-1]的结果是:
18.多选题 (1分)
哪些形容词可以用来修饰机器学习到的规律/知识/模式/模型
19.多选题 (2分)
欲访问数据框df的第一列col1,可以通过以下哪几种方式
20.判断题 (1分)
seq(from = 1, to = 20, by = 2)与seq(from = 20, to = 1, by = 2)二者元素相同,次序相反
21.多选题 (2分)
簇之前的距离基于点之间的距离进行计算,具体可以包括:

 

 

22.判断题 (1分)
有监督学习一般分成两个阶段,在训练集上进行模型的学习,在测试集上测试模型的性能
23.单选题 (1分)
语句cut(1:4, 1:3)的结果是

 

24.判断题 (1分)
模型评估主要是针对有监督学习而言,作为无监督学习的代表,聚类分析的结果无需进行模型评估
25.单选题 (2分)
语句order(matrix(1:9, 3)[, 2])的结果是
26.判断题 (1分)
泛型函数可以根据对象所属类型的不同,执行不同的操作
27.多选题 (2分)
R里边的循环结构有哪些实现方式
28.判断题 (1分)
逻辑斯蒂回归可以视为广义线性模型,其连接函数为logit函数

29.单选题 (1分)
对于一个100×8的数据框,若将其中的4列数据由宽变长,变换之后的数据框的行列数分别为
30.判断题 (1分)
较之于倾斜的数据空间,在均匀的数据空间上聚类分析的结果更有意义
31.多选题 (2分)
R语言中主要控制结构有
32.判断题 (1分)
对于加权近邻法,可以选取不同的核,距离越远,核函数取值越大
33.判断题 (1分)
在集成学习中,单个分类器一般称之为弱分类器,组合分类器称之为强分类器
34.单选题 (1分)
层峦叠嶂图属于何种分组图形
35.判断题 (1分)
分类和聚类都属于归归类,都属于有监督学习
36.判断题 (1分)
箱线图通过中位数来刻画数据分散的程度
37.判断题 (1分)
通过极大似然方法估计逻辑斯蒂回归的模型参数时,核心思想是所取得的参数最利于观测样本的出现,即:所观测样本概率最大化
38.多选题 (2分)
计算轮廓系数时,至少需要给定的两个参数是:
39.判断题 (1分)
语句solve(A, b)可用于线性方程组AX=b的求解
40.判断题 (1分)
无监督学习本身没有类标签,因此无法判断模型是否正确,也无需开展模型评估

41.判断题 (1分)
为确保模型的有效性,需要采用数学的方法对算法习得的模型进行证明
42.判断题 (1分)
机器学习的结果主要表现为变量之间的关系和数据空间的结构
43.单选题 (1分)
以下可用以随机森林建模的函数是
44.判断题 (1分)
设I={I1, I2, I3, I4, I5},若频繁3-项集为{I1, I2, I3}, {I1, I2, I4},则可以将{I1, I2, I3, I4}作为频繁的4-项集候选
45.判断题 (1分)
R语言不支持递归操作
46.判断题 (1分)
协方差与方差一样,都可用来表达数据分散的程度
47.判断题 (1分)
在BP神经网络建模中,一般分为前向传播输出和反向传播误差
48.判断题 (1分)
class(x)得到的是数据所属的类,与数据的存储类型完全一致
49.判断题 (1分)
若函数体中不包含return()语句,则不返回任何值
50.多选题 (1分)
等号可以表示那些含义?

 

 

51.单选题 (1分)
语句mean(as.numeric(factor(c(20,30,30,30,20))))的执行结果是

 

52.判断题 (1分)
在计算Hopkins统计量时,随机抽取的点的个数,一般接近于记录数

53.判断题 (1分)
数据密集型科学发现是一种新的范式,无需掌握机理模型,也无需了解业务背景
54.单选题 (1分)
若数值向量1:100是列表my_list的第一个组成部分,那么mean(my_list[1])的结果是
55.判断题 (1分)
ifelse()函数可以得到向量化的条件判断结果
56.判断题 (1分)
通过nnet训练神经网络的过程中,可借助caret框架,通过格子店搜索的方法来枚举并设定超参数size和decay
57.判断题 (1分)
在ggplot绘图系统中,几何映射geom与统计变换stat是成对出现

58.多选题 (2分)
R中的数据对象主要包括

 

 

59.判断题 (1分)
两个变量之间具有共变现象,称为具有相关关系,即:当一个变量变化时,另一个变量也随之变化

60.单选题 (1分)
就逻辑推理方式而言,将模型应用于预测的过程属于
61.单选题 (1分)
分类回归树CART可通过 以下哪个函数实现

 

 

62.单选题 (1分)
分组之后进行summarise(freq = n()),此处的freq表示
63.多选题 (2分)
在箱线图中,符合以下哪些条件的数据被视为异常数据

 

 

64.判断题 (1分)
在支持向量机中,分类超平面的一般形式是W^T*X + b = 0
65.判断题 (1分)
tidyr::spread()的功能是将长的数据变为宽的数据
66.判断题 (1分)
直方图是柱状图的别名,二者都是将数值大小映射为柱子长短
67.多选题 (2分)
从认知的角度看,以下说法正确的是
68.判断题 (1分)
str()函数常用于创建字符向量
69.单选题 (2分)
以下选项中,不包含在CRISP-DM数据处理流程中的是:

声明:本站所有文章,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。