1、( 2分 )不同物种的同源序列间相似性越大说明这段序列
A、 越容易引发突变
B、 越活跃
C、 越保守
D、 越有物种特异性
E、 越不容易进行比对
F、 越难以研究
2、( 2分 )以下变异和疾病数据库中创建时间最晚的是
A、 1000 Genome
B、 LSDB
C、 HGMD
D、 OMIM
E、 dbGAP
F、 HapMap
3、( 2分 )'vitamin transporter activity' 属于GO分类的哪一类?
A、 Molecular Function
B、 Molecular Regulation
C、 Biological Function
D、 Biological Component
E、 Cellular Function
F、 Cellular Component
4、( 2分 )蛋白质结构域方面的信息可以从下列哪个中查到?
A、 KOBAS
B、 MEGA
C、 DAMBE
D、 InterPro
E、 KEGG
F、 GeneMANIA
5、( 2分 )下面哪个不是UCSC提供的工具?
A、 Genome Browser
B、 BioProject
C、 Blat
D、 In-Silico PCR
E、 Table Browser
F、 Variant Annotation Integrator
6、( 2分 )GO的拓扑结构是下列中的?
A、 有向无环图
B、 无向树
C、 无向有环图
D、 有向树
E、 网状网
F、 星形
7、( 2分 )20世纪90年代至21世纪初对生物信息学和整个生命科学领域产生深远影响的科研项目是下列中的
A、 阿波罗计划
B、 人类基因组计划
C、 曼哈顿计划
D、 人类补完计划
E、 国际千人基因组计划
F、 推进创新神经技术脑研究计划
8、( 2分 )下列哪个生物信息学方法可以用来评判变异的危害程度?
A、 BWA
B、 KOBAS
C、 SIFT
D、 Blast
E、 Cuffdiff
F、 TopHat
9、( 2分 )
利用关联距离判断,下图蓝点与哪种颜色的点距离更近:

9.png

A、 红点
B、 灰点
C、 无法判断
D、 一样近
10、( 2分 )BLAT和BLAST相比有什么优势?
A、 支持比对同源性更低的同源序列
B、 能支持含有很多序列的数据库
C、 能同时对多个物种基因组进行搜索
D、 运行速度快,且支持较大gap
E、 可以进行多序列比对
F、 比对准确度更高
11、( 2分 )你想查询一个已知的蛋白质是的三维结构否已经被解析出来了,应该去访问的数据库是
A、 KOBAS
B、 OMIM
C、 PDB
D、 RefSeq
E、 SRA
F、 GenBank
12、( 2分 )下列关于Smith-Waterman算法和Needleman-Wunsch算法的说法中法哪个是错误的
A、 单独使用Smith-Waterman算法和Needleman-Wunsch算法均不适合用于高通量测序数据分析
B、 Needleman-Wunsch算法更适用于长度相似的同源序列
C、 单独使用Needleman-Wunsch不适合用于高通量测序数据分析,Smith-Waterman则适合
D、 同时使用Smith-Waterman算法和Needleman-Wunsch算法不适合用于高通量测序数据分析
E、 Smith-Waterman算法可以用于小段序列向大段序列的比对
F、 Smith-Waterman算法更适用于寻找两个蛋白序列之间相似的功能域
13、( 2分 )是下面哪个因素决定了k阶马尔科夫链下一时刻的状态:
A、 由且仅由前k个时刻的状态决定
B、 由且仅由第k个时刻的状态决定
C、 由且仅由前1个时刻的状态决定
D、 由且仅由第1个时刻的状态决定
E、 由且仅由前k+1个时刻的状态决定
F、 由且仅由前k-1个时刻的状态决定
14、( 2分 )利用Bonferroni Correction使得对于比较10000个基因的实验,第一类错误的概率低于0.05,则每个具有统计显著性的基因的p-value应小于
A、 5.0e-6
B、 0.05
C、 0.1
D、 5.0e-10
E、 500
F、 5.0e-4
15、( 2分 )根据KEGG数据库,threonine dehydratase 在 Glycine, serine and threonine metabolism 代谢通路中发挥什么作用?
http://www.genome.jp/kegg/
A、 催化Phosphoserine转变为Glycine
B、 催化Serine和Glycine相互转变
C、 催化Threonine和Glycine相互转变
D、 催化Threonine和Pyruvate相互转变
E、 催化Serine和Phosphoserine相互转变
F、 催化Serine和Pyruvate相互转变
16、( 2分 )以下测序质量中,代表测序错误率最低的是(单字以phred33形式记录)
A、 :
B、 G
C、 @
D、 B
E、 A
F、 i
17、( 2分 )BAM格式中包括的信息有
A、 读段(read)比对程序的名字
B、 读段的结构信息
C、 读段比对的染色体名字
D、 实验者的名字
E、 实验室的名字
F、 测序试剂的名字
18、( 2分 )对同一序列进行tblastx时,其运算量理论上是blastn的几倍
A、 1/4
B、 1/36
C、 4
D、 36
E、 12
F、 8
19、( 2分 )对以下几个物种基因组中含有的蛋白编码基因数目排序正确的是
A、 人>葡萄>鸡>大肠杆菌
B、 葡萄>人>鸡>大肠杆菌
C、 鸡>人>葡萄>大肠杆菌
D、 葡萄>鸡>人>大肠杆菌
E、 人>鸡>大肠杆菌>葡萄
F、 鸡>葡萄>人>大肠杆菌
20、( 2分 )如下哪些技术可以用来提供蛋白组数据:
A、 RNA-seq
B、 cDNA microarray
C、 Mass spectrometry
D、 SNP chip
E、 ChIP-seq
F、 Hi-C
21、( 2分 )如下哪个计算方法不能对一个之前未知的从头起源基因提供有用的信息?
A、 蛋白物理性质(如空间结构)预测
B、 从RNA-Seq数据得到的mRNA表达特点
C、 蛋白二级结构预测
D、 基于已知功能基因的同源注释
E、 蛋白质化学性质(如等电点)预测
F、 蛋白质生物学性质(如分子结合性)预测
22、( 2分 )
如下图,转录本1的表达量为20,转录本2的表达量为30,则基因外显子1和2的表达量分别为

22.png

A、 50, 30
B、 30, 50
C、 40, 30
D、 20, 30
E、 10, 40
F、 60, 20
23、( 2分 )
已知RNA-Seq测序数据回帖后在某个基因区间的情况如下图所示

23.png

则该基因至少有几种转录本?

A、 3
B、 5
C、 4
D、 2
E、 1
F、 6
24、( 2分 )在上一题中,该基因最多有多少个转录本?(假设所有转录本均已被测到)
A、 3
B、 4
C、 5
D、 6
E、 2
F、 1
25、( 2分 )已知一次试验中出错的概率是0.2,而且每次试验都相互独立。则在4次试验中至少有2次出错的概率是多少?
A、 0.1536
B、 0.1808
C、 0.02576
D、 0.1736
E、 0.2696
F、 0.4096
26、( 2分 )
给定图中的物种系统发生关系和基因在各物种中是否存在,依据最简约原则如下哪一个推断是正确的?

26.png

A、 IJKL在物种2,3,4,5中独立地起源了4次
B、 MNOP是一个在物种5和物种1,2,3,4的祖先分岐后起源的新基因
C、 EFGH是一个在所有物种中都有的新基因
D、 ABCD是一个在物种1和2分岐后起源的新基因
E、 ABCD是一个在物种2,3,4,5中分别丢失的基因
F、 EFGH是一个在所有物种中独立起源的新基因
27、( 2分 )
假如某次实验分析得到下面这组基因list(Entrez Gene ID格式)
5728
6934
8452
57680
2904
287
1106
51322
23112
10765
9320
1826
23126
6326
23394
9378
57492
22941
10716
85358
10787
55870
1859
8831
83473
55209
51111

请问KOBAS富集性分析(默认参数)得到的最显著富集的KEGG pathway是?

KOBAS: http://kobas.cbi.pku.edu.cn/

A、 Glutamatergic synapse
B、 The citric acid (TCA) cycle and respiratory electron transport
C、 Oxidative phosphorylation
D、 Endometrial cancer
E、 Lysine degradation
F、 mTOR signaling pathway
28、( 2分 )对于上题中的基因list,KOBAS分析(默认参数)得到最显著富集的pathway是?
A、 proton-transporting ATP synthase complex
B、 organelle envelope
C、 cellular respiration
D、 oxidative phosphorylation
E、 Interaction between L1 and Ankyrins
F、 vitamin transporter activity
29、( 2分 )上题中的最显著pathway来自哪个数据源?
A、 KEGG pathway
B、 Reactome
C、 BioCarta
D、 PANTHER
E、 BioCyc
F、 PID
30、( 3分 )下面哪种方法可以用于高通量测序序列回帖算法中构建索引?
A、 哈希Hash
B、 后缀数组Suffix Array
C、 动态规划Dynamic Programing
D、 分治算法Divide and Conquer
31、( 3分 )以下哪些信息可以从NCBI网站获得?
A、 生命科学和医学相关文献
B、 人类基因的CDS序列
C、 人类基因组变异
D、 小鼠蛋白序列
32、( 3分 )BLAST有关说法中正确的有
A、 BLAST适合对高通量数据进行拼接
B、 现在的BLAST比对数据库需要建立索引
C、 早期BLAST无法处理gap
D、 BLAST一定能找到最优解
33、( 3分 )下面关于长非编码RNA(lncRNA)的说法,正确的有
A、 lncRNA有可变剪接
B、 lncRNA只能in cis地发挥功能
C、 lncRNA上没有外显子和读码框
D、 lncRNA都没有polyA尾巴
E、 lncRNA都没有功能
F、 lncRNA可以比某些编码RNA更长
34、( 3分 )下列关于直系同源基因和旁系同源基因的说法正确的是
A、 直系同源基因一定存在于不同的物种中,旁系同源基因一定存在于同一个物种中
B、 直系同源基因往往由基因加倍产生,旁系同源基因则由物种分化形成
C、 直系同源基因往往具有相似的生物学功能,旁系同源基因的功能则更可能不同
D、 当对一个未知功能的基因进行鉴定时,寻找其已知的同源基因十分重要
35、( 3分 )
哪些是我们为了成功进行BLAST所需要调节的参数

A、 屏蔽或不屏蔽低复杂度区域
B、 输入序列数量
C、 种子字长
D、 选择的空位罚分
36、( 3分 )关于非编码RNA的鉴定,下面说法错误的是
A、 LOG-ODD score分数越高,表明得到的ORF结果越可靠
B、 可以利用序列碱基保守性信息鉴定非编码RNA
C、 仅利用序列本身的特性无法实现非编码RNA的鉴定
D、 选择合适的特征组合可以提高鉴定的准确率
E、 使用生物信息学手段对非编码RNA的预测率可以达到100%
37、( 3分 )下列关于替换矩阵的说法哪几个是正确的
A、 替换矩阵中没有gap的罚分
B、 BLOSUM62矩阵比BLOSUM90矩阵效果更好
C、 替换矩阵的值由且仅由经验公式决定
D、 替换矩阵的值在一定程度上反应了碱基/氨基酸间的相似程度
38、( 3分 )下列关于直系同源基因和旁系同源基因说法正确的是
A、 直系同源基因是由物种分化产生的
B、 直系同源基因是由基因复制产生的
C、 旁系同源基因是由物种分化产生的
D、 旁系同源基因是由基因复制产生的
39、( 3分 )关于大规模进行数据比对时,下列说法正确的是
A、 不采用动态规划,算法内存消耗大
B、 采用动态规划算法,算法可靠
C、 不采用动态规划算法,运算速度慢
D、 采用动态规划算法,结果稳定
40、( 3分 )
针对下图的说明中正确的有

41.png

A、 该情况下我们在每个状态可以观察到a,b,c三个值
B、 该情况下设置了1,2,3 三种隐状态
C、 产生abccc的由1起始由3结束的状态中,概率最大的概率为0.00072
D、 可能产生符号序列abccc的由1起始由3结束的状态序列有9种
41、( 3分 )关于RNA-Seq中序列回帖的Split reads方法,下面说法中正确的有
A、 该方法可以将所有读段(read)定位到基因组上
B、 该方法不能发现新的外显子
C、 该方法运行速度较慢
D、 该方法常与join exon方法组合使用
42、( 3分 )
下图中显示的是一个基因(青色块)因为某种原因,在另一个基因的两个外显子(橙色块)之间的内含子之中突然出现。请问该出现过程可能涉及的机制有哪些?

42.png

 

A、 同源重组
B、 逆转录转座
C、 不是逆转录转座的转座
D、 从头起源
43、( 3分 )各转移概率和生成概率如下表,则存在问题的一组是
转移矩阵

43_1.png

生成矩阵

43_2.png

请问有问题的是

A、 转移矩阵n行
B、 生成矩阵C列
C、 转移矩阵c列
D、 生成矩阵n行
E、 转移矩阵c行
F、 生成矩阵A列

声明:本站所有文章,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。