- 57.00 KB
- 2022-08-12 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
实验四多重序列比对及系统发生树的构建【实验目的】丨、掌握使用Clustalx进行序列多重比对的操作方法;2、熟悉构建分子系统发生树的基木过程,掌握使用MEGA软件构建系统发生树的操作方法。3、进一步熟练BLAST的使用【实验原理】在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。对于一个完整的进化树分析需要以下儿个步骤:(1)要对所分析的多条目标序列进行比对;(2)要构建一个进化树(phyligenetictree)。构建进化树的算法主要分为两类:基于距离的方法和基于形状的方法。基于距离的方法是指计算序列之间的两两距离,构成距离矩阵,然后采用聚类算法推断进化树。最常见的基于距离的方法是UPGMA(Unweightedpairgroupmethodwitharithmeticmean,不加权算数平均对群法)与Neighbor-joining(邻接法),前者不如后者准确。基于性状的方法是指把序列中每个位点的状态视为性状,建立进化树模型来描述序列之间的性状差异。最常见的基于性状的方法包括最大简约法,最大似然法以及贝页斯方法。基于距离的方法和对于基于性状的方法,在计算速度上快很多,而且适用于各种类型的数据(如SNP数据,基因表达数据等);基于性状的方法计算速度较慢,搜索空间更大,得到的结果也往往更加准确。在研究中一般都会尝试不同的方法来建立进化树,综合多种方法得到的结果更加可靠。(3)对进化树进行评估。进化树的构建是一个统计学问题,我们所构建出来的进化树只是对真实的进化关系的评估或者模拟,需要进行统计学检验和评估。现在主要采用的方法是bootstraping,该方法的原理是每次以位点为单位对用于建树的多序列比对进行重新采样,看得到的进化树跟使用原有多序列比对得到的进化树的相似性。简单的说,就是看如果只用多序列比对的部分信息(2/3左右)构建进化树,得到的序列间的关系是否比较稳定。在实际应用中,多序列比对常用的软件包括ClustalW/X,MUSCLE,MAFFT等,三者的准确性和当,但计算时间依次减少;进化树构建常用的软件包括\n实验四多重序列比对及系统发生树的构建【实验目的】丨、掌握使用Clustalx进行序列多重比对的操作方法;2、熟悉构建分子系统发生树的基木过程,掌握使用MEGA软件构建系统发生树的操作方法。3、进一步熟练BLAST的使用【实验原理】在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。对于一个完整的进化树分析需要以下儿个步骤:(1)要对所分析的多条目标序列进行比对;(2)要构建一个进化树(phyligenetictree)。构建进化树的算法主要分为两类:基于距离的方法和基于形状的方法。基于距离的方法是指计算序列之间的两两距离,构成距离矩阵,然后采用聚类算法推断进化树。最常见的基于距离的方法是UPGMA(Unweightedpairgroupmethodwitharithmeticmean,不加权算数平均对群法)与Neighbor-joining(邻接法),前者不如后者准确。基于性状的方法是指把序列中每个位点的状态视为性状,建立进化树模型来描述序列之间的性状差异。最常见的基于性状的方法包括最大简约法,最大似然法以及贝页斯方法。基于距离的方法和对于基于性状的方法,在计算速度上快很多,而且适用于各种类型的数据(如SNP数据,基因表达数据等);基于性状的方法计算速度较慢,搜索空间更大,得到的结果也往往更加准确。在研究中一般都会尝试不同的方法来建立进化树,综合多种方法得到的结果更加可靠。(3)对进化树进行评估。进化树的构建是一个统计学问题,我们所构建出来的进化树只是对真实的进化关系的评估或者模拟,需要进行统计学检验和评估。现在主要采用的方法是bootstraping,该方法的原理是每次以位点为单位对用于建树的多序列比对进行重新采样,看得到的进化树跟使用原有多序列比对得到的进化树的相似性。简单的说,就是看如果只用多序列比对的部分信息(2/3左右)构建进化树,得到的序列间的关系是否比较稳定。在实际应用中,多序列比对常用的软件包括ClustalW/X,MUSCLE,MAFFT等,三者的准确性和当,但计算时间依次减少;进化树构建常用的软件包括\nPHYLIP(软件包,包括多种建树方法),MEGA,MrBayes,Phyml等等。从用户友好性和功能上来说,MEGA是目前用得最多的进化树构建和分析软件。本课程将学习如何使用ClustalX和MEGA分别做多序列比对和进化树构建。【实验内容】M._mulattaM._fascicuM._sylvanuHomosapieGorillaPongoSaimiri_scLemur_catt1、使用CLUSTALX软件对己知八条DNA序列(如下)进行多重序列比对;AGCTTTCTGGCGCAACCATCCTATGATTGCTCACGGACTCACCTCTTAAGCTTCTCCGGCGCAACCACCTATAATCGCCCGGGCTCACCTCTTAAGCTTCTCCGGTGCAACTATCCTAGTTGCCATGGACTCACCTCTTAATTCACCGGCGCAGTCATTCATAATCGCCCACGGGCTTACATCCTAATTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATAATCACCGGCGCAACCACCCTCATGATTGCCATGGACTCACATCCTAAGCTTCCGGCGCAATGATCCTAATAATCGCTCACGGGTTTACTTCGTAAGCTTTAGGAGCAACCATTCTAATAATCGCACATGGCCTTACATCAT2、使用MEGA软件构建上述DNA分子系统发生树。3、从BLAST上获取跟人类基因P53M源的其他物种的5个基因,使用MEGA得到它们的分子系统发生树【实验方法】一、用CLUSTALX软件对已知DNA序列做多序列比对。操作步骤:1、使用BioEdit,以FASTA格式准备上述8个DNA序列test.fas文件.注意:ClustalX软件不支持中文文件名,请不耍把文件放在桌面。2、双击进入CLUSTALX程序,点FILE进入LOADSEQUENCE,打开test.fas文件。3、点ALIGNMENT,在默认alignmentparameters下,点击DocompleteAlignment。在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):比对文件test.aln和向导树文件test.dnd。4、点FILE进入Savesequenceas,在format框屮选fasta格式,设置文件名y、Jtest_align.fas,点击OK。二、用MEGA软件推导进化树。1、打开MEGA软件,菜单栏处点击“Data”,从“OpenaFile/Session”打开上面保存的test_align.fas文件2、菜单栏处点击“Phylogeny”,选择构建进化树的方法“Construct/TestNeighbor-joiningTree”,进入参数设置界面;\n3、查看需要设罝的参数:\n1)是否检验进化树的可f目度:默认为做bootstrap检验,改为“None”;2)设置核苷酸替换模型:默认参数;3)设置位点和进化速率分布模式:默认参数;4)处理Gap方法:默认参数;参数设置完成后,点击窗口下面的”Compute”按钮,开始构建进化树。MEGA会显示任务的进度。4进化树建好之后,MEGA会默认打歼一个新窗口展示该进化树,如下图所示:厘5:TreeEzplorer(D:\test_align.fas.fasta)FileImageSubtreeViewComputeCaptionHelpH曇黾鉍邊|Mrrd^taMfeacuhbiiDSEpeGbill沒rririacLqtltc^t0.055可以对进化树的展示形式进行改变,如变成星型,交换同一节点中两个分支的位置,对分支进行压缩显示,也可以把该树保存I来在其他软件打开,或考以阁形的形式输出。6重复上面的第2〜5步,在第2步,改变建进化树的方法,看得到的进化树是否有差异;7重复上面的第3〜5步,在第3步中,分别改变下面的参数,看得到的结果是否有差异:1)检验进化树的参数改为默认值;2)核什酸替换模型改成p-distance;三、用BLAST与MEGA软件推导人基因P53与其他物种中该基因的进化树1通过NCBI上的Gene数据库,查询到P53编码的其中一个蛋白的序列;\n2通过BLAST,获取跟人P53蛋白同源的其他几个物种的蛋白序列,包括Pongoabelii,Pantroglodytes,Chlorocebusaethiops,Cercocebusatys与Macacamulatta等物种,下载到本地,保存为fasta格式;3使用上面介绍的ClustalX对蛋白序列进行多序列比对,然后使用MEGA中的Neighbor-joining方法建立进化树,并且做bootstrap检验。【作业与思考题】1、采用以上例子给出的DNA序列进行系统发育树的构建结果。(包括序列比对结果及最终生成的树)2以上面提供的DNA序列为例,比较Neighbor-joining方法与Maximum-likelihood方法构建进化树的异同,包括涉及的参数,速度与结果等方面;3、在P53相关的实验内容中,对应的蛋白序列改成mRNA序列,然后再做多序列比对与进化树构建,看得到的进化树的异同。4MEGA是目前进化分析领域用的最多的软件之一,请查看其Tutorial,总结其功能,同时思考它能用于哪些方面的研究。