下载此文档

Clustal多序列比对.docx


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
该【Clustal多序列比对 】是由【xiaobaizhua】上传分享,文档一共【7】页,该文档可以免费在线阅读,需要了解更多关于【Clustal多序列比对 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。实验三:多条序列比对——lustalx
实****目的:了解掌握Clustalx软件的应用,学会做多条序列比对并分析。
实****内容:
一、ClustalX的使用
Clustal是一种利用渐近法(progressivealignment)进行多条序列比对的软件。即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。
准备要比对的序列
请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存为文本文件(所有的序列请粘贴到同一个文本文件中)。选择NM、XM或NP打头的序列,不要选择NC或NW打头的序列,那是全基因组序列。
建议关键词:hemoglobin,trypsin,peroxidase,p53,SuperoxideDismutase,h5nl,etc.
打开clustalX程序
开始菜单一程序一clustalX2-clustalX2
载入序列
点最上方的File菜单,选择LoadSequence-选择你刚保存的序列文件,点打开。
在左侧窗口里是fasta格式序列的标识号,取自序列第一行“〉”后的字符。注意:ClustalX程序无法识别汉字,无法识别带空位的文件夹名,如mydocument。各位同学的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。
比对参数的选择
可以对两条序列比对的参数和多条序列比对的参数进行设置。
两条序列比对的参数设置
点击Alilgnment菜单,选择AlignmentParameters,再选择PairwiseAlignmentParameters。首先可以选择比对的效果,是slow/accurate还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,要使用的DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。
多条序列比对参数设置
点击Alilgnment菜单,选择AlignmentParameters,再选择MultipleAlignmentParameters。
更改输出格式
点击Alignment菜单,选择OutputFormatOptions。
默认的是输出clustalformat,如果需要其它格式,可在复选框里打勾。PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式。
进行比对
点击Aliglnment菜单,,提示你比对结果保存的位置,你在上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。选择好了点OK即可。
要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结果进行分析,选择哪个是最合理的结果(theresultmakingbiologicalsense)。
比对结束后生成的aln文件是多条序列比对的结果,可以用记事本打开浏览。在某一列比对结果下方如果出现*,说明这列是完全匹配。dnd文件是比对过程中生成的进化树,可以用treeview打开浏览。
迭代比对
如果序列比对结果不理想,可以采用迭代选项,多次迭代寻找最佳比对结果。
点击Alignment菜单,选择iteration,选择iterateeachalignmentstep或iteratefinalalignment.
然后再点击Aliglnment菜单,选择DoCompleteAlignment进行比对。
&概型(Profile)比对模式
以上介绍的都是MultiplealignmentMode,ClustalX还提供了一个概型比对模式,在菜单栏下方选择ProfileAlignment
Mode,可以对两个比对结果(alignment,termedprofilehere)进行再比对,或将一条序列与一个比对结果(profile)进行比对。
rp ♦
一、Treeview
Clustalx产生的guidetree(即后缀为dnd文件),可以通过treeview软件浏览。
。双击后缀为dnd文件,选择treeview程序打开即可。
作业:
Clustalx是多条序列比对软件,为什么需要设置两条序列比对的参数?
答:Clustal是一种利用渐近法(progressivealignment)进行多条序列比对的软件。即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果,既是采用两两比较后再继续进行比较的方法,所以,需要设置两条序列比对的参数。
利用entrez或srs搜索来自于不同物种的同源序列(othologs),利用clustalX进行比对,给出所选序列简要信息(fasta格式第一行),比对所用的参数,比对过程中产生的guidetree(dnd文件),并分析比对结果(序列之间相似度关系,保守位点所在位置等)。
答:简要信息:
>,completecds>,partialcds>gi|32186925|gb||HalichoerestenuispinisestrogenreceptorbetamRNA,completecds>,completecds>,alternateassembly(basedonCelera),wholegenomeshotgunsequence
>>,completecds
比对所用参数:
Guidetree:
Danio
Paramisgurnus
Halichoeres
Anguilla
比对结果见附表1:附表1: .
Homo
Candidia
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
TATCACTATGGTGTCTGGTCATGTG-一AGGGATGCAAGGCT TTTTTCAAA
TATCACTATGGTGTCTGGTCATGTG-一AGGGGTGCAAGGCT TTCTTCAAA
TATCACTATGGTGTCTGGTCATGTG-一AAGGGTGCAAGGCT TTCTTCAAG
TATCACTACGGGGTGTGGTCATGCG-一AGGGGTGCAAGGCT TTCTTCAAA
TATCACTACGGTGTGTGGTCCTGCG-一AGGGCTGTAAAGCA TTTTTCAAG
TATCACTACGGGGTGTGGTCCTGCG-一AAGGCTGCAAGGCC TTCTTCAAG
TA-CACTGAGGGACTGAGCCTGGTGTATATGGCAGCAAGACTGGATGGTGGCTTTGCAGC
CGGAGCATTCAAGGACACAATGACT--ATATGTG——TCCAGCCACCAACC--
CGGAGCATTCAAGGACACAATGACT--ATATTTG——TCCAGCCACCAACC--
CGTAGCATTCAAGGTCACAATGACT--ATATTTG——TCCAGCCACCAACC--
CGAAGCATTCAAGGACACAATGACT--ACATTTG——TCCAGCCACCAACC--
AGGAGTATCCAAGGACACAACGACT--ACATCTG——CCCTGCAACAAATC--
AGGAGCATCCAAGGGCACAATGGCT--ACATCTG——CCCCGCCACCAACC--
AGTCTCCAGAGCATTCCATGAGATCCGGGCTCGAAATCCAGCATTTCAGCCACAAACTTT
AGTGCACCATTG ACAAGAGCCGACGCAAAAGCTG-CCAGGCCTGTCGACTCCG
AGTGCACTATTG ACAAGAGCCGACGCAAGAGCTG-CCAGGCCTGTCGACTCCG
AGTGCACTATTG ACAAGAGCAGACGCAAGAGCTG-TCAGGCCTGTCGACTCCG
AGTGCACCATCG ACAAGAGTCGTCGTAAGAGCTG-TCAGGCCTGTCGATTCCG
AATGCACTATCG ACAAGAACCGGCGTAAGAGCTG-CCAAGCCTGCCGCCTACG
AGTGCACCATCG ACAAGAACCGGCGCAAGAGCTG-CCAGGCCTGCCGACTCCG
GATGGACTTTGGCTCAGGTACTGGTTCTGTCACCTGGGCTGCTCACAGTATTTGGGGCCA
*x**x**x**x*
CAAGTGCTATGAA一-ATGGGCATGATGAAGTGTGGTGTGAGGCGGG——AACGCTGCA
CAAGTGCTATGAA一-ACAGGCATGATGAAGTGTGGTGTGAGGCGGG——AACGCTGCA
CAAGTGCTATGAA-一GTGGACATGATGAAGTGTGGTGTGAGGAGGG——AGCGCTGCA
CAAGTGCTATGAA-一GTGGGCATGATGAAGTGTGGTGTGAGGCGAG——AACGGTGCA
TAAATGCTACGAA-一GTGGGCATGATGAAATGTGGTGTAAGACGTG——AACGCTGCA
CAAGTGCTACGAA-一GTGGGCATGATGAAGTGTGGTGTGAGACGGG——AGCGTTGTA
GAGCCTACGTGAATATATGTGTGTGGACAGATCAGCTGCCATGTTGGTTTTGGCAGAAAA*x**x**x*
*y**y**y*
GTTACCGTGGTGCTCGTCATCGTCGCAAC-一CCCCAGATCAGGGACAGCTCGGGCGGGG
GTTACCGCGGTGCTCGTCATCGTCGAAAT-一CCCCCGATCAGAGACGGCTTGGGCGAGG
GTTATCGAGGTGCTCGACATCGTCGTAAC-一CCCCAAATCAGAGACAGCTCTGGCGGGG
GTTACCGCGGTGCCCGTCATCGTCGCCAT-一CCCCAGACGAGAGACGGCTCAGGCAAAG
GCTATCGAGGAACCCGACACCGCCGTGGTGGACTCCAGCCTCGGGATCCCACAGGCAGGG
CCTACCGGGGGGCGCGACACCGCCGCATG-一CCCCACATCCGCGAGTTGGCGGGCACAG
ACTACTGAAAGGTGGTTCAGAATCTGGGGAG-CCTTATATTCCAGGTGTCTTTTTCAGAC
CTTTAG GGGTCAGAG-GTTGTTCCCAGCATCATTTAGAAATTCCT--CTCA
TGTTAG GGGTCAGAG-GTTGTTCCCAGCATAATTTAGAAATTCCT--CTCA
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
DanioParamisgurnusHalichoeres
Anguilla
Homo
Candidia
Rutilus
Danio
Paramisgurnus
TGGTAG GACTCAGAG-GTCAATCCCAGCAGCATCTAGAGTTCCCC—CTCA
CATTAG GGGTCAGAG-GTCGCTCCCAGCATAATCTAGAATTTCCG--TTCA
GTTTGGTCAGAGTGGGGCTTGGTT-CTCGAGCCCAAAGGCATCTCCACCTTGAGGGTCCC ggggcgggg-ccaggacccagaggcggggcgaggg AAGTTTCTACCTGTATCACCCAAGGTGCAGTTTGATGTAGTAGTGTCAGCTTTTTC-CTTA*
ATCCCACTCATCACCTCTTCCCTTCAGGGGGCAG--AGCTGAGGGGTGTGGCC TG
ATCCCACTGATCACCTCTTCCCTTCTGGGGGCAG--AGCTGAGGGGTGTGTCC TG
GTCCCTCTCAGCACCTCTTTCCTTCAGGGGGCAG--AGCTGAGGGACGGGGCC TG
TCTCCCCTCATCAACTCGTCCCTTCGGGTGGCGC--ATCCGAGGGCCGTGGCC TG
CTCACCCCTGTCACCCCCCTCCCTCAGATGAGCC--ACGTACACCACGCAGCCA——TG
GTC GTCCCTCAGACGCAGG--AGGCGCAGTCCTCGGCGC——TC
AGTGAACTGCCCAGCAAGGCTGACCGCACTGAGGTAGTTCAAACCTTATGGCGTAAGACA
**
AGCTTCTCCCCTGAGCAGTTGGTGAACTGCATTCTGG--AGGCAGAGCCTCCTCAGATTT
AGCTTCTCCCCTGAGCAGTTGGTGAACTGTATTCTGG--AGGCGGAGCCTCCTCAGATTT
AACTATTCCCCTGAACAATTGGTCAGCTGTATTCTAG--AGGCGGAGCCACCTCAAATTT
TCCGCTGAGCAGCTGGTGAACTGTATTCTAG--AGGCGGAGCCTCCTCAGATTTAG CCCAGAGGAATTCATCATGCGCATCATGG--AAGCAGAGCCACCAGAGATCT
A CGCCGGAGCAGTTAATCAACCGCATCATCG--AGGCGGAGCCGCCGGAGATCT
GGTCATTTCCTGGTACTGGTGGAGAATGGAACAAAAGCTGGGCACAGCCTTCTCATGGAT
GCCTGAGA GAGCCAGTGAAGAAGCCATACACGGAGGC-CAGCATGATGAT
GCCTGAAA GAGCCAGTGAAAAAGCCGTACACTGAGGC-CAGCATGATGAT
ACCTGAGA GAGCCGGTGAAAAAGCCATACACTGAGGC-TAGCATGATGAT
ACCTGAAA GAGCAGGTGCAGAAGCCGTACACTGAGGC-CAGCATGATGAT
ACCTCATG GAGGAGCAGAAGAAGCCTTTTACCGAGGC-CAGCATGATGAT
ACCTCATG AAGGAGCTGAAGAAGCCCTTCACCGAGGA-CAGCATGATGAT
GCCAGGGATCTGGTCCTTAAGGGAAAAGAGAAGTCACCTTTGGACCCTCGACCTGGTTTT
GTCACTCACCAGCCTTGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAG
GTCACTAACCACCCTCGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAG
GTCACTAACAAGCCTCGCCGACAAGGAGCTGGTGCTCA--TGATTAGCTGGGCGAAGAAG
GTCACTAACCAACCTTGCTGACAGGGAACTGGTGCTCA--TGATCAGCTGGGCTAAAAAA
GTCCCTCACAAACCTGGCAGACAAGGAGCTGGTGCTTA--TGATCAGCTGGGCTAAAAAG
GTCACTCACCAACCTGGCCGACAAGGAGCTCGTCCTCA--TGATCAGCTGGGCCAAAAAG
GTCTTTGCCCCGTGTCCCCATGAACTCCCTTGTCCCCAGTTGACCAACCTGGCCTGTAGC
ATACCA-GGTTTTGTGGAGCTGACACTTTCAGATCAGGTGCATCTATTGGAATGCTGCTG
ATACCA-GGTTTCGTGGAGCTGACGCTTTCAGATCAGGTGCATCTATTGGAATGCTGCTG
ATACCA-GGTTTTGTAGAGTTGACTTTGTCAGATCAGGTGCATTTGCTGGAATGCTGCTG
ATACCA-GGTTTTGTGGAGCTGTGTTTGTCTGATCAGGTGCATCTGTTGGAATGCTGTTG
Halichoeres
Anguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
Candidia
Rutilus
Danio
ParamisgurnusHalichoeresAnguilla
Homo
ATCCCT-GGCTTTGTCGAGCTGTGTCTAGCTGATCAGATTCACCTCCTAAAGTGCTGCTG
ATCCCT-GGGTTTGTGGAGCTGGACCTGTCTGACCAAGTACACCTGCTGGAGTGCTGTTG
TTCTCACAGGCGTACCATCCCATCCCCTTCAGCTGGAACA-AGAAACCAAAGGAAGAAAA
GCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCAT
GCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCCGGGAAACTCAT
GCTGGATATTCTGATGTTAGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCAT
GCTGGATATTCTGATGTTGGGACTGATGTGGAGATCCGTAGATCATCCTGGGAAACTCAT
GTTGGAAATTCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCATCCTGGGAAACTAAT
GCTGGAGGTGCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCACCCTGGGAAACTCAT
GTTCTCTATGGTGATCCTTGCTCGGGGGTCTCCAGAGGAGGCTCATCGCTGGCCCCGTAT
CTTCTCACCTGACCTCAAACTGAACAGGGATGAGTGGAATTGTGT-TGAAGGCATCATGG
CTTCTCACCCGACCTCAAACTGAACAGGGGTGAATGGAATTGTGT-TGAAGGCATCATGG
CTTCACCCCTGACCTCAAGCTCAACAGGGAGGAAGGGAATTGTGT-TGAAGGCATCATGG
CTTCTCACCAGACCTCAAGCTCAACCGGGACGAATGGGGTTGTGT-TGAAGGCATCATGG
CTTCTCTCCTGACTTCAAACTCAACAGAGAGGAGGGTCAGTGTGT-GGAGGGCATCATGG
CTTTTCCCCAGACCTCAAGCTCAACAGGGATGAGGGAAGTTGTGT-GGAGGGGATCCTGG
CACTCAGCCTGTCCTTAAACGGCCTCGCCATGTGCATTGTCACTTGTGCTGTCCAGATGG
AGATCTTTGACATGCTGCTGGCCACGACCTCCAGATTCAG--AGAATTGAAGCTACAGAG
AGATCTTTGACATGCTGCTGGCCACCACCTCCAGATTCAG--AGAACTGAAGCTACAGAG
AGATTTTTGACATGCTGCTGGCCACCACCTCTCGATTCAG--AGAGCTGAAGCTGCAGAG
AGATCTTTGACATGCTGCTGGCCACCACCTCTAGATTCAG--AGAACTGAAGCTACGGAG
AGATCTTTGACATGCTGCTGGCTGCCACCTCTCGGTTTCG--TGAGCTGAAGCTTCAGAG
AAATCTTCGACATGGTGCTGGCGGCAACCTCCAGGTTTCG--GGAGCTGAAGCTACAGAG
GCACATGCAGCATGCTG-TGCTCACAGCCCGCCGGCACGGCAGGGATTTGTATCGTTGTG
*x**x**x**x*
GGAGGAATACGTCTGTCTCAAAGCCATGATCCTTCTCAACTCCAATAACTGTTCAAGCTT
GGAGGAATACGTCTGTCTCAAAGCCATGATCCTTCTCAACTCCAATAACTGTTCAAGCTT
AGAGGAATACGTCTGTCTCAAAGCCATGATCCTGCTCAACTCTAATAACTGTTCGAGTTT
AGAGGAATATGTCTGCCTCAAAGCCATGATCCTCCTCAACCC
GGAGGAGTACGTCTGTCTGAAGGCCATGATCCTCCTCAACTCCAATCTGTGTTCGAGCTC
GGAGGAGTATGTGTGCCTCAAAGCCATTATCCTCCTCAACCCCAACCTGTGCACAACGTC
CCCGTGTCAGCTCCTGGGGAGATCTTTTACCTGTGCTTACTCCG-TCTGCGTTTCCTCCA

Clustal多序列比对 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人xiaobaizhua
  • 文件大小51 KB
  • 时间2022-10-23