下载此文档

转录剪切位点.ppt


文档分类:论文 | 页数:约106页 举报非法文档有奖
1/106
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/106 下载此文档
文档列表 文档介绍
核酸序列分析及结构预测
主讲张军
细胞生物学及遗传学教研室
第一节核酸序列的数据形式
1. 串(string)符号或字符的有序排列,符号或字符来自有限集合{A, T, G, C}。序列(sequence)与串是同一概念。
s=ATTGCATATG;串的长度|s|; 串s某个位置的字符表示为si ,1≤ i≤|s|。
特别的,长度为0的串称为空串(empty string),用符号ε表示。
2. 子串(substring)和子序列(subsequence),二者不是相同的概念。
子串和超串
s=ATGCGGTA; t=TGCGG; s是t的超串
子序列和超序列
s=ATGCGGTA; t=TGTA; s是t的超序列
区间(interval)
s=ATGCGGTACGTATACG; u=CG, s[i, i+1]
3. 串u和w的拼接(concatenation),表示为uw。
例如
s = ATGCGGTA; t=TGCGG
st = ATGCGGTATGCGG
ts = TGCGGATGCGGTA
串的冥
s = AT;sss= AT AT AT=s3
串的前缀(prefix)
s = ATGCGGTAGC; prefix(s,3)=ATG; prefix(s,0) = ε
存在且只存在s的另1个子串u, 使得s=tu, t是u的前缀。
串的后缀(suffix)
s = ATGCGGTAGC
suffix(s,3) =AGC; suffix(s,2) =GC ;suffix(s,0) = ε
存在且只存在s的另1个子串u, 使得s=ut, t是u的后缀。
杀手因子(killer agent),假定存在1个特别的串κ
|κ|=-1
在与其它串拼接的时候,起到删除相邻字符的作用
例如,
s = ATGCGGTAGC
κ s= TGCGGTAGC
s κ= ATGCGGTAG

ATGC κ GGTAG ? 无意义
(ATGC κ) GGTAG≠ ATGC (κ GGTAG )
stu=(st)u=s(tu); |s| ≠-1, |t| ≠-1, |u| ≠-1
|st| = |s| + |t| ,s和t可以是任何串
利用杀手因子可以表示1个串的子串,前缀和后缀
s[i…j]= κi-1 s κ|s| -j
prefix(s, k) = s κ|s| -k
Suffic(s, k) = κ|s| -k s
第二节序列比较
序列比较的根本任务:
发现序列之间的相似性
辨别序列之间的差异
序列比较的目的:
相似序列相似的结构,相似的功能
判别序列之间的同源性
推测序列之间的进化关系
序列的相似性
同源(homology)- 具有共同的祖先
直向同源(Orthologous )
共生同源(paralogous )
相似(similarity)
同源序列一般是相似的
相似序列不一定是同源的
进化趋同(同功能)
直向同源(a1 in species I, a1 in species II)
共生同源(a1 and a2 in species I)
进化趋同
水平转移
基因复制

转录剪切位点 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息