對於蛋白質編碼基因來說,site-specific rate model是很常用的分析,因為第一、第二和第三編碼位點都有各自的演化速率,因此把三個位點作分段是合理的。而這個情況下,就會產生一個有三種速率的model,其中兩個是可以自由變化的(在定義中平均速率為1.0)。而更普遍的情況是我們可能會有不同的特徵分群(character divisions),例如不同的基因,或是不同部位的型態特徵等,這些分群也可能會有非常不同的演化速率。
在MrBayes 3,我們提供一個機制來這訂這些model,將資料組進行分段(partitioning),然後跨過分段把參數作解套(unlinking)。假設我們要為一段序列建立一個site-specific rate model,我們首先先用這些指令在MrBayes block建立一個codon site partitioning:
charset pos1 = 1-.\3;
charset pos2 = 2-.\3;
charset pos3 = 3-.\3;
partition by_codon = 3: pos1, pos2, pos3;
set partition = by_codon;
其中的.指的是資料組中最後一個特徵。而\3則表示在特定範圍內每第三個特徵。然後by_codon就是定義前面所說的這些特徵組的分段方法,而也是程式的指令。而為了要解決預設三個位點的速率都一樣的狀態,利用prset ratepr=variable這個指令來達成。而假設一段長度為720的序列,其MrBayes block可以寫成這樣:
begin mrbayes;
charset 1stpos = 1-720\3;
charset 2ndpos = 2-720\3;
charset 3rdpos = 3-720\3;
partition bycodon = 3:1stpos,2ndpos,3rdpos;
lset nst=6 rates=sitespec sitepartition=bycodon;
mcmc ngen=1000 printfreq=100 samplefreq=10 nchains=4
savebrlens=yes;
end;
沒有留言:
張貼留言