2009年5月6日 星期三

Partitioned (Site Specific) Rate Model-MrBayes

這是Partitioned Bayesian analyses的進階使用,如果你的資料是coding gene的序列,請使用這種分析方法。原文是MrBayes的wiki

對於蛋白質編碼基因來說,site-specific rate model是很常用的分析,因為第一、第二和第三編碼位點都有各自的演化速率,因此把三個位點作分段是合理的。而這個情況下,就會產生一個有三種速率的model,其中兩個是可以自由變化的(在定義中平均速率為1.0)。而更普遍的情況是我們可能會有不同的特徵分群(character divisions),例如不同的基因,或是不同部位的型態特徵等,這些分群也可能會有非常不同的演化速率。

在MrBayes 3,我們提供一個機制來這訂這些model,將資料組進行分段(partitioning),然後跨過分段把參數作解套(unlinking)。假設我們要為一段序列建立一個site-specific rate model,我們首先先用這些指令在MrBayes block建立一個codon site partitioning:

  charset pos1 = 1-.\3;
  charset pos2 = 2-.\3;
  charset pos3 = 3-.\3;
  partition by_codon = 3: pos1, pos2, pos3;
  set partition = by_codon;

其中的.指的是資料組中最後一個特徵。而\3則表示在特定範圍內每第三個特徵。然後by_codon就是定義前面所說的這些特徵組的分段方法,而也是程式的指令。而為了要解決預設三個位點的速率都一樣的狀態,利用prset ratepr=variable這個指令來達成。而假設一段長度為720的序列,其MrBayes block可以寫成這樣:
  begin mrbayes;
    charset 1stpos = 1-720\3;
    charset 2ndpos = 2-720\3;
    charset 3rdpos = 3-720\3;
    partition bycodon = 3:1stpos,2ndpos,3rdpos;
    lset nst=6 rates=sitespec sitepartition=bycodon;
    mcmc ngen=1000 printfreq=100 samplefreq=10 nchains=4
    savebrlens=yes;
  end;

沒有留言:

張貼留言