2009年5月6日 星期三

MrBayes的分析策略


如果要發表的話,建議分析要跑到一百萬個generations以上,當然也要看taxa和序列長度而定,taxa越多或序列/特徵越多,分析就應該更長。不過由於分析可能會跑很久,尤其如果電腦運算不快的話,可能要跑好幾天,所以可以先跑短一點的分析來推算時間。到底分析要跑多長請用懶人版提到的兩個參數來判斷:PSRF接近1.0、standard deviation of split frequencies至少小於0.01。

一開始可以跑一萬個generations,假設要花10分鐘,那麼一百萬個generations就大約要1000分鐘,也就是大約16.7小時左右。如果先不設定burnin或是burnin設為0,跑完可以用sump這個指令去看大約在什麼時候達到穩定,就可以知道burnin值至少要設定為多少,例如下圖:

從這個圖就可以知道10000個generations的分析,但是burnin至少要設為1000。而第1000 generations以後並不是就沒有變化,而只是呈現white noise的狀態。

而關於得到的樹,可以按照完整版的說明處理,或是用PAUP*軟體打開樹的檔案,再用Majority rule的方法來得到consensus tree,所顯示的數值即為Bayesian support values,或稱為credibility values,不過請注意這不是bootstrap value。Bayesian的可信度或是支持率是事後機率(posterior probabilities),而bootstrap value則是resampling的百分比。有不少人懷疑Bayesian分析所得到的support values或credibility values是否可信,其實這很難比較,有興趣的可以找這篇文章(Comparison of Bayesian and Maximum Likelihood Bootstrap Measures of Phylogenetic Reliability)先看看,再延伸看相關文章。而我個人還是習慣用MEGA軟體來打開樹的檔案和運算consensus tree,如同BAMBE一文中最後說的那樣。

PS: 在MrBayes軟體中,有些用法和DOS很類似,例如如果在命令提示字元後面按鍵盤的上下鍵,就會自動跑出剛剛曾經輸入過的指令,而如果要退出這個軟體,可以輸入q或quit,而execute可以用exe代替,yes或no可以只打y或n。如果有要查詢什麼,就打help或是help加上要查詢的部份,例如help mcmc等。

沒有留言:

張貼留言