CRAN Task View: Phylogeneticsについて、機械翻訳を交えて日本語化し掲載しております。

概要

Maintainer: William Gearty, Brian O’Meara, Jacob Berv, Gustavo A. Ballen, Diniz Ferreira, Hilmar Lapp, Lars Schmitz, Martin R. Smith, Nathan S. Upham, Jonathan A. Nations
Contact: willgearty at gmail.com
Version: 2024-12-09
URL: https://CRAN.R-project.org/view=Phylogenetics
Source: https://github.com/cran-task-views/Phylogenetics/
Contributions: このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation: このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“Phylogenetics”, coreOnly = TRUE)は全てのコアパッケージをインストールし、ctv::update.views(“Phylogenetics”)はまだインストールしていない全てのパッケージと最新のものをインストールします。詳しくはCRAN Task View Initiativeを参照してください。

生命の歴史は系統的な文脈の中で展開され、この進化の歴史を表すために系統樹(しばしば「ツリー」と略されます)が開発されます。比較系統樹法は、このような系統樹に沿った歴史的パターンを分析するための統計的アプローチです。このタスクビューでは、

(i)系統樹の取り扱い、操作、解析を容易にするRパッケージ

(ii)比較系統樹法を実装するRパッケージ

(iii)系統樹法を特定の分野に適用するRパッケージ

について説明します。これは活発な研究分野であり、情報の多くは変更される可能性があります。多くの重要なパッケージは CRAN にありません: 以前 CRAN にあり、後にアーカイブされた (例えば、R が更新される際に必要な変更を取り込めなかった場合) か、他の場所で開発され CRAN ではまだ利用できないかのどちらかです。このようなパッケージは、GitHub、R-Forge、Bioconductor、または著者のウェブサイトにあります。このドメインでは、少なくとも10個のパッケージがphy*として始まり、2組の似た名前のパッケージ(phytoolsとphylotools、phylobaseとphybase)があります。

質問があれば、タスクビューのメンテナや特定のパッケージのメンテナに遠慮なく連絡してください。また、R-SIG-Phyloメーリングリストを購読している方は、そちらにも質問をお寄せください。

範囲

コアパッケージ

  • apeは、S3のphyloクラスを実装しており、Rで系統樹を格納するのに一般的に使用されます。Newick/PhylipやNEXUS形式の樹木を読み書きをしたり、可視化するのに一般的に使用されます。また、樹木の操作(例えば、樹木の根付け、先端の削除、ポリトミーのランダムな解決)、樹木の推定(例えば、近傍結合、bio-nj、高速ME法)、系統的比較解析(例えば、離散的および連続的なキャラクタの再構築、形質進化と多様化の基本モデルの適合)を行うための多くの関数を持っています。また、ランダムツリーを生成したり、GenBankからデータを取り込んだり、経時系統図や相関図プロットを作成することもできます。
  • phylobaseは、系統樹と比較データを組み合わせたS4 phylo4クラスを実装しています。S3のphyloクラスほど一般的には使われていませんが、この新しいクラスは系統樹比較法を実装した新しいパッケージ(例えば、adephylophylosignal)の間で人気を集めています。
  • geigerは、形質進化と多様化の解析のための大規模なモデルフィッティングアプローチ一式を実装しています。geigerは、離散的および連続的な形質進化に関する様々なモデル(例えば、ブラウン運動、Ornstein-Uhlenbeck、Pagelの変換、およびトレンドを含むモデル)の適合と比較に最もよく使用されます。また、系統や離散的・連続的形質の進化のシミュレーションにもよく使われます。また、他のパッケージでよく使われる補助関数もいくつか持っています。
  • phytoolsは、系統樹や比較データの可視化(例えば、形態空間への投影)、操作(例えば、枝長の拡大縮小や変換、ヒントの追加、サブツリーの発見)、読み取りや書き込み、さらには推論を行うための系統樹比較分析を実行するための機能を絶えず増やしています。

タスク

タスクビュー内のパッケージは、次の1つ以上のタスク カテゴリに分類されます。

  • Rで樹木を扱う:系統データの取り扱い、操作、視覚化専用のパッケージ
  • Rで樹木を作る:系統推定と樹木シミュレーションのためのパッケージ
  • 比較系統学的手法: 形質進化や多様化を含む様々な比較系統学的手法を実行するためのパッケージ
  • 他分野における系統学: 古生物学、群集生態学、生物地理学、遺伝学など、分野固有の系統解析を行うために設計されたパッケージ
  • その他の有用なパッケージと雑多なもの:分類学的マッチングなど、系統分析の実行に有用なパッケージ

R でツリーを操作する

ツリーを R に取り込む

  • phylobaseとその軽量版であるrnclは、Nexus Class Libraryを使用してNEXUS、Newick、その他のツリーフォーマットを読み込むことができます。
  • treebaseは、オンラインツリーリポジトリTreeBASEからツリーを検索し、読み込むことができます。
  • RNeXMLは、NeXMLフォーマットのメタデータの読み取り、書き込み、処理を行うことができます。
  • TreeToolsは、TNTフォーマットやNEXUSフォーマットの外部ファイル(apeではサポートされていないNexusフォーマットの拡張子を含む)や、MorphoBankのメタデータから樹木を読み込むことができます。
  • ipsは、BEASTMrBayes、その他の系統樹プログラムからの樹木を読み込みます。本パッケージはBEASTやMrBayesの出力からノードサポートやその他の値を解析するために使用できます。
  • phylotateは、注釈を保持したまま、NEXUSやNewick形式の類人猿互換系統樹を読み書きできます。
  • phyext2は、シムマップ形式を含む様々なツリー形式を読み書きできます。
  • rotlは、Open Tree of Lifeプロジェクトから合成樹木と個々の研究樹木を取り込むことができます。
  • treeioは、Newick、Nexus、New Hampshire eXtended format (NHX)、jplace、Phylip形式のツリーや、BEAST、EPA、Hyphy、MrBayes、PAML、PHYLDOG、pplacer、r8s、RAxML、RevBayesから出力されたデータを読み込むことができます。
  • phylogramは、Newickファイルをデンドログラム・オブジェクトに変換できます。
  • dendextendは、このようなデンドログラム・オブジェクトを操作できます。
  • phytoolsは、単純なNewick形式とNexus形式のツリー、およびエンコードされた不連続文字を持つ「simmap」ツリーを読み書きできます。

ツリー操作

  • phylobaseは、木を走査するための関数があります(例えば、特定のノードの子孫を2つだけ指定して、そのノードからすべての子孫を取得するなど)。
  • geigerは、樹木やデータを重複する分類群にプルーニングすることができます。また、ACDC、Pagel (1999)のλ、δ、κパラメータ、Ornstein-Uhlenbeck αパラメータ(ultrametricツリーのみ)を使った枝長スケーリングも可能です。また、絶滅した分類群の刈り込みにも使用できます。
  • TreeToolsは、制約条件の適用を含め、木の形やバランスを定量化し操作する機能や、木の系統的な情報量を測定する機能を備えています。
  • Rogueは、ワイルドカード分類群を識別し、より情報量の多いサマリーツリーを生成します。
  • tidytreeは、ツリーオブジェクトを整頓されたデータフレームに変換し、ツリーデータを操作するための他の整頓されたアプローチを持っています。
  • evobiRは、名前のファジーマッチングができます(多少の違いは許容します)。
  • SigTreeは、多重比較の補正を可能にしながら、何らかの処置に反応する枝を見つけます。
  • dendextendは、樹木の細分化、葉の追加など、デンドログラムを操作することができます。
  • apexは、複数の遺伝子のDNAアラインメントを扱うことができ、apephangornの樹形推論における使用と解析が容易になりました。
  • aphidは、系統樹に基づいて配列の重み付けを行うことができ、多重配列アライメントを含む様々な目的のために隠れマルコフモデル(HMM)を使用することができます。
  • phangornTreeSearchは、木の再配列(NNI、SPR、TBR)を行うことができます。
  • paleotreeは、より普遍的な変換だけでなく、化石分類群で発生するサンプリングの問題に基づいて木を操作するための関数を持っています。
  • dendextendは、樹木の細分化、葉の追加など、デンドログラムを操作することができます。
  • castorは、非常に大きな樹木(最大で数百万本のチップ)を操作するのに使用できます。
  • phytoolsは、あらかじめ指定されたポイントで木をスライスしたり、木にランダムに分類群を追加したり、属に種を追加したり、1つの先端を木に結合したり、2つの木を一緒に結合したり、クリック可能なインターフェースを使用して木でクレードを折りたたんだり、中間点ルーティングを実行したり、ユーザーが指定した離散文字レジームを木にペイントしてさまざまな方法で「simmap」オブジェクトを作成したり、マッピングされた文字を持つ木を分岐していないノードを持つ単純な「phylo」オブジェクトに変換したり、ルートエッジを分岐していない1つのノードに変換したりすることができます。

ツリーの可視化

  • apeおよびadephylophylobasephytoolsouchdendextendは、木をプロットする機能があります。これらのうちのいくつかには、何らかの基準(祖先の状態、木の構造など)に基づいて枝や分類子を色分けするオプションがあります。さらに、phytoolsには、木の先端に比較データをプロットしたり、比較分析の結果をグラフ化したり、共系統をプロットしたりする機能が充実しています。
  • paleoPhylopaleotreeは、古生物学の系統樹を描くことに特化しています。
  • viperは、分岐サポートやHPDインターバルなどの系統樹の注釈付けに使用できます。
  • 一般的なRの可視化パッケージggplot2は、ggtreeggtreeExtraによって系統を可視化するために拡張することができ、deeptimeを使って地質学的なタイムスケールを追加することができます。
  • strapは、系統樹に地質学的なタイムスケールを追加するために使用できます。
  • idendr0は、木を(デンドログラムとして)対話的に探索するために使うことができます。
  • phylocanvasは、「htmlwidgets」用のウィジェットで、phylocanvas javascriptライブラリを使って系統樹を埋め込むことができます。
  • ggmullerは、頻度ダイナミクスとともに系統樹をプロットすることができます。
  • RPANDA (archived)は、系統樹のスペクトル密度と固有値をプロットするのに使用できます。
  • diversitreeは、「plot2.phylo()」という未提供の関数があり、非常に軽量な樹種のPDF出力を可能にしています(diversitree:::plot2.phylo()から呼び出せます)。

ツリーの比較

  • distoryTreeDistQuartetTBRDistphangornphytoolsは、樹木間の距離を計算できます。
  • TreeDisttreespaceは、木集合(「木空間」)の低次元マッピングをプロットし、評価することができます。
  • apeは、木-木の距離を計算し、関連する先端間のリンクを持つ2つの木を示すプロットも作成できます。
  • dendextendは、デンドログラムを比較する複数の尺度を評価できます。

系統的要約統計

  • treestatsは、高速に計算できるように最適化された樹木統計の幅広いコレクションを計算するために使用することができます。
  • nLTTは、nLTT統計量の計算と視覚化に特化しています。
  • castorは、ガンマ統計量、コレス統計量、サッキン統計量の高速計算が含まれています。
  • phyloTopは、パターンに基づく要約統計量(はしご、階段、チェリー、投石器など)のコレクションを計算するために使用できます。
  • treebalanceは、(不)均衡の測定に焦点を当てた要約統計のコレクションを計算するために使用することができます。
  • poweRbalは、異なる樹木モデルを区別する力を推定することにより、樹木形状統計の簡単な評価と比較を提供します。
  • RPANDA (archived)は、ラプラシアンスペクトルに関連する統計量を計算することができます。
  • picanteは、mpd、mntd、psvのようなコミュニティレベルの要約統計量を計算することができます。
  • treeCentralityは、ネットワーク科学から着想を得たいくつかの統計量を計算することができます。

Rでツリー構築

系統的推論

  • phangornは、距離(UPGMAなど)、パーシモン、尤度を用いて木を推定することができます。
  • TreeSearchは、適用不可能なデータに対するBrazeauら(2019)の補正を使用して、パーシモン下で最もパーシモンな木を同定することができ、結果の詳細な分析のためのグラフィカル・ユーザー・インターフェースが含まれています。
  • phyclustは、シーケンスをクラスタリングすることができます。
  • phytoolsは、MRPスーパーツリー推定と最小二乗法を使用してツリーを構築することができます。
  • phylotoolsは、他のソフトウェアで解析するためのスーパーマトリックスを構築することができます。
  • EvoPhyloは、MrBayesBEAST2で行われるベイズ系統解析のために、自動化された形態学的キャラクタ・パーティショニングを行うために使用できます。また、このような解析から出力されるマクロ進化パラメータの解析にも使用できます。
  • fastreeRは、VCFまたはFASTAファイルのサンプル間の距離計算、系統樹の構築、階層的クラスタリングの実行に使用できます。
  • rphenoscateは、正式な文字階層とそれに対応する割合行列を構築することで、「適用できない」文字(親形質に依存する形態学的文字など)の分析を容易にします(Tarasov 2023)。

発散時間

  • apeは、ノンパラメトリック率平滑化(NPRS)とペナルティ付き尤度を実装しています。
  • geigerは、指定された標準木に一致するようにソース木を引き伸ばす合同化を行うことができます。
  • cladedateは、化石記録から経験的な較正情報を生成します。
  • treedaterは、様々な時計モデル、信頼度の評価方法、外れ値の検出を実装しています。
  • phangornは、配列から直接、厳密な時計モデルで超定期系統樹と先端定時系統樹を推定することができます。
  • bpprは、BPPプログラムから系統樹を較正します。チュートリアルは https://dosreislab.github.io/2018/08/31/bppr.htmlにあります
  • mcmc3rは、PAMLスイートのMCMCtreeを用いた発散時間推定における限界尤度を計算します。また、限界尤度計算における誤差推定のためのブロックブートストラップを計算します。
  • tbeaは、ベイズ発散時間推定において、複数の事前処理(例:キャリブレーション分位数への適合密度、行列およびツリー形式の変換、行列連結)および後処理(例:事後ツリーサンプルの要約、事前推定値と事後推定値のプロット、分布類似性の測定)タスクを実行できます。分布のコレクションを要約するためのツール(たとえば、生物地理学的イベントの時間に対する複数の推定値、複数の推定値が利用可能なグループの起源時間)があり、これらは単独で、または二次カリブレーションを指定する方法として役立ちます。

ツリー・シミュレーション

  • TreeSimは、定率生死法による樹木のシミュレーションに使用できます。
  • phytoolsは、連続時間でも離散時間でも、さまざまな制約条件付きで生死木をシミュレートすることができます。
  • geigerは、樹木の生滅過程をシミュレートするのに使えます。
  • DDDは、多様性に依存した多様化過程における樹木のシミュレーションに用いることができます。
  • paleotreeは、化石の堆積、サンプリング、そこから生じる樹木、および観察された化石分類群に条件付けられた樹木をシミュレートすることができます。
  • FossilSimは、保存とサンプリングの力学的モデルの下で、既存の系統樹上の化石データをシミュレートするために使用することができます。
  • treatsは、誕生と死の系統樹と種の形質を共同でシミュレートするために使用できます。
  • TESSは、大量絶滅を含む、時間依存の種分化および/または絶滅率を持つ樹木をシミュレートすることができます。
  • paleobuddyは、環境依存性を含むユーザー定義の多様化ダイナミクスを幅広くシミュレートするための柔軟なインターフェースを提供します。
  • poweRbalは、指定された数の葉を持つ根付いた二分木を生成するための多数の樹木モデルを提供します。
  • TreeSimGMは、クレード依存の多様化プロセスのシミュレーションを含む、系統固有の種分化と絶滅のシフトを持つ一般的なBellman–Harrisモデルの下で系統樹をシミュレートするために使用できます。
  • simclockは、緩やかな時計モデル幾何学的ブラウン運動(相関率)および独立対数正規率の下で、部位ごとの置換数で枝の長さを持つ木をシミュレートします。

系統比較法

祖先の状態の再構築

  • ouchは、ブラウン運動モデルやOrnstein-Uhlenbeckモデルのもとで、根の祖先のキャラクタ状態を再構築するのに使用できるが、内部ノードの祖先状態は再構築できません。
  • markophyloは、制約条件付き置換率、部位間の速度分割、枝特異的速度、サンプリングバイアス、非定常根確率を組み込むことができるモデルで、離散的な文字タイプの広範なセットを適合させることができます。
  • phytoolsは、進化的量的遺伝学の閾値モデルや確率的キャラクタマッピングを含む複数のモデルのもとで、連続および離散キャラクタに対する祖先キャラクタ推定を行うことができます。
  • Rphyloparsは、種ごとに複数のオブザベーションや欠損データがあるデータセットに対して、祖先状態の再構築を行うことができます。
  • TreeSearchは、パーシモンのもとで、適用できないデータを考慮した文字のマッピングを行うことができます。
  • castorは、非常に大きな木の連続文字や離散文字を再構築するために使用することができます。

形質進化

  • apeまたはpicantecaperは、連続文字の独立コントラストを計算するために使用することができます。
    • caperは、また、brunchとcrunchアルゴリズムを実装しています。
  • geigerは、Pagelの変換と同様に、不等速度や一定時間ごとに変化する速度のモデルを含む、離散形質進化の解析を実行するために使用することができます。
  • corHMMは、系統発生の異なる部分で異なる遷移率クラスを可能にする離散的な特性進化の隠れマルコフモデルを適合するために使用できます。
  • phytoolsは、離散的および連続的なキャラクタ進化の複数のモデルをフィットするために使用できます。例えば、phytoolsは、ユーザーによって固定されたレジームとして指定された、またはデータ自体から推定された、レート不均質性の有無にかかわらずブラウンモデルをフィットします。また、phytoolsは、拡張 Mk モデル、レジームシフトを伴う不均質 Mk モデル、多形質形質進化モデル、隠れレートモデル、しきい値モデルなど、さまざまな離散形質進化モデルをフィットするために使用できます。
  • geigerpaleotreemotmotは、ブラウン運動モデルのフィッティングに使用できます。
  • RBrownieは、複数レートのブラウン運動モデルに適合させることができます。
  • geigerOUwieは、ブラウン運動からの逸脱を調査するために使用することができます。
  • mvMORPHは、ブラウン運動、アーリーバースト、ACDC、OU、シフトモデルを一変量または多変量データに当てはめることができます。
  • cauphyは、コーシー過程を用いて形質分布をモデル化する。
  • geigerおよびmotmotouchslouchsurfaceOUwieは、Ornstein-Uhlenbeck(OU)モデルの適合に使用できます。
    • ouchは、複数の平均を持つモデルを実装できます。
    • slouchは、複数の手段でモデルを実装できます。
    • surfaceは、ステップワイズAICを使用して複数の平均を持つモデルを実装できます。
    • slouchは、連続共変量を持つモデルを実装できます。
    • OUwieは、複数の平均、レート、およびアトラクション値を持つモデルを実装できます。
    • surfaceOUwieの機能を組み合わせたextendedSurfaceも参照してください。
  • motmotは、特定の時間にレートやモードが変化する連続的なモデルに適合させるために使用できます。
  • Rphyloparsは、上記のような連続モデルを、種ごとに複数のオブザベーションや欠損データのあるデータセットに適合させるために使用できます。
  • geigerは、ANOVAとMANOVAを系統学的に実装しています。
  • apePHYLOGRcapermotmotは、伝統的なGLSメソッド(GrafenまたはMartins)を実装しています。
  • apeは、系統的自己回帰の計算に使用できます(sensu Cheverudら)。
  • apeadephyloは、系統的自己相関(MoranのI)の計算に使用できます。
  • MCMCglmmは、GLMMを使って形質間の相関を評価するのに使えます。
  • phylolmは、系統的線形回帰や系統的ロジスティック回帰モデルを高速アルゴリズムでフィットすることができ、大きな木に適しています。
  • brmsは、連続形質と離散形質間の相関を調べることができ、種ごとに複数の測定値を組み込むことができます。
  • metaforは、系統構造を考慮したメタ分析を行うことができます。
  • pmcは、モンテカルロ法を用いて(geigerouchの)いくつかの形質モデルのモデル妥当性を評価します。
  • phyregは、Grafen (1989) の系統的回帰を実装しています。
  • geomorphは、系統学的な文脈で幾何学的形態分析を行うことができます。
  • dispRityは、経時的な視差の計算やその他の視差に関連する解析に使用できます。
  • MPSEMは、系統学的固有ベクトルマップを使用して、近縁種からの情報に基づいてある種の特徴を予測することができます。
  • convevolwindexは、系統上の収斂進化を調べることができます。
  • Claddisは、離散的な特徴データから形態学的多様性を測定したり、系統樹上で進化のテンポを測定するのに使用できます。
  • do3PCAは、ブラウン運動(BM)、オーンシュタイン・ウーレンベック(OU)、アーリーバースト(EB)、パゲルラムダなどの形質進化の代替モデルを実装する方法を含む、確率的系統発生主成分分析(PCA)の推定に使用できます。

形質シミュレーション

  • ouchgeigerapepicanteOUwiecaperphytoolsはブラウン運動を用いた連続形質のシミュレーションに使用できます。
  • ouchOUwieは、ハンセンモデル(OUの一種)を用いた連続形質のシミュレーションに使用できます。
  • geigerは、種分化モデルを使った連続形質のシミュレーションに、離散形質は連続時間マルコフモデル(時間によって率が変化するモデルを含む)を使ったシミュレーションに使用できます。
  • phangornは、DNAやアミノ酸をシミュレートできます。
  • phytoolsは、複数のモデルの下で離散形質進化をシミュレートできます。
  • phylolmは、木に沿った連続形質またはバイナリ形質をシミュレートできます。
  • Rphyloparsは、欠損オブザベーションのあるデータをシミュレートできます。
  • secsseは、多状態の観察形質と隠れ形質を持つ多様化モデルのシミュレーションに使用できます。
  • treatsは、種の形質と生死の系統樹を共同でシミュレートするために使用できます。

多角化分析

  • apephytoolsは、現存種のみが存在する場合の単純な誕生-死滅モデル(Neeら1994による)、生存モデル、適合度検定(多様化モデルの検定に適用)を適合させることができます。
  • TESSは、大量絶滅を含む、時間依存多様化モデルの下での木の尤度を計算することができます。
  • geigerは、正味の多様化率を計算できます(MagellonとSandersonによる)。
  • diversitreeは、BiSSE法(Maddisonら1997)とその後の改良(FitzJohnら2009)を実装しています。
  • hisseは、HiSSE (Beaulieu and O’Meara 2016)、GeoHiSSE (Caetanoら2018)、MuHiSSE (Nakov et al. 2019)、MiSSE (形質非依存)を含む様々な隠れ状態多様化モデルを実装しています。
  • caperは、ある形質が多様性に及ぼす影響を評価するマクロカイック検定を行うことができます。
  • DDDは、種分化や絶滅が多様性依存的であるかどうかを検定するために、多様性依存的な誕生-死過程に基づく最尤法を実装し、重要なイノベーションを特定し、密度依存的な過程をシミュレートします。
  • PBDは、遷延種分化モデルにおける樹木の尤度を計算することができます。
  • phyloTopは、樹木の形状を調査する機能を持ち、感染症の樹木に関する特別な機能とデータセットがあります。
  • RPANDA (archived)は、時間依存モデルや環境依存モデルなど、さまざまな多様化モデルを系統樹に当てはめるのに使えます。
  • picanteは、「equal splits」(ES)を含む様々な進化的識別性の測定値を計算するのに使用できます。
  • castorは、樹木から多様化率パラメータを推定するのに使われます。
  • secsseは、多状態の観察形質と隠れ形質を持つ多様化モデルの適合に使用できます。
  • phytoolsは、lineages-through-time (LTT)プロットを計算・表示し、Pybus and Harvey (2000)のガンマ統計量を計算することができます。
  • CRABSは、一致する系統発生-死亡モデルを探索するためのツールを備えています(Louca and Pennell 2020を参照)。

特定の分野における系統学

モルフォメトリクス

  • geomorphRRPPは、多変量表現型の進化傾向を評価するために使用できます。利用可能な手法には、系統的線形モデル(系統的アノバ/回帰など)、系統的部分最小二乗法、表現型の進化率の比較、系統的統合、系統的モジュール性などがあります。さらに、順序付けアプローチには、系統的PCA、系統的に整列された成分分析(PACA)の両方が含まれます。
  • mcmc3rは、PAMLスイートからMCMCtreeで、Bronwn運動下での枝の長さの推定と最終的な分岐時間の推定のために、行列縮小を用いて形質間の相関を除去します。詳しいチュートリアルはhttps://github.com/sabifo4/morphoを参照。

時系列と古生物学

  • paleoTSは、(ランダムウォークまたはスタシスモデルに基づく)系統進化のモデルの適合と比較(モデルテストアプローチを使用)のための尤度ベースのフレームワークを使用して古生物学的時系列データを分析するために使用することができます。
  • strapは、系統樹の層序解析ができます。
  • fbdRは、系統樹と化石の出現データから多様化率を推定するのに使えます。
  • tbeaは、層序の終点の信頼区間を推定するツールと、同じパラメーターを記述する複数の分布を要約するコードがあります。
  • Rには、汎用的な時系列モデリングのための他の豊富なオプションがあり、その多くはTimeSeriesタスクビューにリストされています。

群集生態学と微生物生態学

  • picanteveganSYNCSAphylotoolsPCPScaperDAMOCLESphyloregionは、系統学を群集生態学に利用するためのいくつかのツールを統合しています。
  • HMPTreesGUniFracは、微生物群集を比較するツールを提供します。
  • betapartは、ペアワイズ非類似度(距離行列)および複数サイトの非類似度を計算し、分類学的(発生率および存在量ベース)、機能的、系統的ベータ多様性のターンオーバーおよびネスト化された結果の構成要素を分離することができます。
  • phyloregionは、betapartを拡張し、より大規模なデータセットを可能にするスパースコミュニティ行列を可能にします。
  • adivは、種多様性、機能的多様性、系統的多様性、アルファ多様性、ベータ多様性、ガンマ多様性など、生物多様性のさまざまな指標を計算できます。
  • entropartは、アルファ多様性、ベータ多様性、ガンマ多様性を計算するだけでなく、Tsallisエントロピーに基づいて多様性を測定し、分割することができます。
  • metacoder (archived)は、metabarcodingのような最新のハイスループットシーケンスから生成されたような、大規模な分類学的データセットを扱うための関数を提供します。
  • phyloseqは、マイクロバイオームセンサスデータのインポート、保存、解析、グラフ表示を容易にするクラスとツールのセットを提供します。

系統気候モデリング

  • phyloclimは、系統気候モデリングのためのいくつかのツールを統合しています。

系統地理学と生物地理学

  • diversitreeは、2つの領域に基づく多様化解析のためのGeoSSE法を実装しています。
  • Herodotoolsは、空間的な生物多様性パターンの探索、祖先地域の再構築、エボリージョンの分類など、生物地理学的なマクロ進化解析を幅広く実行するために使用できます。
  • epm(EcoPhyloMapper)は、地理を横断する様々な形態学的・系統学的群集メトリクスを計算するために使用できます。
  • BioGeoBEARSは、歴史的な生物地理学(系統樹上の祖先の地理的範囲)の確率的推論だけでなく、範囲の進化に関するさまざまなモデルの比較も行うことができます。

疫学

系統疫学を含む疫学に有用なパッケージの詳細については、Epidemiologyタスクビューを参照してください。

オミックス

  • aphyloは、系統樹の遺伝子機能アノテーションを解析・予測するための解析的進化モデルを実装しています。
  • CALANGOは、定量/ランク変数に関連するアノテーション用語(Pfam ID、GO 用語、スーパーファミリーなど)を検索するために使用できます。
  • TreeExpは、系統的な遺伝子発現の比較解析に使用できます。
  • その他の有用なパッケージの詳細については、Omicsタスクビューを参照のこと。

遺伝子系統樹と種の区切り

  • splitsは、GMYC(Generalized Mixed Yule Coalescent)に基づき、遺伝子木を用いて種の限界を推定します。
  • P2C2M.GMYCは、GMYCモデルにおけるモデル違反を識別することができます。
  • MSCquartetsは、遺伝子ツリーのコレクションに表示されるカルテットを分析および使用するための方法を提供し、主に複数種の合体モデルの下で種のツリーまたはネットワークについて推論します。
  • bpprは、BPPを用いて競合する種木を比較するためのモデル選択を行うためのコントロールファイルを準備することができます。チュートリアルはhttps://dosreislab.github.io/2018/08/31/bppr.htmlです。

その他の便利なパッケージと雑多なもの

分類学

  • taxize (archived)は、種名の検証、分類学的階層の取得、名前の綴りの検証などの分類学的タスクのための一連のウェブAPIと対話することができます。
  • evobiRは、より高い分類レベルのツリーを作成する機能、NCBIやITISから分類ツリーをダウンロードする機能、その他様々な雑多な機能(文字進化のシミュレーション、D統計の計算など)が含まれています。

他のプログラムとの相互作用

  • apeは、様々な関数を通してPhyMLClustalT-CoffeeMuscleを呼び出すことができます。
  • geigerは、congruify関数を通してPATHd8を呼び出すことができます。
  • ipsは、MrBayes、Beast、RAxMLPartitionFinderMAFFTなど、配列アライメント、配列アライメントのマスキング、系統や祖先のキャラクタ状態の推定のための系統解析ソフトウェアをラップしており、Rから簡単に使用することができます。
  • beastierは、BEAST2を呼び出して系統解析を行うことができ、 beautierは(BEAUtiのように)BEAST2用のXML入力ファイルを生成することができ、 tracererは(Tracerのように)BEAST2の出力ファイルを解析・分析するために使用することができます。
    • babetteは、これらすべてのパッケージのラッパーです。
    • mcbetteは、babetteを使用して、一部のサイトモデルとクロックモデルに対するベイジアンモデルの比較を行うことができます。
  • Rphylipは、PHYLIP、パーシモン、尤度、距離による木推定、ブートストラップ、character evolutionなどの様々なプログラムをラップしています。
  • BoSSAは、様々なツールからの情報を使って、クエリー配列を参照木に配置することができます。
  • BAMMtoolsは、BAMMプログラムへのインターフェースであり、レートシフトの可視化、多様化モデルの比較、その他の機能を提供します。
  • Revticulateは、RからRevBayesと対話するために使用でき、RevGadgetsはRevBayesによって生成された出力を処理するために使用できます。
  • bpprは、BPPを使用して競合する種の木を比較するためのモデル選択を行うためのコントロールファイルを準備することができます。チュートリアルはhttps://dosreislab.github.io/2018/08/31/bppr.htmlです。
  • mcmc3rは、PAMLスイートからMCMCtreeを使った乖離時間推定を行うための制御ファイルを準備します。また、MCMCtreeの乖離時間推定で連続形質モデルを使うための形態学的アラインメントをphylip形式で生成します。
  • tbeaは、Beast2、MrBayes、RevBayes、MCMCTreeなどのベイジアン系統プログラムからのトレースファイルの解析後要約とプロットのためのコードがあります。

参考文献

  • Beaulieu, J.M. and O’Meara, B.C., 2016. Detecting hidden diversification shifts in models of trait-dependent speciation and extinction. Systematic Biology, 65(4): 583-601. doi:10.1093/sysbio/syw022.
  • Borregaard, M.K., Rahbek, C., Fjeldsaa, J., Parra, J.L., Whittaker, R.J. and Graham, C.H. 2014. Node-based analysis of species distributions. Methods in Ecology and Evolution 5(11): 1225-1235. doi:10.1111/2041-210X.12283.
  • Brazeau, M.D., Guillerme, T. and Smith, M.R. 2019. An algorithm for morphological phylogenetic analysis with inapplicable data. Systematic Biology, 68:619–631. doi:10.1093/sysbio/syy083.
  • Butler M.A., King A.A. 2004 Phylogenetic comparative analysis: A modeling approach for adaptive evolution. American Naturalist 164, 683-695. doi:10.1086/426002.
  • Caetano, D.S., B.C. O’Meara, and J.M. Beaulieu. 2018. Hidden state models improve state-dependent diversification approaches, including biogeographic models. Evolution, 72:2308-2324. doi:10.1111/evo.13602.
  • Cheverud J.M., Dow M.M., Leutenegger W. 1985 The quantitative assessment of phylogenetic constraints in comparative analyses: Sexual dimorphism in body weight among primates. Evolution 39, 1335-1351. doi:10.1111/j.1558-5646.1985.tb05699.x.
  • FitzJohn R.G., Maddison W.P., and Otto S.P. 2009. Estimating trait-dependent speciation and extinction rates from incompletely resolved phylogenies. Systematic Biology 58: 595-611. doi:10.1093/sysbio/syp067.
  • Garland T., Harvey P.H., Ives A.R. 1992 Procedures for the analysis of comparative data using phylogenetically independent contrasts. Systematic Biology 41, 18-32. doi:10.1093/sysbio/41.1.18.
  • Hansen T.F. 1997. Stabilizing selection and the comparative analysis of adaptation. Evolution 51: 1341-1351. doi:10.1111/j.1558-5646.1997.tb01457.x.
  • Louca, S. and Pennell, M. W. 2020. Extant timetrees are consistent with a myriad of diversification histories. Nature, 580(7804), 502-505. doi:10.1038/s41586-020-2176-1.
  • Maddison W.P., Midford P.E., and Otto S.P. 2007. Estimating a binary character’s effect on speciation and extinction. Systematic Biology 56: 701–710. doi:10.1080/10635150701607033.
  • Magallon S., Sanderson, M.J. 2001. Absolute Diversification Rates in Angiosperm Clades. Evolution 55(9):1762-1780. doi:10.1111/j.0014-3820.2001.tb00826.x.
  • Moore, B.R., Chan, K.M.A., Donoghue, M.J. (2004) Detecting diversification rate variation in supertrees. In Bininda-Emonds ORP (ed) Phylogenetic Supertrees: Combining Information to Reveal the Tree of Life, Kluwer Academic pgs 487-533. doi:10.1007/978-1-4020-2330-9_23.
  • Nakov, T., Beaulieu, J.M., and Alverson, A.J. 2019. Diatoms diversify and turn over faster in freshwater than marine environments. Evolution, 73: 2497-2511. doi:10.1111/evo.13832.
  • Nee S., May R.M., Harvey P.H. 1994. The reconstructed evolutionary process. Philosophical Transactions of the Royal Society of London Series B Biological Sciences 344: 305-311. doi:10.1098/rstb.1994.0068.
  • Pagel M. 1999. Inferring the historical patterns of biological evolution. Nature 401, 877-884. doi:10.1038/44766.
  • Pybus O.G., Harvey P.H. 2000. Testing macro-evolutionary models using incomplete molecular phylogenies. Proceedings of the Royal Society of London Series B Biological Sciences 267, 2267-2272. doi:10.1098/rspb.2000.1278.
  • Tarasov, S. 2023. New phylogenetic Markov models for inapplicable morphological characters. Systematic Biology, syad005. doi:10.1093/sysbio/syad005.
R言語 CRAN Task View:系統発生学