CRAN Task View: Genomics, Proteomics, Metabolomics, Transcriptomics, and Other Omicsについて、機械翻訳を交えて日本語化し掲載しております。

概要

Maintainer: Julie Aubert, Toby Dylan Hocking, Nathalie Vialaneix
Contact: julie.aubert at inrae.fr
Version: 2024-09-25
URL: https://CRAN.R-project.org/view=Omics
Source: https://github.com/cran-task-views/Omics/
Contributions: このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation: このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“Omics”, coreOnly = TRUE)は全てのコアパッケージをインストールし、ctv::update.views(“Omics”)はまだインストールしていない全てのパッケージと最新のものをインストールします。詳しくはCRAN Task View Initiativeを参照してください。

このタスクビューでは、アノテーションやデータベースに関連するものを含め、オミックスデータ解析に特化した最も重要なCRANパッケージに焦点を当てます。オミックスという用語は、ゲノミクス、プロテオミクス、メタボロミクス、トランスクリプトミクスなど、-omicsという接尾辞で終わる様々な生物学分野に関係しています。1年以上前に公開され、定期的に更新されているCRANパッケージを含みます。そのため、ごく最近のパッケージはまだ掲載されていないかもしれませんが、メンテナンスされていればすぐに掲載されるかもしれません。the Bioconductor projectからのいくつかの追加パッケージも含まれており、網羅的な説明ではなく、必見のパッケージやCRANパッケージでカバーされていないオミックスに焦点を当てたパッケージを紹介しています。補完的な情報は、PhylogeneticsMachineLearningAgricultureMissingDataタスクビューにもあります。統計遺伝学データ (DNAデータ、ハプロタイプ推定、集団構造、遺伝疫学)、系統遺伝学、系統ゲノミクスをカバーするパッケージはこのタスクビューではカバーされていないことに注意してください。さらに多くのパッケージが BioconductorR-ForgeGitHubにあります。

このリストに重要なパッケージが含まれていないと思われる場合は、管理者に電子メールを送信するか、上にリンクされているGitHubリポジトリで問題やプル リクエストを送信してください。

注釈とデータベース

  • データベース:
    • geneExpressionFromGEOを使用すると、GEOから遺伝子発現データセットを簡単にダウンロードできます。cbioportalRTCGAretrieverは、cBioPortalから臨床データとゲノム データを利用できるようにします。pinfsc50は、植物病原体Phytophthora infestansのゲノム データを提供します。
  • 機能アノテーション:
    • enrichRは、Enrichrデータベースへのインターフェースを提供します。
    • biomartrは、BioMartデータベースへのインターフェースを提供します。
    • msigdbrは、遺伝子セット強化分析用のMSigDBのインターフェースを提供します。
    • gprofiler2は、g:Profilerのインターフェースを提供します(機能強化分析、識別子の変換、または種間のオルソロジーを含みます)。
    • toprdataは、Ensemblゲノム ビルドからの遺伝子とエクソンの情報を提供します。
    • read.gbは、NCBIヌクレオチド データベースから .gb拡張子を持つレコードを読み取ることができます。
    • Map2NCBIは、NCBIデータベースにクエリを実行することにより、位置によって記述されたマーカーに関する情報を提供します。
    • PSSMCOOLは、Position Specific Scoring Matrix(PSSM)からのさまざまな特徴の計算が含まれています。
  • 遺伝子シンボル変換:
    • aliases2entrezは、ヒト遺伝子シンボルをNCBIデータベースから厳選された遺伝子entrezIDに変換します。
    • AnnotationBustRは、遺伝子名がアクセッション間で異なる可能性があるGenBankアノテーションからサブ配列をFASTAファイルに抽出します。
    • BEDは、生物学的実体のさまざまな識別子間のマッピングを提供するNeo4jデータベースのインターフェースです。 より具体的には、riceidconverterを使用してイネの生物学的識別子を変換できます。
    • babelgeneは、複数のデータベースからヒト遺伝子と非ヒト遺伝子のオーソログ/ホモログの間で変換します。
    • hgncは、HUGO遺伝子命名委員会の遺伝子シンボルと他のデータベースの遺伝子エントリーのマッピングをダウンロードしてインポートします。
  • 遺伝子セット/パスウェイの強化:
    • WebGestaltRは、WebGestaltを使用して、遺伝子セットの強化とネットワーク トポロジー分析を実行します。
    • GOxploreRは、遺伝子オントロジーを探索する方法を提供します。
    • GSAは、遺伝子セット濃縮解析の方法も提案しています。
    • VAMは、単一細胞 RNA-seq データを処理するために標準的な方法よりも適切に設計された遺伝子セット検査方法を提案しています。
    • tmodは、トランスクリプトームおよび代謝プロファイリング データの遺伝子セット濃縮分析のための機能を提供します。
    • sigoraは、パスウェイエンリッチメント分析における過剰表現バイアスを修正します。
    • permPATHは、順列テストを使用してパスウェイ強化分析を実行します。
    • CePaは、ネットワーク トポロジ情報とpathfindR(データパッケージpathfindR.dataに付属)を通じて重要なパスウェイを見つけることを目指しており、netgsaもネットワーク情報をエンリッチメント分析に使用します。
    • SlaPMEGは、縦断オミックスデータのパスウェイエンリッチメント分析を実行します。
    • topologyGSAは、遺伝子に関する与えられたパスウェイ情報を使用して遺伝子発現データテストを実行します。
    • diffEnrichは、実験的に導出された遺伝子またはタンパク質の 2つのグループ間の機能強化を比較します。
    • DysPIAは、DysPIADataを使用して、事前にランク付けされた遺伝子ペア リストに基づいて調節不全の経路を特定します。

ゲノミクス

  • 配列の操作と分析:
    • GenomicTools.fileHandlerは、最も一般的に使用されるゲノム データファイル タイプを処理するためのI/Oツールのコレクションです。
    • valrを使用すると、ゲノム間隔とシグナルを読み取り、操作できます。
    • KRISは、配列のバイオインフォマティクス分析のためのさまざまなルーチン機能を提供します。
    • bioseqは、生物学的(DNA、RNA、アミノ酸)配列を操作するためのツールボックスです。
    • ftrCOOLは、機械学習モデルの予測子として使用できるように、ヌクレオチドおよびペプチド配列から特徴を抽出し、それらを離散的な数値に変換します。
    • agvgdは、アミノ酸側鎖の特性とタンパク質の複数の配列アラインメントに基づいて「ミスセンス」置換を予測します。
    • vhicaを使用すると、通常の遺伝子と比較して、転移因子の水平移動を分岐から検出できます。
    • AnaCoDaは、ベイジアン フレームワークを使用してゲノム スケールのコドン データを分析するためのモデルのコレクションが含まれています。
    • BASiNETは、ネットワーク理論を使用して RNA 配列を分類する方法を実装しています。
    • MINTplatesは、tRNAおよびその他のゲノム配列の探索とアノテーションに特化したフレームワークです。
    • cumSegは、ゲノム配列などの平均シフト (区分的定数) モデルの変化点の数と位置を推定します。
  • 細胞分析:
    • sonicLengthは、DNA 断片から細胞クローンの存在量を推定します。 同様に、scoperはスペクトル クラスタリングを実行して、B 細胞データからクローンを識別します。
    • Signacは、単一細胞クロマチン データの分析と探索のためのフレームワークです。
    • popPCRを使用すると、蛍光活性化セルソーティング データ内の液滴を分類して、DNA ターゲット濃度を推定できます。
  • コピー数データ:
    • ioncopyは、アンプリコン シーケンス データのコピー数の計算を実装します。
    • ACNEは、NMFを用いてマイクロアレイから対立遺伝子特異的コピー数を提供します。
    • aroma.cnは、DNA コピー数データを正規化および分析するためのいくつかの方法を実装しており、PSCBSは親固有の DNA コピー数データの分析に焦点を当てています。
  • 突然変異と CRISPR:
    • sigminerは、ゲノム変更記録から変更署名を計算し、Rediscoverはポアソン二項モデルを使用して相互に排他的な突然変異を特定し、mutSignaturesは体細胞突然変異カタログから突然変異署名を特定します。
    • より一般的には、ICAMSは変異シグネチャを分析します。 また、ICBioMarkは、変異データに基づいて免疫療法バイオマーカーを特定します。
    • pathwayTMBは、新しい経路ベースの遺伝子パネルを使用して腫瘍変異負荷(TMB)を推定します。
    • CB2は、ベータ二項テストを使用したCRISPRプール画面分析の機能を提供します。

トランスクリプトミクス

マイクロアレイまたはその他の連続発現データ

  • 品質管理と正規化:
    • PODは、検出確率(POD)曲線と検出限界(LOD)を計算します。
    • NACHOnanostringrは、NanoString nCounter データの品質管理または正規化のためのツールを提供します。
    • MiRNAQCDは、miRNA発現データのQC制御のためのツールボックスです。
  • 統合ツール (GUI 付き):
    • maGUIは、マイクロアレイ データ (アノテーション、テスト、またはネットワーク推論を含む) を分析するためのグラフィカル ユーザー インターフェースを提供します。
    • depthTools(およびそのR commanderプラグインRcmdrPlugin.depthTools)は、遺伝子発現解析のためのデータの深さに基づく統計ツールのコレクションです。
    • OOMPAは、マイクロアレイおよびプロテオミクス解析用のCRANパッケージのコレクションを提供します。
    • seekerは、BrainArray、RMA、GEOqueryArrayExpressなど、トランスクリプトミクスのための様々なツールの標準インターフェースと並列化を提供します。
  • 視覚化:
    • tinyarrayは、GEOおよびTCGA発現データの視覚化専用です。
    • mpmは、さまざまな要因アプローチ(PCA を含む)を使用して、遺伝子発現データの探索的なグラフ分析を提供します。
  • 差分分析:
    • limmaは、マイクロアレイの差分分析にとって最も重要なパッケージの1つです。
    • TailRankは、マイクロアレイデータセットのテールランクノンパラメトリックテストを提供します。
    • SMVarは、遺伝子発現データの差分分析のための分散の構造モデルを実装します。
    • RNentropyは、情報理論に基づいた方法を実装して、遺伝子発現の重大な変動を検出します。
    • optBiomarkerは、2グループ アッセイにおけるバイオマーカーの最適な数を推定します。
    • leappは、テストにおける仮説のランキングへの影響に対抗するための潜在効果調整方法を提案しています。
    • MCMC.qpcrは、qPCRデータの正規化と差分分析のためのベイジアン アプローチを実装します。
    • よりグローバルな観点から、directPAは、マイクロアレイやRNA-seqデータなどのさまざまなオミクスから経路に対する複数の治療/条件の組み合わせの効果を特定できます。
    • ssize.fdrは、遺伝子発現検査に適切なサンプル サイズを計算する関数を提供し、NewmanOmicsはゲノム スケールのトランスクリプトミクスのためのNewmanスチューデント化範囲統計を実装します。
  • 時系列:
    • TcGSAおよびTGSは、長期的な遺伝子発現データ分析のためのメソッドを実装します。
    • GeneCycleは、遺伝子発現の時系列も分析して、周期的に発現する遺伝子を検出します。
    • BClustLonGは、縦方向の遺伝子発現データをクラスタリングするためのディリクレ過程混合モデルを実装します。
  • クラスタリング:
    • slfmは、ベイジアン スパース潜在因子モデルを使用して遺伝子発現解析を実行します。
    • lmQCMは、遺伝子共発現モジュールを発見するためのグラフベースの方法を実装します。
  • 予測:
    • LPSは、遺伝子発現シグネチャに対する線形予測スコア アプローチを実装します。
    • SMDICは、発現データから体細胞変異による免疫細胞の同定を実行します。
    • cubfitsは、配列および発現データを使用してタンパク質生産速度を予測します。

RNA-seqデータ

  • 汎用:
    • DESeq2edgeRは、RNA-seq前処理と差分解析にとって最も重要なパッケージの 1 つです。
  • マッピング:
    • MAAPERは、 3′ RNA-seqリードをポリA サイトに割り当てます。
  • デコンボリューション:
    • BisqueRNAInteRDは、バルク発現データから細胞タイプの存在量を推定する方法を提供します。
    • scBioは、バルク RNA-seq データ用のデコンボリューション アルゴリズムも提案していますが、1つの単一細胞参照サンプルが必要です。
    • より具体的には、imsigは固形腫瘍内の免疫亜集団細胞の存在量を推定します。
    • 最後に、omicwasは、バルクオミクス実験において細胞型に特異的な表現型との関連性をテストします。
  • 汎用ツール:
    • Tmiscは、遺伝子発現データを操作するためのユーティリティ関数のコレクションです。
  • シミュレーション:
    • seqgendiffは、さまざまな仮定の下で RNA-seq データをシミュレーションするフレームワークを提供し、SeqNetgraphsimは両方とも、制御ネットワークに基づいたRNA-seqデータのシミュレーションを提供します。
  • 差分分析:
    • PQLseqは、RNA-seq(およびその他のカウント データ)の差分分析における集団構造を説明する混合モデルを実装し、glmmSeqもトランスクリプトーム データセットでの反復測定に混合モデルを使用します。
    • NBPSeqは、RNA-seq データの差分分析に(それぞれ)ネガティブ二項テストとネガティブ二項ベータ テストを使用する 2つのパッケージです。
    • DiPALMは、さまざまな条件における遺伝子発現の時間経過の差分分析を可能にします。
    • RVAは、RNA-seqデータ、特に差分解析の結果の視覚化に特化しています。
    • 同様に、markerpenはバイオマーカーの発見にペナルティのある PCA を使用します。
    • 差分分析後、DGEobjおよびDGEobj.utilsは、差分遺伝子発現(DGE)分析結果を管理し、注釈を付けるための柔軟なコンテナーと関数ツールキットを提供します。
  • クラスタリング:
    • HTSClusterは、RNA-seqデータセットをクラスタリングするためのポアソン混合に基づくモデルが含まれています。
  • その他:
    • SIBERGは、二峰性発現遺伝子を同定するメソッドを実装します。
    • CeRNASeekは、miRNAスポンジを識別および分析するためのいくつかの機能を提供します。

シングルセルRNA-seq

  • 汎用ツール:
    • SeuratiCellR、およびpagoda2は、差分分析を含む単一細胞データ分析のための関数のコレクションが含まれています(最初のツールは SeuratObjectの構造に基づいています)。
    • sccoresingleCellHaystackは、単一セルの差分解析のメソッドも提供します。2つ目は KL ダイバージェンスに基づいています。
  • 品質管理:
    • SoupXは、単一細胞RNA-seqデータからmRNAコンタミネーションを除去する方法を提供します。
  • 細胞のクラスタリングとアノテーション:
    • conosscINSIGHTを使用して、さまざまな条件で取得された単一細胞 RNA-seq データセットのコレクション内の再発細胞クラスターを識別できます。
    • ADAPTSは、フローソートまたは単一細胞サンプルを使用して細胞タイプ署名行列を構築し、バルク遺伝子発現データをデコンボリューションします。
    • FiREは、膨大な単一細胞発現データから希少細胞を発見できます。
    • scSorterは、マーカー遺伝子に従って細胞を既知の細胞型に割り当て、SignacXはニューラル ネットワークを使用して細胞型を識別します。
    • clustermoleは、ヒトおよびマウスの単一細胞トランスクリプトーム データの細胞タイプを識別するために使用できます。
    • immunarchは、特にT細胞とT細胞を分析するために使用できます。
  • バイオマーカーの発見:
    • DIscBIOは、単一細胞トランスクリプトミクスにおけるバイオマーカー発見のための使いやすいマルチアルゴリズム パイプラインです。
  • 細胞の軌跡:
    • dynwraptreefit、および SCORPIUSは、単一細胞の遺伝子発現データから細胞の軌跡を推測します。
    • phateRを使用すると、単一細胞データを軌跡とともに視覚化できます。
  • その他:
    • rPanglaoDBは、PanglaoDBから単一細胞RNA配列データをダウンロードしてマージできます。

プロテオミクス

  • 汎用ツール:
    • ChemoSpecは、さまざまなプロテオミクス分光法データに対するトップダウンの探索的ケモメトリクスのための関数のコレクションが含まれています。
  • タンパク質と DNA の関係:
    • geno2proteoは、ENSEMBLアノテーションを使用して、任意のゲノム遺伝子座のDNAおよびタンパク質の配列を見つけることができます。
    • PredCRGは、概日遺伝子によってコードされるタンパク質を予測するための計算モデルが含まれています。
  • タンパク質の構造と配列:
    • compasは、タンパク質データ バンク(PDB)ファイルの3次元構造幾何学を操作および分析します。
    • bio3dは、タンパク質の構造、配列、ダイナミクス データを処理、整理、探索するためのツールが含まれています。
    • ampirは、ゲノム規模のタンパク質配列から抗菌ペプチドを予測するツールキットです。
    • ptmは、タンパク質の翻訳後修飾を解析するための機能が含まれています。
    • pbmは、タンパク質とリガンドの相互作用を分析するためのさまざまなモデルが含まれています。
  • 質量分析プロテオミクス:
    • wrProteoは、質量分析プロテオミクス データを分析するための関数のコレクションが含まれています。
    • aLFQは、LC-MS/MS用の最も一般的な絶対ラベルフリータンパク質存在量推定方法を実装し、iqは質量分析用のタンパク質定量も実装します。
    • protVizは、小さな質量分析プロテオーム データセットを視覚化して分析するための関数が含まれています。
    • PTXQCypsscはどちらも、MaxQuant(大規模な質量分析データセット用の定量的プロテオミクス ツール)の出力を分析するように設計されています。
    • prottiは、SpectronautまたはProteome Discovererの出力に加えて、MaxQuantの出力も分析できます。
    • prozorは、ペプチドスペクトルの一致を説明する最小のタンパク質セットを決定します。
    • net4pgは、ショットガン プロテオミクスにおける識別の曖昧さを処理するメソッドを実装しています。
  • 代入:
    • いくつかのパッケージはプロテオミクス データセットの代入のための関数を実装しています: imputeLCMD(左打ち切り代入)、imp4p(欠損値メカニズムの推定を含む)、および mi4p(多重代入)。MissingDataビューも参照してください。
  • 視覚化:
    • cp4pは、FDR制御手順の仮定を確認し、調整されたp値を計算するためのプロテオミクスのキャリブレーション プロットを提供します。
    • LSPFPは、ショットガン プロテオミクス分析からのペプチドのプロットを提供します。
  • 予測:
    • krmは、タンパク質配列のカーネルを含むカーネルベースの回帰手法専用のパッケージです。
  • 単一細胞タンパク質データ(CITE-seq):
    • dsbは、液滴単一細胞プロテオミクス データを正規化およびノイズ除去する機能が含まれています。

メタボロミクス

  • データ:
    • metaboDataは、さまざまなメタボロミクス データセットの例が含まれています。
  • 汎用ツール:
    • omuは、メタボロミクス解析ツール(視覚化を含む)を提供し、lilikoiは正規化やさまざまな予測方法を含むメタボロミクス用のツール セットです。
    • MetabolomicsBasicsは、メタボロミクス データを調査するための基本機能(ピーク・ピッキング、デコンボリューションなど)も含まれています。
  • 同定:
    • erahは、GC-MS 非ターゲットメタボロミクスにおけるスペクトル ライブラリー マッチングによって代謝産物を同定するために使用できます。
  • テストとバイオマーカーの発見:
    • iCARHは、バイオマーカーの発見を含む経時的なメタボローム データセットの分析方法を実装します。
    • MetabolicSurvは、メタボロミクス シグネチャのバイオマーカー発見および生存分析メソッドが含まれています。
    • MetSizeRは、メタボロミクス実験におけるターゲット統計検出力のサンプル サイズを計算します。
  • クラスタリング:
    • RAMClustRは、質量分析メタボロミクス データ用のクラスタリング アルゴリズムが含まれています。
  • 磁束データ:
    • fbarは、磁束バランス分析および関連する代謝モデリング技術のためのツールキットです。

その他のオミクス

  • メチル化:
    • BiasCorrectorは、DNAメチル化解析における測定バイアスを補正するための GUI です。
    • rBiasCorrectionは、メチル化データのバイアス補正を実行します。
    • TCAは、大量の状態特異的なDNAメチル化データを状態および個々の特異的なメチル化レベルにデコンボリューションし、表現型との関連を検出できます。
  • Hi-C:
    • InteractionSetは、Hi-Cデータに適合したデータ構造を提供するBioconductorパッケージです。
    • HiTCは、Hi-Cデータを操作および分析するためのパッケージであり、diffHicはHi-C実験の差分分析に焦点を当てています。
  • リピドミクス:
    • interepは、繰り返し測定を行う高次元リピドミクス データセットで相互作用解析を実行できます。
    • flippantは、蛍光アッセイ(亜ジチオン酸スクランブラーゼアッセイ)に基づく脂質スクランブリング活性の分析を可能にします。
  • 細菌ゲノミクス、マイクロバイオーム、メタゲノミクス:
    • phyloseqは、ハイスループットのマイクロバイオーム データの分析にとって最も重要なパッケージの 1 つです。
    • BarcodingRは、DNAバーコードを使用して種の識別を実行します。
    • enveomics.Rは、微生物生態学およびゲノミクスおよびメタゲノミクスのその他のアプリケーションのための関数のコレクションが含まれており、Enveomicsコレクションのコンパニオン パッケージです。
  • AIRR-seq / Rep-seq:
    • alakazamは、ハイスループットの適応免疫受容体レパトア シーケンス(AIRR-Seq; Rep-Seq)解析の方法を提供します。

マルチオミクス

  • 一般:
    • MOFA2mixOmicsは、マルチオミクス データセットを統合するための最も重要な2つのパッケージの1つです。
  • 単一オミクス解析:
    • wrMiscは、オミクス データを操作し、さまざまな統計解析(正規化や一部の統計検定を含む)を実行するためのツールのコレクションが含まれています。
    • integIRTyは、さまざまなオミクスにわたってがんにおいて一貫して変化する遺伝子を同定する方法を提供します。
  • パスウェイ分析:
    • ActivePathwaysは、p値を組み合わせて、強化されたパスウェイとプロセスを取得します。
    • ICDSは、複数のオミクスの統合に基づいて、がんにおいて機能不全に陥っている経路を特定します。
  • 探索的統合分析:
    • o2plsdaは、マルチオミックスデータ統合のためにO2PLS-DAを実行する機能を提供します。
    • 同様に、CovCombRは、共分散ベースの方法を通じて異種データセットを結合するために使用でき、PMAは複数のオミクスデータセットを統合するためのスパース正準相関分析を提案しています。
    • CovCombRおよびpackMBPLSDAは、共分散ベースの方法(2番目の方法はPLS-DAに基づく)を通じて異種データセットを組み合わせる他の方法が含まれており、MOSSはスパースSVDベースのマルチオミクス統合方法を提供します。
    • semmcmcは、構造方程式モデリング(SEM)に基づくオミクス統合手法も提供し、IMIXはマルチオミクス データ統合にガウス混合を使用します。
    • solvebioは、オミクス データ統合を目的とした生物医学知識ハブであるSolveBio APIのバインディングです。
    • より具体的には、desiRは遺伝子、タンパク質、代謝物のデータをランク付け、選択、統合する機能を提供します。
  • 予測:
    • prioritylassoは、オミックスの異なる優先順位を使用する連続したLassoモデルを使用して、複数のオミックスから予測を実行します。
  • クラスタリング:
    • PINSPlusは、オミクス データ統合のための堅牢なクラスタリング手法を実装しています。
    • LUCIDusは、統合クラスタリングのためのMLベースの手法が含まれています。
    • RHclustは、k-meansベースのマルチオミックスクラスタリングを提案しています。
  • メタ分析:
    • metaRNASeqmetaMAは、それぞれRNA-seqデータとマイクロアレイ データのメタ分析のためのp値組み合わせ技術を実装します。
    • MetaIntegratorは、遺伝子発現データのメタ分析のためのパイプラインを提供します。

特定のタスク

品質管理と正規化

  • lineuplineup2は、オミクスデータ内のサンプルの取り違えを検出および修正するためのツールが含まれています。

ChIP-seqやATAC-seqなどのデータのピーク呼び出しと分析

  • PeakSegOptimalは、ピーク呼び出しに適した制約を含むカウント データのポアソン分布に基づく変化点検出メソッドを実装し、PeakSegDiskは、ディスク上のストレージを使用してメソッドの大規模な実装を提供します。
  • PeakSegJointはジョイントピーク検出を実装し、PeakErrorはアノテーションされた領域ラベルに関するピーク呼び出しの真陽性と偽陽性を計算します。

複数のテスト

  • bayefdrは、ベイジアン推定と予想誤検出率の最適化を実装し、hommelはSimesの不等式を厳密にテストする方法が含まれています。
  • rSEAは、FWERを制御する同時濃縮分析を実行します。
  • より具体的には、RobustRankAggregはランク リスト、特に遺伝子のリストを集約する方法を提供し、DiscreteFDRは離散テストに適合した複数のテスト手順を実装します。

高次元データの正則化

  • whiteningは、高次元オミクスデータに対するホワイトニング手法とCCAを実装します。
  • mpmiは、大規模なゲノム データセット内の変数のペアを比較するためにカーネル スムージング アプローチを使用します。
  • hsstanは、高次元データセットでのバイオマーカーの発見に階層的ベイジアン アプローチを使用します。
  • supclustは、潜在的に多くの予測子変数(「PELORA」や「WILMA」を含む)の教師ありクラスタリングのためのメソッドを実装します。

ネットワーク

  • 遺伝子ネットワーク推論:
    • WGCNAは、相関ベースの方法を使用して遺伝子ネットワーク推論を実装し、GeneNetはガウス グラフィカル モデルを使用して遺伝子ネットワーク推論を実装します。
    • RGBMは、マイクロアレイおよびRNA-seqデータからのネットワーク推論のためのブートストラップ ベースのアルゴリズムを実装します。
    • RNAseqNetは、対数線形ポアソン モデルを使用したネットワーク推論を実装し、行方不明の個人を処理できます。
    • Patternsは、単一または複数の関節オミクス向けに設計されたアプローチを使用して生物学的ネットワークを推論するためのツールが含まれています。
    • parmigeneは、相互情報量法を使用してネットワーク推論を実行します。
    • networkABCは、近似ベイジアン計算を使用してネットワーク推論を実行します。
    • JSparOは、細胞運命変換のための遺伝子ネットワーク推論のための結合スパース最適化を実装します。
    • Cascadeは、CascadeDataで提供される実験データを使用して、カスケード ネットワークでの遺伝子選択、リバース エンジニアリング、予測を可能にするモデリング ツールを実装します。
    • miicは、情報理論を使用して因果ネットワークと非因果ネットワークを推論するために使用できます。
  • 単一細胞データ:
    • scLinkおよびscTenifoldNetを使用して、単一細胞データから共発現ネットワークを推測できます。後者には、これらのネットワークを異なる条件間で比較するアプローチが含まれています。
  • 差次的分析:
    • scTenifoldKnkは、共発現ネットワークを使用して、仮想ノックアウト アプローチによって差次的に制御される遺伝子を同定し、SIMMSは分子プロファイルと機能的ネットワーク(PPIネットワークなど)の統合を可能にして、生存データからバイオマーカーを検出します。
    • 同様に、regnetは、高次元の生物学的データで変数選択を実行するためのネットワークベースの正規化モデルを提供します。
    • より一般的には、DiffCorrは相関ネットワーク内の2つの実験条件間のパターン変化を識別するメソッドを実装しています。
    • GANPAはパスウェイ濃縮解析のためのネットワークベースの遺伝子重み付けアルゴリズムで、GANPAdataコンパニオンデータセットパッケージがあります。
      • DRaWRは、与えられた遺伝子セットに関連する遺伝子や特性をランク付けするネットワークベースの手法です。
  • PPI ネットワーク:
    • prioGeneを使用して、疾患固有のPPIネットワークを定義し、候補遺伝子の優先順位を推定することができます。
    • マルチオミクスネットワーク:SmCCNetは、正準相関に基づいたフレームワークを用いて、表現型に特化したマルチオミクスを構築します。

クラスタリング

  • EMMIXgeneは、マイクロアレイ発現データのクラスタリングのための混合モデルベースのアプローチを実装し、ORIClustは、短期間の経時変化または用量反応マイクロアレイ遺伝子発現のクラスタリングを実行します。
  • OptCirClustは、環状データ(環状DNA やRNA分子など)のクラスタリングを実行し、adjclustはゲノム制約に適応した制約付きクラスタリングを実行します。 後者にはHi-Cデータセットのラッパーが含まれています。

可視化

  • シーケンス:
    • JBrowseRは、JBrowse 2ゲノム ブラウザにRインターフェースを提供します。
    • chromoMapは、あらゆる生物の染色体または染色体領域のインタラクティブなゲノム視覚化を提供します。
    • 同様に、seqinrは生物学的配列(DNA およびタンパク質)データの視覚化を提供します。
  • ゲノム スケール データ:
    • genoPlotRは、出版可能なさまざまな遺伝子またはゲノム マップ図を作成します。
    • 同様に、valrはゲノム規模のデータを視覚化するために使用でき、RCircosはゲノム視覚化のための 2D circosプロットのコレクションが含まれ、RIdeogramはゲノム規模のデータを表意文字で表示する機能を提供します。
    • より具体的には、gggenesは、ggplot2アプローチを使用して遺伝子アロー マップを描画します。
    • VALERIEを使用すると、単一細胞データから選択的スプライシング イベントを視覚化できます。
  • バイオマーカー発見手法の結果:
    • func2visは、ConsensusPathDBを使用して、濃縮された遺伝子オントロジー(GO)用語、タンパク質複合体、および経路の視覚化とクリーンアップを提供します。
    • statVisualは、トランスレーショナル医療とバイオマーカー発見のための視覚化を実装します。
    • 同様に、volcano3Dは、3クラスの問題に対するバイオマーカーの差分分析結果を視覚化するのに適した3D火山および極点プロットを提供します。
  • マルチオミクス:
    • OmicNavigatorは、オミクス データの視覚化に特化しています。
    • wilsonは、対話型の方法でマルチオミクス データを視覚化することに特化したWebベースのツールです。
  • その他:
    • BioInsightは、カウント マトリックスに存在するさまざまなRNAバイオタイプの存在量をフィルター処理してプロットします。

欠損値

  • SurrogateRegressionは、相関関係のあるサロゲート結果から情報を借用しながら、部分的に欠落しているターゲット結果の推定と推論を実行します。

特定の応用分野

  • がん:
    • oncoPredictは、細胞株スクリーニング データからバイオマーカーを発見します。
    • tidyestimateは、発現データから腫瘍の純度を推測します。
    • Allspiceは、急性リンパ芽球性白血病(ALL)の患者をRNAからプロファイリングするための訓練を受けた分類器を提供します。
    • driveRは、ゲノム情報と事前の生物学的知識を組み合わせて、がんドライバー遺伝子の優先順位付けを行うためのゲノムデータのパーソナライズされた分析またはバッチ分析のためのツールです。
    • DRomicsは、試験用量が多数ある用量反応設計を使用して取得されたオミクス データに特化しています。
  • 栄養:
    • BRINDAは、炎症と貧血の栄養決定要因を反映するバイオマーカーを計算します。
R言語 CRAN Task View:ゲノミクス、プロテオミクス、メタボロミクス、トランスクリプトミクス、その他のオミクス