CRAN Task View: Functional Data Analysisについて、機械翻訳を交えて日本語化し掲載しております。

概要

Maintainer: Fabian Scheipl, Eleonora Arnone, Giles Hooker, J. Derek Tucker, Julia Wrobel
Contact: fabian.scheipl at stat.uni-muenchen.de
Version: 2024-06-17
URL: https://CRAN.R-project.org/view=FunctionalData
Source: https://github.com/cran-task-views/FunctionalData/
Contributions: このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation: このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば ctv::install.views(“FunctionalData”, coreOnly = TRUE)は全てのコアパッケージをインストールし、 ctv::update.views(“FunctionalData”)はまだインストールされていない最新状態のパッケージを全てインストールします。詳しくはCRAN Task View Initiativeを参照してください。

関数データ分析(FDA)は、「連続体で変化する曲線、表面、その他のものに関する情報を提供する」 データを扱います。このタスクビューは、この急速に発展する分野で利用可能なパッケージをカタログ化します。

実際には、時系列データと機能データにはかなりの重複があるため、TimeSeriesタスクビューにリストされている多くのパッケージは機能データにも有用であり、その逆もまた同様です。

一般的な関数データ分析

  • fdaは、平滑化、プロット、単純回帰モデルに対応する関数を持つ機能データ用のオブジェクトタイプを提供します(2009, doi:10.1007/978-0-387-98185-7)。
  • fdapaceは、機能的な回帰と相関、縦方向のデータ解析、実現された軌道のサンプルからの確率的プロセスの解析、および基礎となる力学の解析のために、まばらにまたは密にサンプリングされたランダム軌道および時間経過のための機能主成分ベースの方法を提供します。
  • fdasrvfは、平方根速度フレームワーク(Srivastavaら、2011)を使用して、多次元関数または一次元関数の整列、PCA、および回帰を実行します。このフレームワークは、位相と振幅の分離を介して機能的データの弾性解析を可能にします。
  • uscは、機能的共変量および機能的な分散分析を用いて、深さ測定、外れ値検出、教師なしおよび教師付き分類(単変量、ノンパラメトリック)回帰モデルなどの機能的データの探索的および記述的分析のためのルーチンを提供します。
  • fdsは、機能データを含む19のデータセットが含まれています。
  • funDataは、一変量および多変量の機能データ、画像データ、ユーティリティ関数のためのS4クラスを提供します。
  • tfは、算術・要約メソッド、導出、積分、平滑化、プロット、データのインポートおよびエクスポート、データ操作(サブセット、サブアサインメント、ズーム、機能的特徴の抽出)を備えた機能データ用のS3ベクトルデータ型を提供し、機能変数とスカラー変数の共同分析のためのデータフレームにそのようなベクトルを含めることができます。

関数データの推論手法

汎用回帰と分類

  • FDboostは、成分ごとの勾配ブースティング・アルゴリズムによって適合されるスカラ・オン・ファンクション、ファンクション・オン・スカラ、ファンクション・オン・ファンクション回帰モデルのための、柔軟な加法回帰モ デルと変数選択を実装しています。
  • mlr3fdaは、tf’で定義された不規則な関数データと規則的な関数データをサポートし、関数列の前処理と標準的な機械学習アルゴリズムで使用されるスカラー特徴を抽出するための「PipeOps」を提供し、関数データ解析のためにmlr3’を拡張します。
  • refundは、ラフネスペナルティ付き関数オンスカラー、関数スカラーオン関数、関数オン関数回帰のスプラインベースのメソッドと、関数型PCAのメソッドを提供します。 一部の機能は画像データに適用できます。
  • dbstatsは、説明情報が個体間の距離の行列としてコード化される予測方法を提供します。これには、ローカル推定に基づいて、lmとglmの距離ベースバージョンと両方のノンパラメトリックバージョンが含まれます。これらの方法を関数データに適用するためには、観察された関数データ間の距離マトリックスを計算すれば十分です。

特殊なモデルとアプリケーション

  • cfdaは、各状態のエンコーディング(実機能変数)を計算することで、カテゴリー別機能データの分析を実装しています。
  • denseFLMMsparseFLMMは,密にサンプリングされたデータと疎にサンプリングされたデータに対して,それぞれ関数型主成分分析に基づいて関数型線形混合モデルを推定します。
  • fastFMMは、関数混合モデルをフィットするための高速な一変量推論アプローチを実装しています。
  • fdaconcurは、密な観測データと疎な観測データの両方に対して、同時および履歴インデックスモデルを実装しています。
  • fdaPDEは、有限要素法により離散化された偏微分正則化された回帰モデルに基づいて、多次元複雑領域上の機能的および空間的データの統計解析を実装しています。
  • GPFDAは、平均構造として関数回帰を使用し、共分散構造としてガウスプロセスを使用します。
  • growfunctionsは、ディリクレ(Dirichlet)プロセス混合物が関数のサブグループ化が同じ共分散または精度パラメータを共有することを可能にする、以前のガウスプロセス(GP)または固有ガウスマルコフランダムフィールド(iGMRF)のいずれかによる時間インデックス関数の集合を推定します。GPおよびiGMRFは、複数のトレンドおよび季節性のいずれかまたは両方を表現する任意の数の加法的共分散または精度の項をそれぞれサポートします。
  • multifammは、一変量スパース関数回帰モデルと多変量関数主成分分析に基づく多変量関数加法混合モデル(multiFAMM)を実装しています(Volkmannら、2012, doi:10.48550/arXiv.2103.06606)。
  • robflregは、ロバストな部分最小二乗分解に基づく関数型線形回帰(スカラーオンファンクション、ファンクションオンファンクション)のためのロバストな手法を実装しています。
  • slassoは、centofantiら(2020, doi:10.48550/arXiv.2007.00529)のように、関数対関数の線形回帰モデルに対する滑らかなLASSO推定器を実装しています。
  • splinetreeは、スプライン投影法を使用して、縦断データまたは機能データの回帰ツリーとランダムフォレストを実装します。

統計的検定

  • fdANOVAは、単変量および多変量機能データの分散分析手順を実装しています。
  • fdatestは、さまざまな基底拡張(つまり、Bスプライン、フーリエ、および位相振幅フーリエ)を使用して、異なるフレームワーク(つまり、1つまたは2つの母集団フレームワーク、関数線形モデル)の関数データのインターバルテスト手順の実装を提供します。
  • gmtFDは、一変量および多変量機能データに対する一般的な多重検定を実装しています。
  • multiFANOVAは、機能データの一元配置および多元配置分散分析に対する多重対比検定を実装しています。
  • rmfanovaは、反復実験における平均関数の等質性または一対比較(ポストホック分析)を検定する機能的反復測定分析のための統計的検定を実装しています。
  • rofanovaは、ロバスト機能分散分析を実装しています(Centofantiら、2021, doi:10.48550/arXiv.2112.10643)。
  • SCBmeanfdは、機能データの平均を推定および推測する方法を提供します。この方法には、同時信頼帯、局所多項式フィッティング、プラグインおよび交差検証による帯域幅選択、パラメトリックモデルの適合度テスト、2サンプル問題の等価テスト、およびプロット関数が含まれます。

関数データのクラスタリング

  • fdaclusterは、k-means、階層的凝集型、DBSCANクラスタリングを機能データに対して実装しており、曲線の位置合わせとクラスタリングを共同で行うことができます。
  • funFEMのアルゴリズム(Bouveyronら、2014)は、共通かつ識別可能な関数部分空間内の曲線をモデル化することによって、関数データをクラスタリングすることを可能にします。
  • funLBMは、機能データのモデルベースの共同クラスタリングを実装します。つまり、行列の各エントリが関数または時系列であるデータ行列の行と列を同時にクラスタリングします。

関数データの登録と整列

  • elasdicsは、2次元曲線の整列と、平方根-速度フレームワークで定義された弾性距離に基づいて平均曲線を計算する関数を提供します(Steyerら、2021, doi:10.48550/arXiv.2104.11039)。
  • elastesは、特にこれらの曲線がまばらで不規則にしか観測されない設定に対して、開いた平面曲線の集合に対する関数的弾性形状平均を計算するための関数を提供しています(Stöckerら、2022, doi:10.48550/arXiv.2203.10522)。
  • fdasrvfは、平方根速度フレームワーク(Srivastavaら、2011)を使用して、多次元関数または一次元関数の整列、PCA、および回帰を実行します。このフレームワークは、位相と振幅の分離を介して関数データの弾性解析を可能にします。
  • registrは、(不完全な)非ガウス関数データに対する登録を提供します。
  • warpMixは、Bスプラインベースの混合効果モデルを使用して、機能データのワーピング(アライメント)を実装します。

関数データの時系列

  • ftsaは、関数時系列の可視化、モデリング、予測、および仮説検定のための関数を提供します。
  • ftsspecは、関数時系列(FTS)のスペクトル密度演算子を推定し、2つの関数時系列のスペクトル密度演算子を比較する関数を提供し、周波数およびカーブ長に沿ったスペクトル密度演算子の違いを検出できます。
  • freqdomは、多変量および関数時系列に周波数領域の方法を提供し、時間的依存の存在下で動的関数主成分および関数回帰を実装します。
  • fdaは、fdaからのオブジェクトのfreqdomの機能のラッパーを提供します。
  • pcdpcaは、多変量動的主成分を定期的に相関する多変量および関数時系列に拡張します。
  • fdaACFは、機能的時系列の自己相関関数を使用して、特定の機能的時系列のラグ間のシリアル相関を定量化する関数が含まれています。自己相関関数は、系列の遅延共分散演算子のL2ノルムに基づいています。強力な関数ホワイトノイズを想定して、自己相関関数の分布を推定するための関数を使用できます。提案された関数の機能の簡単な説明は、com/GMestreM/fdaACFにあります。

可視化と探索的データ分析

  • rainbowは、機能データ表示、探索的分析、外れ値検出のための機能とデータセットが含まれています。
  • shinyは、S3を使用し、c.f. Wrobelら (2016, doi:10.1002/sta4.109)に記載されているrefundパッケージを使用して生成された機能的データ解析のためのインタラクティブな可視化のShynyアプリを生成するplot_shiny()を提供します。
  • fdaoutlier は、機能データの外れ値を検出するための関数群を提供します。実装されているメソッドには、方向性のある外れ値、MS-plot、Total Variation Depth、Sequential Transformationなどがあります。

その他

  • fdは、応答が機能的性質を持つ場合に、フルコンフォーマル、スプリットコンフォーマル、マルチスプリットコンフォーマル予測領域を計算します。
  • ddalphaは、深さベースの分類とデータ深度の計算を実装しています。
  • faceはFast Covariance Estimation for Sparse Functional Dataの論文を実装しています(f. Statistics and Computing, doi:10.1007/s11222-017-9744-8)。
  • fdadensityは、特殊な関数主成分分析を使用して密度関数のサンプルを解析するためのPetersenとMueller(2016)(doi:10.1214/15-AOS1363)を実装しています。
  • fdaPOIFD は、可視化、外れ値検出、分類への応用を伴う、部分的に観測された統合された機能深度を実装しています(Elíasら、2022, doi:10.1080/10618600.2022.2070171)。
  • frechetは、L^2-Wasserstein空間の分布や共分散行列など、非ユークリッド応答のためのフレシェ回帰を実装しています(Petersen & Müller 2019, doi:10.1214/17-AOS1624)。
  • funchartsは、機能データの統計的プロセス監視のための機能管理図を提供します(Capezzaら、2023, doi:10.1080/00224065.2023.2219012)。
  • mfacesは、多変量の疎な機能データや縦断的データに対して、高速共分散推定による多変量機能主成分分析を実装しています(f Li, Xiao, and Luo (2020) doi:10.1002/sta4.245)。
  • MFPCAは、異なる次元の領域で観測されたデータに対して多変量FPCAを計算します(f. Happ and Greven (2018) doi:10.1080/01621459.2016.1273115)。

このリストに追加や改善を提案したい場合は、GitHub repositoryにissueまたはプルリクエストを提出してください。

 

R言語 CRAN Task View:関数データ解析