Maintainer: | John Fox |
Contact: | jfox at mcmaster.ca |
Version: | 2022-02-20 |
URL: | https://CRAN.R-project.org/view=SocialSciences |
社会科学者は社会科学に固有のものではありません。ほとんどが統計的方法の広い範囲を使用します。実際に、社会科学の中で最も統計的データ解析は、標準のRの配布の一部である基本機能と推奨パッケージでカバーされています。以下のパッケージの説明では、私は最初の言及で基本および推奨パッケージを特定します。特に「推奨」または「R-base」として識別されていないパッケージは、貢献パッケージです。
その他の関連タスクビュー:
基本と貢献パッケージ以外に、一般的に社会科学で用いられる方法の多くは、次のような他のCRANタスクビューに広くカバーされています。他のタスクのビューに存在する重複情報を最小化して、アルファベット順で表示します。
- Bayesian:混合効果モデルを含む社会科学者への関心のさまざまな設定でのベイズ推定の方法。
- EconometricsとFinance:エコノミストや金融アナリストに固有の関心の方法に加えて、これらのタスクビューは、一般的に使用される回帰モデルと方法、操作変数推定、パネルデータのモデル、およびいくつかの時系列モデルの様々なカバーしています。
- MetaAnalysis:主な研究の結果を結合するためのメタ分析の方法。各試験における個体のデータが利用可能である場合、メタ分析は、mixed-effects modelsを用いて行うことができます。
- Multivariate:幅広い、もしこれまで網羅から、統計モデルへのデータの視覚化から、多変量データの分析、多変量カテゴリカルデータのためのコレスポンデンス分析を含むためRに実装されたメソッドのカタログ。
- OfficialStatistics:公式統計だけでなく、surveyパッケージのような複雑なサンプル調査からのデータを収集、分析するための方法をカバーしています。
- Psychometrics:広範囲に、構造方程式モデリングなどの社会科学への関心の他のトピックと共に項目応答理論、多次元スケーリング、古典的テスト理論など、スケールの構成の方法を、カバーしています。
- Spatial:空間回帰分析を含む、空間データのモデリング、可視化、管理するための方法。
- SpatioTemporal:時間と位置の両方の情報をデータ分析、可視化、表現するための方法。
- Survival:推奨パッケージsurvivalに含まれたCox回帰のためのような基本的、標準的を越えて、生存分析のための方法(多くの場合、社会科学における「イベント履歴分析」と呼ばれます)。
- TimeSeries:時系列の回帰法を含む時系列データをモデリング、可視化、操作、表現するための方法。
この列挙はCRANタスクビューの約3分の含まれていることは注目に値します。また、社会科学者への潜在的な関心のある他のタスクのビューがあります(このような統計的なGraphicsタスクビューなど) 。私はあなたがlist of all task views on CRANを見ることを提案します。
線形および一般化線形モデル:
単変量および多変量線形モデルは、R-基本statsパッケージに、glm関数による一般化線形モデル、lm関数で適してしています。lmとglmオブジェクトに対してsummaryおよびplotの方法以上に、これらのオブジェクトをサポートする幅広い関数配列があります。
- statsパッケージの一般的なanova関数は、乖離表の分析および分散の連続(「I型」)分析を構築します。また、Fおよびネストされたモデルのカイ二乗尤度比検定を計算することができます。(回帰係数を返すようなcoef、係数共分散行列のためvcov 、残差、応答の近似値に適合などの他の標準的なジェネリクスのための方法と共にだけでなく分散分析の方法を持っていることは、Rにおける統計モデルの他のクラスの典型的なものです。)
- car(associated with Fox and Weisberg, An R Companion to Applied Regression, Second Edition , Sage, 2011) の一般的な分散分析関数は、線形、一般化線形、および回帰モデルの他の多くのクラスのための部分的なテスト、いわゆる「タイプII」と「タイプIII」を構築しています。
- 様々な仮設に対してカイ二乗Wald検定とFは、carのlinearHypothesis関数およびlmtestのcoeftestとwaldtest関数から利用できます。
- 標準Rの分布は、例えば、ハット値や、スチューデント化残差とクックの距離(hatvalues、rstudent、cooks.distanceはすべてstatsパッケージにある)として削除統計を含む、 線形および一般化線形モデル「diagnostics」のための優れた基本的な機能を提供しています。これらは、他のパッケージによって増強されます。
- グラフィカルな方法を強調するcarのいくつかの関数。(一般的な)分散拡大要因に対してvifのような数値診断に加えて、 例えば、(中でも)追加変数プロットに対してavPlots、コンポーネントプラス残差プロットに対してcrPlots。
- dr:SIR、SAVE、pHdを含む回帰の次元削減。
- lmtest:さまざまな診断テスト(例えば、不均一、非線形性、および自己相関 )を実装。
- rms:診断。
- influence.ME:混合効果モデルの影響力データの診断。
- いくつかのパッケージがデータに適合している線形および一般化線形モデルを解釈するために有用な機能が含まれています。
カテゴリとカウントデータの解析:
二項ロジットとプロビットモデルと同様に、ポアソン回帰や分割表(「過分散」二項およびポアソンデータのためのモデルを含む )のための対数線形モデルは、statsパッケージのglm関数で適合できます。過分散データに対して、aod、dispmod、負の二項GLMSをもつ推奨されるMASS(associated with Venables and Ripley, Modern Applied Statistics in S, Fourth Ed. , Springer, 2002 )のglm.nb関数を参照してください。psclは、データをカウントするためのハードル回帰モデルとゼロ拡大に適合するのための機能が含まれています。多項ロジットモデルは、MASSパッケージのpolr関数による順序ロジットとプロビットモデルと、推奨されるnnetでmultinom関数により適合しています。また、多項ロジットモデルのmlogit、多項プロビットモデルのMNP 、過分散多項データの分析のためのmultinomRobを参照してください。VGAMは、順序、非順序カテゴリカル応答のためのカウントデータのモデルを含む、 統一されたフレームワーク内での固定効果回帰モデルの非常に様々なフィッティングが可能です。
カテゴリカルカウントデータを分析するための他の注目すべき機能があります。
- R-base標準パッケージのtable関数、statsパッケージのxtabsとftable関数は、分割表を構築します。
- statsパッケージのchisq.testとfisher.testは、2要因分割表の独立性を検定するために使用することができます。
- MASSパッケージのloglmとloglin関数は、前者はglmのフロントエンドとして、後者は反復比例適合により、分割表に階層的対数線形モデルを適合します。
- 二項応答GLMs(便利、例えば、完全分離の場合)におけるバイアス削減に対してbrglmとlogistf、対数線形モデルの正確な検定のためのexactLoglinTest、条件付きロジスティック回帰についてのsurvivalのclogit関数、モザイクプロットを含むカテゴリデータのグラフィカル表示のためのvcdを参照してください。
- gnmは、一般化非線形モデルを推定し、例えば、モビリティテーブルに特定の専門的なモデルに合うように使用することができます。
- また、正方形テーブルのために様々な特殊なモデルを推定するためのcatspecを参照してください。
- 前述したように、Multivariateタスクビューは、多変量カテゴリカルデータの対応分析をカバーしています。
- 率及び割合に関するデータのベータ回帰のbetaregを参照してください、ここでは、密接にカテゴリデータに関連付けられています。
他の回帰モデル:
other task viewsで広範囲にカバーされたものに加えて、貢献されたパッケージでより非常に多様なモデル、baseと推奨されたパッケージによって提供される機能で非常に多様な回帰モデルを適合することが可能です。
- 非線形回帰:statsパッケージのnls関数は、最小二乗によって非線形モデルに適合します。nlstoolsは、nlsにより適合モデルを評価するためのいくつかの機能が含まれています。
- 混合効果モデル:線形(lme)と非線形(nlme)混合効果モデルに適合するPinheiro and Bates, Mixed-Effects Models in S and S-PLUS (Springer, 2000) に関連する推奨されるnlmeは、一般的に、階層と縦データのための社会科学で使用されます。
- 一般化推定方程式:geeとgeepackが一般化推定方程式による限界モデルに適しています。
- 相関名目または序多項応答のモデルのGEE推定のためのmultgeeを参照してください。
- ノンパラメトリック回帰分析:これはRの目立った強みの一つであります。標準Rの分布はstatsパッケージにloess.smoothとsmooth.splineの両方を含む散布図を平滑化するためのいくつかの機能が含まれています。また、statsパッケージで、loess関数は、局所的多項式回帰により、シンプルで複数のノンパラメトリック回帰モデルに適します。一般化加法モデルは、推奨されるmgcvとgamを含む、いくつかのパッケージでカバーされています。後者は、HastieとTibshirani、Generalized Additive Models (Chapman and Hall, 1990) に関連します。またVGAMを参照してください。この領域の他のいくつかの注目すべき貢献されたパッケージ次の通りです。
- 分位回帰:線形および非線形、ノンパラメトリック分位回帰するための方法が広くquantregで提供されています。
- 回帰スプライン: base-Rのsplinesパッケージでサポートされるパラメトリック回帰スプラインは(ノンパラメトリック平滑化スプラインとは対照的に) 、モデル式を採用する他の統計モデリング関数とlm、glmによって使用することができます。bs(B-spline)とns(natural spline)関数を参照してください。
- 非常に大規模なデータセット:biglmは、メモリに収まる大規模なデータセットに線形、一般線形モデルに適用することができます。
その他の統計的方法:
ここでは一般的に社会科学者によって使用される他の統計的手法の研究における実装の概略調査です。
- 欠損データ: いくつかのパッケージは、Shafer, Analysis of Incomplete Multivariate Data (Chapman and Hall, 1997) に関連した(顕著なエージング)mix、norm、panと、より新しくより積極的にメンテナンスされているAmelia、mi、mice、mitools(後者は多重帰属データセットから推論を描画するため)を含む、多重帰属によって欠損データを扱うためのメソッドを実装します。下の“Collections” で説明する一般的なHmiscの欠損データ帰属のためのいくつかの機能もあります。
- Psychometricsタスク・ビューで議論する構造方程式モデリングソフトウェアの一部が欠落しているデータと回帰モデルの最尤推定が可能です。
- VIMは、欠損値と帰属値を可視化するための機能を備えています。
- ブートストラップおよびその他のリサンプリング方法: Davison and Hinkley, Bootstrap Methods and Their Application (Cambridge, 1997) に関連した推奨されるbootは、ブートストラップのための優れた機能といくつかの関連した方法を持っています。
- また、注目すべきは、ブートストラップやジャックナイフのための機能を持っている Efron and Tibshirani, An Introduction to the Bootstrap (Chapman and Hall, 1993) に関連したbootstrapです。
- さらに、carのBootおよびbootCase関数、nlstoolsのnlsBoot、他にsimplebootも参照してください。
- モデルの選択: statsパッケージのstep関数およびMASSのより広範囲に適用可能なstepAIC関数は、様々な統計モデルに対して前方、後方、前後方のステップワイズ選択を実行します。
- leapsのregsubsets関数は、すべてのサブセット回帰を実行します。
- BMAは、ベイズモデルの平均化を行います。標準のAICとBIC関数もモデル選択に関連しています。
- これらのパッケージや機能を加えて、MachineLearningタスク・ビューを参照してください。
- ソーシャルネットワーク分析: ソーシャルネットワークの分析に有用ないくつかのパッケージがあります。
- 傾向スコアマッチング: Matching、MatchIt、PSAgraphicsとarm(Gelman and Hill, Data Analysis Using Regression and Multilevel/Hierarchical Models, Cambridge, 2007) のmatching関数を参照してください。
- 人口統計学的方法:demographyは、死亡率、受精率、および移民を分析するためと、人口予測のために、生命表を構築するための機能が含まれています。
機能コレクション:
社会科学者にとって関心のある関数(複数ドメインの典型)を含む、分類が困難なとても不均一である、いくつかのパッケージがあります。
- すでに、Venables and Ripley’s Modern Applied Statistics With S に関連した推奨されるMASSは、いくつかの言及をしました。この書籍に関連する他の推奨パッケージは、ニューラルネットワーク(しかしまた、上述したように、多項ロジスティック回帰モデル)に適したNNET、空間統計のためのspatial、 分類のための関数を含むclassです。
- また、回帰分析、データ探索、及びデータ変換をサポートする様々な機能を有している Fox and Weisberg, An R Companion to Applied Regression, Second Edition に関連したcarを述べました。
- Harrell, Regression Modeling Strategies, Second Edition (Springer, 2015) に関連したHmiscとrms(両方とも上記) は、データ操作、線形モデル、ロジスティック回帰モデル、および生存分析、それらの多くの「フロントエンド」またはRに他の機能の改良のための関数を提供しています。
謝辞:
Jangman Hongは、様々な具体的な提案をしてくれた他者として、このタスクビューの一般的な改正に貢献しました。
引用した他のタスクビューでカバーされていない重要な何かを省略している場合、または、新しいパッケージや関数を言及すべき場合は、お知らせください(please let me know)。
このタスクビューのコンパイルは、カナダの社会科学と人文科学研究会からの助成金によって部分的にサポートされていました。
ピンバック:R言語 CRAN Task Views | トライフィールズ