CRAN Task View: Official Statistics & Survey Methodologyについて、機械翻訳を交えて日本語化し掲載しております。

概要

Maintainer: Matthias Templ, Alexander Kowarik, Tobias Schoch
Contact: matthias.templ at gmail.com
Version: 2024-04-09
URL: https://CRAN.R-project.org/view=OfficialStatistics
Source: https://github.com/cran-task-views/OfficialStatistics/
Contributions: このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。
Installation: このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば、ctv::install.views(“OfficialStatistics”, coreOnly = TRUE)はすべてのコアパッケージをインストールし、ctv::update.views(“OfficialStatistics”)はまだインストールしていない最新のパッケージをすべてインストールする。詳しくはCRAN Task View Initiativeを参照してください。

この CRAN タスクビューには、公式統計や調査統計で一般的に使用される手法を持つパッケージのリストが含まれています。多くのパッケージは、以下にリストアップされたトピックのうち、1つ以上の関数を提供しています。したがって、このリストは厳密な分類ではなく、パッケージは複数回リストアップされる可能性があります。

タスクビューはいくつかのパーツに分かれています。

  • 第1部“Producing Official Statistics”
    • この第1部は、国家統計機関、国立銀行、国際機関などで、調査統計の手法を用いた公的統計の作成に携わっている方々を対象としています。
    • “Generic Statistical Business Process Model” と緩やかに整合しています。
  • 第2部“Access to Official Statistics”
    • この第2部の対象者は、公式統計の結果をR内から直接利用することに興味を持つすべての人です。
  • 第3部Related Methods”は、公的統計や調査統計において重要であるが、公的統計の作成には直接的に適合しないパッケージを示す。
    • また、Miscellaneous”のサブセクションでは、公的統計と緩やかにリンクしているパッケージや、公的統計や調査方法を限定的に補完するパッケージが集められており、補完的な内容となっています。

第1部 公的統計の作成

1 準備・運営・企画(アンケート設計など)

  • questionrは、アンケートの処理と分析を容易にするための関数群を含んでいます。データ再コード化、分割表、データセットメタデータの処理、およびいくつかの便利な機能のためのインタラクティブなshinyアプリとアドインを提供します。
  • surveydataは、アンケートのメタデータを簡単に記録し、特定の質問で簡単に列を抽出することができます。
  • blaiseは、Blaiseフォーマット(オランダ統計局)のファイルを読み書きするための関数を実装しています。

2 サンプリング

  • samplingは、調査標本の抽出と設計重量の校正のための多くの異なるアルゴリズム(Brewer、Midzuno、pps、系統的、Sampford、キューブ法によるバランス(クラスタまたは層別)サンプリングなど)が含まれています。
  • ppsは、ppsサンプリングによる標本抽出のための関数が含まれています。また、層化単純無作為抽出やSampfordのppsサンプリング法における結合包含確率を計算することも可能です。
  • BalancedSamplingは、多次元空間において、任意の規定の包含確率で、バランスのとれた、空間的にバランスのとれた確率標本を選択するための関数を提供します。また、ローカルピボット法、キューブ法、ローカルキューブ法、その他いくつかの方法が含まれています。
  • PracToolsは、層別またはクラスタ化された1段、2段、3段の標本計画を用いた調査標本のサンプルサイズ計算関数、多段計画の分散成分計算関数、2段計画におけるサンプルサイズ計算関数が含まれています。
  • surveyplanningは、サンプルサイズの計算、総計の推定値の期待精度の推定、最適なサンプルサイズ配分の計算など、サンプル調査の計画を立てるためのツールが含まれています。
  • stratificationは、Lavallee-Hidiroglou法を一般化したもので、調査母集団の一変量層別を可能にします。
  • SamplingStrataは、多変量・多領域の設定において、サンプリングフレームの最適な層別を選択するためのアプローチを提供します。 各層における対象変数の分布を評価するために、サンプリングフレームの情報、または同じ調査の過去のラウンドのデータを使用することができます。
  • R2BEATは、1段および2段の層別サンプリングデザインに対する多変量、ドメイン固有の最適サンプルサイズ配分(すなわち、NeymanとTchuprowの配分方法の複数変数の場合への一般化)のための関数を提供します。

3 データ収集(レコードリンケージを含む)

3.1 データの統合(統計的マッチングとレコードリンケージ)

  • StatMatchは、多くの共通変数を共有する2つのデータソース間で統計的マッチングを行うための関数を提供します。尤度法またはホットデッキによる2つのデータソースのマッチングの後、合成データセットを作成します。
  • MatchItは、近傍マッチング、完全マッチング、最適マッチング、完全マッチングなどのマッチング方式が利用できます。2つのデータセットをマッチングする場合、データは各オブザベーションのメンバーシップに関する情報を含むファクター変数を含む1つのデータフレームとして提供される必要があります。
  • MatchThemは、交絡因子の影響を制御するために、多重インピュテーションされたデータセットのマッチングと重み付けを行うツールを提供します。マウスとアメリアの多重インプットデータファイルを直接利用することができます。
  • stringdistは、編集に基づく様々な文字列距離(damerau-levenshtein, hamming, levenshtein, optimal sting alignment)、qgram(q-gram, cosine, jaccard distance)、ヒューリスティックメトリクス(jaro, jaro-winkler)を計算することができます。
  • XBRLは、XBRL文書から企業の財務情報を抽出することができます。
  • RecordLinkageは、レコード連結のためのFellegi-Sunterメソッドを実装しています。
  • fastLinkは、Fellegi-Sunter 確率的レコードリンクモデルを実装しており、欠損データや 補助情報の包含を許容します。ドキュメントは、http://imai.princeton.edu/research/linkage.html に掲載されています。
  • fuzzyjoinは、完全一致あるいは類似の一致に基づいてテーブルを結合する機能を提供します。不正確なキーに基づいたレコードのマッチングを可能にします。
  • PPRLは、プライバシーを保護したレコードリンケージを実装しており、特に個人IDを使用して2つのデータセットをリンクできない場合に有効です。この手法により、個人のアイデンティティを保護することができます。
  • reclin2は、確率的レコード連結と重複排除の実行を支援する関数を提供します。
  • klshは、k-means による局所性を考慮したハッシングを使ったレコードの(レコード連結のための)ブロッキングを提供します。
  • representrは、エンティティ解決/レコードリンケージ実行後に代表レコードを作成するツールを提供します。
  • clevrは、リンク予測およびクラスタリングアルゴリズムをグランドトゥルースに関して評価するためのツールを提供します。

3.2 ウェブスクレイピング

ウェブスクレイピングは、最近では公的統計の作成に頻繁に利用されている。例えば、物価統計では、従来はWeb上で手書きしたり、直接店舗を訪問したりして収集していた商品価格を、特定のホームページをスクレイピングすることで代替している。このプロセスのステップのためのツールはここではリストアップされていませんが、詳細な概要はWebTechnologiesのCRANタスクビューで見ることができます。

4 データ処理

4.1 重み付けとキャリブレーション

  • surveyは、層別後、一般化レーキング/キャリブレーション、GREG推定、重みのトリミングが可能です。
  • samplingは、層別サンプルの非反応(応答同質群あり)を校正する関数 calib()を提供します。
  • laekenは、キャリブレーション用に calibWeights()という関数を提供しており、samplingからの calib()よりも速いかもしれません(例によって)。
  • icarusは、調査サンプリングにおけるキャリブレーションと再重み付けに焦点を当て、INSEEが開発したSASマクロCalmarのユーザーに、Rで使い慣れた設定を提供するために設計されました。
  • CalibrateSSBは、無回答のパネルデータに対する重みと推定値を計算する関数が含まれています。
  • Frames2は、デュアルフレーム調査における点推定と区間推定が可能です。2つの確率サンプル(各フレームから1つずつ)が抽出される場合。収集された情報は、関心のあるパラメータの推定値を得るために適切に結合されます。
  • surveysdは、反復プロポーションフィッティングによる校正、複雑な測量に最適化された校正済みブートストラップ、それに基づく誤差推定を提供します。
  • incaは、整数の重みで校正重み付けを行います。
  • jointCalibは、合計と分量の合同校正を実行します。

4.2 編集(異常値検出を含む)

  • validateは、ルール管理とデータ検証を含みます。
    • validatetoolsは、検証ルールのセットをチェックし簡素化します。
  • errorlocateは、FellegiとHoltの原則に基づくエラーローカライズ機能を備えています。カテゴリや数値データ、線形等式、不等式、条件規則をサポートします。このパッケージには、MIPベースのエラーローカライゼーションのための設定可能なバックエンドが含まれています。
  • editrulesは、可読な線形(in)等式を行列形式に変換します。
  • deducorrectは、 editrulesに依存し、単純な丸め誤差、タイプミス、符号 誤差を balanced edits に基づいて演繹的に修正する機能を提供します。値は、与えられたバランス編集を満たすように変更されます。どの値を変更するかを決定するために、Levenstein-metricが適用されます。
  • deductiveは、演繹的手法によるデータ補正やインピュテーションが可能です。
  • rspaは、数値記録を(in)方程式の制約に従うように最小限の調整を行う関数を実装しています。
  • univOutlは、Hidiroglou-Berthelot法などの一変量外れ値を検出するための様々な方法が含まれています。
  • extremevaluesは、バルク分布のモデル化に基づいて一変量外れ値を検出するように設計されています。

4.3 インピュテーション

インピュテーション法の一般的な概要は、CRAN Task View on Missing Data、MissingDataに記載されています。しかしながら,これらの提示された方法のほとんどは、複雑なデザインからの調査の特異性、すなわち、公式統計や調査のために特別に設計されていない方法を考慮していません。例えば、公的統計では通常、連続変数、半連続変数、バイナリ変数、カテゴリ変数、カウント変数が混在しており、手法の適用基準はデータの規模に依存することが多くなります。また、測定誤差は非ロブストなインピュテーション手法に大きな影響を与える可能性があります。

統計機関でよく使われるパッケージはVIMsimputationで、一般的な距離に対する高速なk-nearest neighbor(kn)アルゴリズムと(ロバスト)EMベースの多重代入アルゴリズムが実装されています。

4.4 季節調整

季節調整は、公式統計を作成する上で重要なステップであり、非常に限られた方法論のセットが、例えば、米国国勢調査局が開発したX13-ARIMA-SEATSのように、ここで頻繁に使用されています。CRAN Task View TimeSeriesセクションのseasonal adjustmentで、このためのRパッケージが見つかります。

5 調査データの分析

5.1 推計と分散推計

  • surveyは、調査サンプルで動作します。複雑な調査デザイン(層別サンプリングデザイン、クラスター・サンプリング、多段サンプリング、置換あり/なしのppsサンプリング)を指定することができます。与えられた調査計画がsvydesign()の中で指定されると、点推定値と分散推定値を計算することができます。得られたオブジェクトは、ドメインまたは調査サンプル全体の(Horvitz-Thompson)合計、平均、比率、分位数を推定し、回帰モデルを適用するために使用することができます。平均、合計、比率の分散推定は、Taylor線形化、リサンプリング(BRR、ジャックカイフ、ブートストラップ、ユーザー定義)のいずれかによって行うことができます。
  • robsurveyは、有限母集団の特性(平均、合計、比率、回帰など)について、重み付け、トリミング、winsorization、M-推定を用いて,ロバストな(外れ値に強い)推定量を計算するための関数を提供します。本パッケージは、surveyを補完するものです。
  • surveysdは、複雑な測量(回転設計を含む)のための校正、ブートストラップ、誤差推定を提供します。
  • gustaveは、調査サンプリングにおける分析的分散推定のためのツールキットを提供します。
  • vardpoorは、いくつかの非線形母集団統計の線形化、究極のクラスタ法によるサンプル調査の分散推定、縦断・横断測定の分散推定、任意の段階のクラスタ・サンプリング設計の変化測定の計算を行うことができます。
  • rpmsは、データを再帰的に分割して得られた各ノードの調査データに線形モデルを当てはめます。このアルゴリズムは、層別とクラスタリングの1段階、および選択確率の不均等を考慮します。
  • collapseは、グループ化・重み付け統計や複数種類のデータ集約(平均、分散、統計モードなど)、時系列やパネルデータの高速(グループ化、重み付け)変換(スケーリング、センタリング、差異、成長率など)、複雑なマルチレベル/パネルデータに対する高速(グループ化、重み付け、パネル分解)要約統計に関する高度で計算効率の高い方法を実装しています。
  • srvyrは、dplyrパッケージの合成スタイル(パイプ処理、group_byやsummarizeなどの動詞)に触発されたものです。surveyのデザインオブジェクトの要約統計量を提供します。
  • weightsは、重み付きピアソン相関、偏相関、カイ二乗統計、ヒストグラム、t検定など、単純な重み付き統計量を作成するための様々な関数を提供します。
  • svrepは、surveyの拡張機能として、サーベイの複製重みを作成、更新、分析するためのツールを提供します。全標本および複製重みの両方に無回答調整を適用することができます。ブートストラップ反復重みは、層化された多段階標本や、系統的または不等確率サンプリングを使用して選択された標本など、さまざまなサンプリング・デザインに対して作成することができます。
  • NonProbEstは、非ランダム選択メカニズムによってもたらされる可能性のある選択バイアスを補正するためのさまざまな推論手順が含まれています。
  • nonprobsvyは、確率標本や母集団の合計値や平均値などの外部情報源から補助的な情報が得られる場合に、非確率標本を用いた統計的推論手法が含まれます。

5.2 可視化

  • VIMは、適切なプロット方法を用いて欠損値を可視化するために設計されています。指定された変数からの欠損値の情報が選択された変数でハイライトされる一変量、二変量、多変量、多変量プロットを使用してマイクロデータ内の欠損値の構造を分析するために使用することができます。また、グラフィカルユーザーインタフェースを備えています。
  • longCatEDAは、VIMのmatrixplotを拡張し、縦断的データにおける単調欠測をチェックするものです。
  • treemapは、トレマップを提供します。ツリーマップは、階層構造を持つデータの集合体を空間いっぱいに可視化したものです。色を使って、比較可能な集合体間の差異を強調することができます。
  • tmapは、レイヤーベースで、チョロプスやバブルマップのようなテーママップを作成することができます。
  • rworldmapは、国別参照データのマッピング方法を概説し、ユーザが自身のデータを視覚化することをサポートします。例として、世界銀行や国連の地図が挙げられています。また、地図を可視化する新しい方法を提供します。

6 統計的情報開示統制

統計機関などのデータは、生の状態ではほとんど機密であり、データ提供者は、統計単位が再識別できないように元のデータを修正すると同時に、最小限の情報損失を保証することによって機密性を確保しなければなりません。

ユニットレベルデータ(マイクロデータ)

  • sdcMicroは、データの匿名化、すなわち公共および科学的利用のための匿名化ファイルを作成するために使用できます。このパッケージには、カテゴリ変数や連続変数(キー)を匿名化するための幅広いメソッドが実装されています。このパッケージにはグラフィカルユーザーインタフェースも含まれており、関数 sdcGUI を呼び出すことで利用できます。
  • simPopは、線形回帰法、ロバスト回帰法、ランダムフォレスト法(その他多くの方法)を用いて、与えられた複雑なデータから合成データをシミュレートします。また、データが階層構造やクラスタ情報(世帯人数など)を持っている場合や、複雑なサンプリングデザインで収集されたデータの合成に適しています。また、内部で並列計算を行うことができます。
  • synthpopは、回帰木の手法を用いて、与えられたデータから合成データをシミュレートします。世帯のような階層性やクラスタ情報を持たないデータや、複雑なサンプリングデザインで収集されたデータでない場合に、合成データを作成するのに適しています。

集計された情報(表形式データ)

  • sdcTableは、機密性の高い(階層的な)表形式データを提供するために使用することができます。HITASとHYPERCUBE技術を含み、(大量の)線形プログラムを解くために線形計画パッケージ(RglpkとlpSolveAPI)を使用します。
  • sdcSpatialは、地図上のラスターセルを滑らかにしたり、抑制したりするために使用することができます。これは、ラスターベースのカウントを地図上にプロットするときに便利です。
  • sdcHierarchiesは、統計的開示統制手法の入力を定義する際によく使われる入れ子構造の階層を生成、変更、インポート、変換するメソッドを提供します。
  • SmallCountRoundingは、頻度表を保護するために必要な内部セルを丸め、公開されるクロスクラスが安全になるようにするために使用されます。
  • GaussSuppressionは、ガウス消去二次抑制アルゴリズムを使用した抑制によってテーブルを保護するために使用することができます。

リモートアクセス

  • DSIは、DataShieldへのインタフェースです。DataShieldは、機密性の高い研究データを遠隔地から非開示で分析することを可能にするインフラと一連のRパッケージです。

第2部: 公式統計へのアクセス

国際機関や複数機関のデータへのアクセス

  • OECDは、OECDのデータを検索・抽出したものです。
  • Rilostatは、international labour organisation databaseからデータをダウンロードするためのツール、および検索と操作のユーティリティを含んでいます。また、SDMX形式のデータベースからilostatのデータをインポートすることもできます。
  • eurostatは、欧州連合の統計機関であるEurostatのデータを検索し、アクセスすることができます。
  • ipumsrは、IPUMSが提供する国勢調査、測量、地理データを簡単にインポートする方法を提供します。
  • FAOSTATは、国連食糧農業機関(FAO)のFAOSTATデータベースからデータをダウンロードするために使用することができます。
  • pxweb は、多くの国家統計機関で使用されている PX-Web/PC-Axis API の汎用インタフェースを提供します。
  • PxWebApiDataは、ノルウェー統計局、スウェーデン統計局、フィンランド統計局などへ簡単にAPIアクセスできます。
  • rdhsは、人口保健調査(DHS)プログラムのデータセットと相互作用します。
  • prevRは、人口動態調査からデータを取り込むための関数(dhs()を参照)を実装しています。
  • rsdmxは、SDMXのWebサービスをサポートしている統計機関のデータに簡単にアクセスすることができます。このパッケージには、国内外の様々な統計機関のSDMXアクセスポイントのリストが含まれています。
  • readsdmxは、ローカルのSDMX-MLファイルやWebサービスからSDMXをデータフレームに読み込むための関数を実装しています。OECDによるものです。
  • regionsは、ヨーロッパのデータに焦点を当てた地域統計の処理ツールを提供します。
  • statcodelistsは、国際的に標準化された SDMX コードリストを R ユーザーが利用できるようにするものです。
  • rdbnomicsは、INSEE、Eurostat、Wolrd bank など、38 の公式プロバイダが提供するマクロ経済データに関するnomics データベースへのアクセスを提供します。
  • iotablesは、産業連関表を整頓し、Eurostatデータウェアハウスから受け取ったデータを、適切で検証済みのマトリックス形式にフォーマットすることで、経済および環境影響分析を可能にします。
  • npiは、ヘルスケア領域におけるNational Provider Identifierレコードの権威あるデータソースであるS. National Provider Identifier RegistryのAPIへのアクセスを提供するものです。
  • WDIは、世界銀行が収集した世界開発指標のAPIへのアクセスを提供します。
  • refugeesは、国連難民高等弁務官事務所(UNHCR)が公表しているRefugee Population Statistics Databaseのデータを含んでいます。

国内機関のデータへのアクセス

  • tidyqwiは、米国国勢調査局の四半期労働力指標にアクセスするためのapiを提供します。
  • tidyBdEは、スペインの銀行当局Banco de Espanaが提供する公式統計へのアクセスを提供します。
  • cancensusは、カナダ統計局の国勢調査データにアクセスし、すべてのデータを空間データとして取得するオプションを提供します。
  • sorviは、フィンランドのオープンガバメントデータへのアクセスを提供します。
  • inseeは、InseeのBDMデータベースからデータを検索・抽出します。
  • acsは、米国コミュニティ調査および米国国勢調査の10年ごとのデータをダウンロードし、操作し、表示することができます。
  • censusapiは、国勢調査データおよびメタデータのデータフレームを返す米国国勢調査局 API のラッパーを実装しています。
  • idbrは、US Census Bureau の International Data Base API にリクエストを行うための関数を実装しています。
  • tidycensusは、10年ごとの米国国勢調査および米国地域調査のAPIと、米国国勢調査局の地理的境界ファイルへの統合されたRのインタフェースを提供します。
  • inegiRは、メキシコの公的統計機関であるINEGIが発表するデータにアクセスすることができます。
  • cbsodataRは、オランダ統計局(CBS)のオープンデータAPIへのアクセスを提供します。
  • EdSurveyは、NCESの教育調査および評価データの分析が含まれています。
  • nomisrは、国勢調査や労働力調査などのNomis英国労働市場データにアクセスすることができます。
  • readabsは、オーストラリア統計局から時系列データをダウンロードし、整頓するための関数を実装しています。
  • BIFIEsurveyは、教育評価における調査統計のためのツールが含まれており、(ブートストラップなどによる)再現重みのあるデータも含まれています。
  • CANSIM2Rは、CANSIM(カナダ統計局)の表を抽出し、容易に利用可能なデータに変換する機能を提供します。
  • statcanRは、Statistics CanadaのWeb Data ServiceへのRによる接続を提供します。オープンな経済データ(旧CANSIMテーブル)をR環境のデータフレームとしてアクセスできます。
  • cdlToolsは、指定した州の USDA National Agricultural Statistics Service (NASS) cropscape データをダウンロードする機能を提供します。
  • csodataは、アイルランドの中央統計局(CSO)からデータをダウンロードするための機能を提供します。

第3部 関連メソッド

小面積推定

  • saeは、小面積推定(基本的な面積・単位レベルモデル、空間・時間相関を持つFay-Herriotモデル)のための関数、例えば、直接推定量、経験的最良予測量、複合推定量などを提供します。
  • rsaeは、基本的な単位レベル小面積推定(SAE)モデル(別名,入れ子誤差回帰モデル)のパラメータを,最尤推定(ML)またはロバストM推定によって推定する機能を提供します。推定されたパラメータに基づいて、地域別平均のロバストな予測値が計算されます(MSE推定値を含む;パラメトリックブートストラップ)。
  • emdiは、地域細分化された指標の推定、評価、マッピングを支援する機能を提供します。これまでのところ,推定方法は,直接推定,モデルベースのユニットレベルアプローチEmpirical Best Prediction、エリアレベルモデルとその様々な拡張、およびそれらの精度推定から構成されています。使用したモデルの評価は,要約と診断プロットによってサポートされています。推定値を適切に表示するために、地図プロットを簡単に作成し、エクスポートすることができます。
  • hbsaeは、基本的な面積またはユニットレベルのモデルに基づいて、小面積の推定値を計算する関数を提供します。モデルは制限付き最尤法、または階層的ベイズ法を用いて適合させます。補助的な情報としては、カテゴリ変数から得られるカウント、または連続的な母集団情報から得られる平均のいずれかを使用することができます。
  • SAEvalは、小面積推定量を評価するための診断とグラフィックツールを提供します。
  • mindは、DattaとDay、Basawa (1999, J. Stat. Plan. Inference)で提案された混合線形モデルによるドメインの多変量予測・推論(平均二乗誤差)を提供します。
  • JoSAEは、一般化回帰(GREG)の点推定と分散推定を提供し、単位レベルの経験的最良線形不偏予測 EBLUP 推定器をドメインレベルで作成することができます。基本的には、基本的なランダム効果モデルの適合に使用されるnlmeのラッパー関数を提供します。
  • SUMMER:調査データを用いた人口統計学的指標と健康指標の空間的・時空間的平滑化のための小面積推定単位と面積モデル、手法を提供します。

マイクロシミュレーション

  • simPopは、マイクロシミュレーションの開始母集団として必要な合成母集団データを作成することができます。
  • smsは、与えられたエリアベースのマクロデータからミクロデータをシミュレートする機能を提供します。シミュレーテッドアニーリングは、ある領域の利用可能な記述を最もよく満たすように使用されます。計算量の問題から、計算を並列モードで実行することができます。
  • saeSimは、小面積推定に関連するデータのシミュレーションを行うためのツールを実装しています。
  • SimSurveyは、内蔵またはユーザー定義のサンプリングプロトコルで、年齢構成の時空間人口をシミュレートします。

インデックス、指標、表、指標の可視化

  • laekenは、一般的な貧困リスクや不平等指標(貧困リスク率、五分位階級シェア率、相対的中央値貧困リスクギャップ、ジニ係数)を推定する関数を提供します。さらに、所得変数のような連続一変量分布から指標をセミパラメトリックに推定するために、パレート分布の末尾モデル化のための標準的でロバストな方法が提供されています。
  • conveyは、ジニ係数、アトキンソン指数、貧困リスク閾値など、surveyで作成されたおなじみの線形化および複製ベースのデザインを使って、所得集中や貧困の指標に関する分散を推定するものです。
  • ineqは、様々な不平等指標(Gini、Theil、entropyなど)、集中度指標(Herfindahl、Rosenbluth)、貧困指標(Wats、Sen、SST、Foster)などを計算します。また、経験的および理論的なローレンツ曲線やペンのパレードを計算し、描画することができます。サンプリング重みを直接扱うようには設計されていません(これらはrep(x, weights)を介してのみエミュレート可能です)。
  • wINEQは、ineqの隙間を埋め、直接サンプリングウェイトを可能にします。Fini, Theil, Leti index, Palma ratio, 20:20 ratio, Allison and Foster index, Jenkins index, Cowell and Flechaire index など、様々な不等式指標を収録しています。
  • ratesは、人口保健調査(DHS)データの主要指標(特に出生率)とそのばらつきを推定します。
  • micEconIndexは、価格指数(Paasche、Fisher、Laspeyres 型)を計算する関数を実装しています; priceIndex() を参照してください。(例えば、商品の)数量の推定については、関数 quantityIndex()を参照してください。

その他

  • samplingbookは、Goeran Kauermann and Helmut Kuechenhoff (2010)による書籍「 Methoden und praktische Umsetzung mit R」からサンプリング手順が含まれています。
  • SDaAは、Lohr, S. (1999)による「Sampling: Design and Analysis, Duxbury」の結果を再現するように設計されています。この書籍は、結果を再現するように設計されており、この本のデータセットが含まれています。
  • samplingVarEstは、1段または2段のデザインで不等確率の分散推定を行うジャックナイフ法を実装しています。
  • memiscは、調査データの管理、グラフィック、シミュレーションのためのツールが含まれています。
  • anesrakeは、アメリカ国政選挙研究の仕様に合わせた変数の選択とデータの重み付けを行うための包括的なシステムを提供します。
  • spsurveyは、等確率および不等確率(層別)サンプリングによる空間調査の設計と解析のための機能が含まれています。
  • FFDは、無病息災を証明するための調査において、牛群に生息する動物集団の最適なサンプルサイズを算出する機能を提供します。サンプルサイズの推定基準は、疾病の牛群レベルでのクラスタリングと不完全な診断テストを考慮し、2ステージデザインに基づいてサンプルを選択する。包含確率は推定に考慮されていません。このパッケージには、グラフィカルユーザーインタフェースも用意されています。
  • mipfpは、目標とするマージナルテーブルを与えて、n次元配列を校正するための多次元反復比例フィッティングを提供します。
  • MBHdesignは、調査地域内の(連続した)潜在的なサンプリング位置のセットから空間的にバランスの取れたデザインを提供します。
  • quantificationは、定性的な調査データを定量化するための様々な機能を提供します。カールソン・パーキン法、回帰法、バランス法、条件付期待値法などをサポートしています。
  • surveybootstrapは、複雑な調査データを使ってサンプリングのばらつきを推定するための、さまざまな種類のブートストラップを使用するためのツールが含まれています。
  • RRregは、社会的望ましさによる回答バイアスを排除するための調査手法である無作為化回答法のいくつかのバリエーションについて、一変量および多変量解析(相関、線形、ロジスティック回帰)を実装しています。
  • RRTCSは、複雑な調査に対する無作為化回答技術を搭載しています。
  • panelaggregationは、景気動向調査データ(およびその他の定性調査)を様々な集計レベルで時系列に集計します。
  • rtrimは、モニタリングデータの傾向や指標を調べるための関数を実装しています。また、欠損データの発生を含め、サイトカウントに基づく動物・植物個体数の推定を行うツールを提供します。
  • rjstatは、JSON-stat 形式のデータセットを読み書きします。
  • diffprivは、差分プライバシーを持つ統計の摂動を実装しています。
  • easySdcTableは、sdcTableの機能のごく一部に対するグラフィカルなインタフェースを提供します。
  • MicSimは、マイクロシミュレーションのためのメソッドが含まれています。初期人口が与えられたとき、死亡率、離婚率、結婚率、教育水準の変化等とその推移行列を定義し、人口の将来の状態をシミュレーションするために含めることができます。このパッケージにはコンパイルされたコードは含まれていませんが、マイクロシミュレーションを並列に実行するための機能が提供されています。
  • singleRcaptureは、単一の捕獲-再捕獲法を用いて、到達困難な個体群の個体数を推定する方法を提供します。

 

R言語 CRAN Task View:政府統計&調査の方法

R言語 CRAN Task View:政府統計&調査の方法」への1件のフィードバック

コメントは受け付けていません。