R言語で、因子(ファクター)の因子水準の個数を数える方法について解説します。因子の操作には、tidyverseパッケージに含まれているforcatsパッケージを使用するのが便利です。ここでは、forcatsパッケージのfct_count()を使用した方法についてお伝えします。

fct_count()の概要

fct_count()は、因子内のエントリをカウントするための関数です。

fct_count()の使い方

forcats::fct_count()の使い方は次になります。


fct_count(f, sort = FALSE, prop = FALSE)

fct_count()の引数の意味

.f

因子または文字列ベクトルを指定します。

sort = FALSE

TRUEの場合、最も一般的な値が最上位に表示されるように結果を並べ替えます。

prop = FALSE

TRUEの場合、限界表の割合を計算します。

準備

あらかじめ、tidyverseパッケージを読み込んでおきます。


library(tidyverse)

解説のために、次の因子を使用します。


F <- fct(letters[floor(runif(20, min = 1, max = 5))])
F

 [1] b a b b b a d b a b d c a b a c c d a c
Levels: b a d c

因子水準の個数を数える

因子Fに対して、因子水準の個数を数えるには次のようにします。


fct_count(F)

  f         n
   
1 b         7
2 a         6
3 d         3
4 c         4
R×forcats::fct_count 因子水準の個数を数える