R言語で、因子水準(ファクターレベル)を匿名化する方法について解説します。因子の操作には、tidyverseパッケージに含まれているforcatsパッケージを使用するのが便利です。ここでは、forcatsパッケージのfct_anon()を使用した方法についてお伝えします。
fct_anon()の概要
fct_anon()は、因子水準を匿名化するための関数です。fct_anon()は、因子水準を任意の数値識別子に置き換えますが、因子水準の値も順序も保持されません。
fct_anon()の使い方
forcats::fct_anon()の使い方は次になります。
fct_anon(f, prefix = "")
fct_anon()の引数の意味
f
因子を指定します。
prefix = “”
ランダムラベルの前に挿入する文字プレフィックスを指定します。
準備
あらかじめ、tidyverseパッケージを読み込んでおきます。
library(tidyverse)
解説のために、次の因子を使用します。
F <- fct(letters[floor(runif(20, min = 1, max = 5))])
F
[1] b c a a c b d c c a d d d b c c c d b a
Levels: b c a d
因子水準を匿名化する
因子Fを匿名化するには次のようにします。
fct_anon(F)
[1] 3 2 4 4 2 3 1 2 2 4 1 1 1 3 2 2 2 1 3 4
Levels: 1 2 3 4
R×forcats::fct_anon 因子水準を匿名化する