R言語で、2つの文字列が同じが判定する方法について解説します。文字列の操作には、tidyverseパッケージに含まれているstringrパッケージを使用するのが便利です。ここでは、stringrパッケージのstr_equal()を使用した方法についてお伝えします。
str_equal()の概要
str_equal()は、2つの文字列が同じが判定するための関数です。str_equal()は、Unicode正規化ルールを使用し、オプションで大文字と小文字を無視します。
str_equal()の使い方
stringr::str_equal()の使い方は次になります。
str_equal(x, y, locale = "en", ignore_case = FALSE, ...)
str_equal()の引数の意味
x
文字ベクトルを指定します。
y
文字ベクトルを指定します。
locale = “en”
比較に使用するロケールを指定します。
すべての可能なオプションについては、stringi::stri_locale_list()を参照してください。デフォルトの動作がプラットフォーム間で一貫していることを保証するために、デフォルトは「en」(英語) になります。
ignore_case = FALSE
文字列を比較するときに大文字と小文字を無視するかどうかを指定します。
…
照合を制御するために使用されるその他のオプションです。stringi::stri_opts_collator()に渡されます。
準備
あらかじめ、tidyverseパッケージを読み込んでおきます。
library(tidyverse)
str_equal()の使用例
2つの文字列を比較するには次のようにします。
str_equal("あいうえお", "あいうえお")
[1] TRUE
str_equal("あいうえお", "かきくけこ")
[1] FALSE
R×stringr::str_equal 2つの文字列が同じが判定する