R言語の代表的な外部パッケージであるtidyverseの概要をお伝えします。

tidyverseについて

tidyverseはデータサイエンス向けに設計されたRパッケージの集まりです。具体的には、次のパッケージが含まれているパッケージがtidyverseになります。

パッケージ 説明 チートシート
ggplot2 データ可視化 リンク
dplyr データ操作 リンク
tidyr データ整理 リンク
readr データ読み込みと書き込み リンク
purrr 関数型プログラミング リンク
tibble モダンなデータフレーム
stringr 文字列操作 リンク
forcats 因子操作 リンク
lubridate 日付・時刻 リンク

とても重要なこととして、これらのtidyverseに含まれているパッケージは、基礎となる設計哲学および文法、データ構造を共有しています。そのため、tidyverseを使用すると目的の動作を簡単に実現できるとともに、簡単に可読性の高いコードを作成できます。現在のR言語のプログラミング、特にパッケージ開発を除くデータサイエンス領域のプログラミングにおいては、tidyverseの使用は必須です。tidyverseは多くのパッケージの集まりであり、個々のパッケージには多くの関数が含まれているため、全体としては巨大な関数の集まりとなり、覚えることが多くなりますが、それだけの価値がtidyverseにはあります。少しずつでもいいので習得してみてください。

tidyverseのインストール

tidyverseのインストールはとても簡単で、次のコマンドを実行するだけです。


install.packages("tidyverse")

tidyverseはパッケージの集まりであるため、インストールの完了までにはやや時間がかかることにご注意ください。

Linux環境

Linux環境ではtidyverseのインストール中にLinuxライブラリがないためインストールを完了できない、というようなメッセージが表示されるときがあります。このようなときには、メッセージに記載されている通りに、Linuxライブラリをインストールしたうえで、再び「install.packages(“tidyverse”)」を実行してください。

tidyverseの使用

tidyverseを使用するのはとても簡単で、次のコマンドを実行するだけです。


library(tidyverse)

実行後、次のようなメッセージが表示されます。


── Attaching core tidyverse packages ───────────────tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ──────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package to force all conflicts to become errors

「Attaching core tidyverse packages」のところでは、読み込んだ実際のパッケージ名とそのバージョンが表示されます。「Conflicts」のところでは、関数名が複数あることにより衝突を起こしている関数が表示されます。上記では、filter()がtidyverseに含まれているdplyrパッケージとRに標準で含まれているstatsパッケージにあり、普通にfilter()を使用するとdplyrパッケージのfilter()を使用することを表しています。statsパッケージのfilter()を使用したいときにはstats::filter()と記載します。

チートシート

tidyverseには多くのパッケージが含まれており、個々のパッケージには多くの関数が含まれています。そのため、全体を把握することが難しく、また、あまり使用しない関数を思い出すのも大変です。そこで、機能が一覧で確認できるチートシートが役に立ちます。RStudioを使用していれば、HelpメニューからCheat Sheetsを選択することで、tidyverseに含まれているパッケージのチートシートをブラウザで確認できます。

HelpメニューのCheat Sheetsでは、tidyverseに含まれているすべてのパッケージのチートシートがないように見えますが、Browse Cheat Sheetsを選択し表示されたブラウザでtidyverseに含まれているほとんどのパッケージのチートシートが確認できます。また、上の表でも、直接確認できるようにしましたので活用していただければ幸いです。

R入門 tidyverseパッケージの概要