Rとは何か?
一言で言えば、大規模データ処理にも対応した無料の統計解析ソフトです。
最近では、Pythonにシェアを奪われつつありますが、高度な解析や大規模データの処理が極めて簡単にできるため、様々な学術研究や億単位のレコードを処理するデータ解析にも利用されています。実際、私も大学で研究員をしていた頃は実験結果のデータ処理や解析、民間企業に転職してからはサイト訪問ログやリアルの行動データの解析などに利用してきました。
Rの特筆すべき点のひとつは、dplyrという大規模データを処理できるパッケージが存在することです。これにより、PCの処理能力に依存しますが、億単位のデータでも高速に処理することができます。昨今、エンジニアやデータサイエンティストでなくてもサイトの訪問ログやGPSの位置情報などのようなエクセルでは到底処理できない大規模データを扱う機会が増えつつあります。Rでは、そうしたデータをプログラミングの知識がほとんどなくても驚くほど簡単に、そして、高速に処理することが可能です。例えば、エクセルで数時間かかっていたデータ処理や分析を数秒で終えることも普通にできます。ぜひ、Rを使って仕事を楽にしましょう。
- フリーで使える統計解析ソフト
- インストールするだけですぐに使える
- 高度で大変使いやすいエディタ(RStudio)がある
- ユーザによる機能拡張が可能
- 統計解析の関数が豊富
- Rの開発プロジェクトは1992年から始まる
- Rの開発プロジェクト:https://www.r-project.org/
Rでできること
- データの整形、解析、可視化が容易にできる
- 様々なパッケージ*をインストールすることで大規模データの解析にも対応
- SQLでできるようなデータ整形処理(外部結合など)も可能
*パッケージとは、特定の解析や可視化などの実現に特化したRのプログラムをまとめたファイルの集合体です。Rのメニューや関数を使ってダウンロードすることができます。
Rのインストール
- Rをダウンロードしてインストール(https://cran.r-project.org/)
- R Studioをダウンロードしてインストール(https://rstudio.com/)
R StudioをインストールしなくてもRは使えますが、R Studioがあれば編集やファイル操作などが圧倒的に楽になります。一旦、R Studioを使い始めると、Rだけで作業するのが苦痛に感じるくらいです(笑)
Rのインストール参考サイト