【Rその1】Rとは何か

Rとは何か?

 

一言で言えば、大規模データ処理にも対応した無料の統計解析ソフトです。

最近では、Pythonにシェアを奪われつつありますが、高度な解析や大規模データの処理が極めて簡単にできるため、様々な学術研究や億単位のレコードを処理するデータ解析にも利用されています。実際、私も大学で研究員をしていた頃は実験結果のデータ処理や解析、民間企業に転職してからはサイト訪問ログやリアルの行動データの解析などに利用してきました。

Rの特筆すべき点のひとつは、dplyrという大規模データを処理できるパッケージが存在することです。これにより、PCの処理能力に依存しますが、億単位のデータでも高速に処理することができます。昨今、エンジニアやデータサイエンティストでなくてもサイトの訪問ログやGPSの位置情報などのようなエクセルでは到底処理できない大規模データを扱う機会が増えつつあります。Rでは、そうしたデータをプログラミングの知識がほとんどなくても驚くほど簡単に、そして、高速に処理することが可能です。例えば、エクセルで数時間かかっていたデータ処理や分析を数秒で終えることも普通にできます。ぜひ、Rを使って仕事を楽にしましょう。

  • フリーで使える統計解析ソフト
  • インストールするだけですぐに使える
  • 高度で大変使いやすいエディタ(RStudio)がある
  • ユーザによる機能拡張が可能
  • 統計解析の関数が豊富
  • Rの開発プロジェクトは1992年から始まる
  • Rの開発プロジェクト:https://www.r-project.org/

Rでできること

  • データの整形、解析、可視化が容易にできる
  • 様々なパッケージ*をインストールすることで大規模データの解析にも対応
  • SQLでできるようなデータ整形処理(外部結合など)も可能

*パッケージとは、特定の解析や可視化などの実現に特化したRのプログラムをまとめたファイルの集合体です。Rのメニューや関数を使ってダウンロードすることができます。

Rのインストール

  1. Rをダウンロードしてインストール(https://cran.r-project.org/
  2. R Studioをダウンロードしてインストール(https://rstudio.com/

R StudioをインストールしなくてもRは使えますが、R Studioがあれば編集やファイル操作などが圧倒的に楽になります。一旦、R Studioを使い始めると、Rだけで作業するのが苦痛に感じるくらいです(笑)

Rのインストール参考サイト

次はオブジェクトについて理解しましょう。

タイトルとURLをコピーしました