オブジェクトとは
Rでは、数字や文字列、関数などをオブジェクトという単位で利用します。では、どのように利用するのでしょうか。具体的に見ていきます。
下記は、RStudioで記載したコードです。
# 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です # 100という数値を示すxというオブジェクトをつくる x <- 100 X # 大文字を小文字を認識するためエラーとなる x # xというオブジェクトの中身を表示する
上記の「x <- 100」という箇所で、100という数値を示すxという名前のオブジェクトを作成するという処理をしています。ここで、オブジェクトは100という数値です。今回は数値ですが文字列でも関数で何でもオブジェクトという単位になり得ます。ちなみに、「<-」は代入演算子と呼びます。
上記のコードを実行すると、コンソール画面に下記の結果が表示されます。
> # 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です > > # 100という数値を示すxというオブジェクトをつくる > x <- 100 > > X # 大文字を小文字を認識するためエラーとなる Error: object 'X' not found > > x # xというオブジェクトの中身を表示する [1] 100 >
Rでは小文字と大文字を識別します。そのため、オブジェクト名が小文字のxであるにも関わらず、大文字のXで呼び出そうとするとエラーとなります。
関数とは
次に関数についても見ていきます。Rにおける関数とは、()の要素を対象に何らかの処理をおこなうオブジェクトです。下記では、カッコ内の要素を合計する関数を例に挙げます。ちなみに、カッコ内の1:3は、1~3までの数字という意味です。
> sum(1:3) # 1~3までの数値を合計する [1] 6 >
下記のように、合計の結果を示すオブジェクトに名前を付けることも可能です。
> s <- sum(1:3) # 1~3までの数値を合計する > > s [1] 6
このようにRではいろんなオブジェクトがあり、それに名前を付けることができます。今回は、適当な名前を付けていますがそのオブジェクトの内容に合った名前を付けると大変分かりやすくなります。ただ、適切なオブジェクト名を付けようとすると結構悩みますね(笑)。
以下では、Rでよく使われる関数について列挙します。Rを使っていれば自然と覚えるものなので暗記する必要はないですが、どんなものがあるかだけ知っておくと後で役立つと思います。
基本関数 | 機能 |
colnames | データフレームや行列の列名を確認 |
rownames | データフレームや行列の列名を確認 |
setwd | 作業フォルダを変更 例:setwd(“C:/user”) |
getwd | 現在の作業フォルダを確認 |
ls | 作業フォルダのオブジェクトを確認 |
file.show | ファイルの中身を確認 例:file.show(“C:/user/data.csv”) |
head | データの先頭6行を表示 |
tail | データの最後6行を表示 |
length | ベクトルの要素を表示 |
names | ベクトルの名前を表示 |
nrow | データフレームや行列の行数を表示 |
ncol | データフレームや行列の列数を表示 |
library | パッケージを読み込む |
help | ヘルプを表示 例:help(sum)又は ?sum |
統計関数 | 機能 |
sum | 合計 |
mean | 算術平均 |
max | 最大値 |
min | 最小値 |
range | 範囲(最大値-最小値) |
median | 中央値 |
var | 普遍分散 |
sd | 標準偏差 |
quantile | 四分位点 |
IQR | 四分位範囲 |
summary | 統計要約量(最小値、第 1 四分位点、中央値、平均、第 3 四分位点、最大値が表示される) |
数学関数 | 機能 |
sqrt | 平方根 |
abs | 絶対値 |
round | 値の丸め |
floor | 値の切り捨て |
ceiling | 値の切り上げ |
log | 底をeとする対数(自然対数) |
log10 | 底を10とする対数 |
log2 | 底を2とする対数 |
log1p | 1を加算した結果の自然対数 |
exp | 指数関数 |
sin, cos, tan | 三角関数 |
asin, acos, atan | 三角関数の逆関数 |