データ分析

【Rその2】最初の一歩。オブジェクトを理解する。

投稿日:2020年9月2日 更新日:

オブジェクトとは

Rでは、数字や文字列、関数などをオブジェクトという単位で利用します。では、どのように利用するのでしょうか。具体的に見ていきます。

下記は、RStudioで記載したコードです。

# 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です

# 100という数値を示すxというオブジェクトをつくる
x <- 100

X # 大文字を小文字を認識するためエラーとなる

x # xというオブジェクトの中身を表示する

上記の「x <- 100」という箇所で、100という数値を示すxという名前のオブジェクトを作成するという処理をしています。ここで、オブジェクトは100という数値です。今回は数値ですが文字列でも関数で何でもオブジェクトという単位になり得ます。ちなみに、「<-」は代入演算子と呼びます。

上記のコードを実行すると、コンソール画面に下記の結果が表示されます。

> # 「#」より後ろはコメントアウトを意味し、注釈などを付けることが可能です
> 
> # 100という数値を示すxというオブジェクトをつくる
> x <- 100 > 
> X # 大文字を小文字を認識するためエラーとなる
Error: object 'X' not found
> 
> x # xというオブジェクトの中身を表示する
[1] 100
> 

Rでは小文字と大文字を識別します。そのため、オブジェクト名が小文字のxであるにも関わらず、大文字のXで呼び出そうとするとエラーとなります。

関数とは

次に関数についても見ていきます。Rにおける関数とは、()の要素を対象に何らかの処理をおこなうオブジェクトです。下記では、カッコ内の要素を合計する関数を例に挙げます。ちなみに、カッコ内の1:3は、1~3までの数字という意味です。

> sum(1:3) # 1~3までの数値を合計する
[1] 6
>

下記のように、合計の結果を示すオブジェクトに名前を付けることも可能です。

> s <- sum(1:3) # 1~3までの数値を合計する > 
> s
[1] 6

このようにRではいろんなオブジェクトがあり、それに名前を付けることができます。今回は、適当な名前を付けていますがそのオブジェクトの内容に合った名前を付けると大変分かりやすくなります。ただ、適切なオブジェクト名を付けようとすると結構悩みますね(笑)。

以下では、Rでよく使われる関数について列挙します。Rを使っていれば自然と覚えるものなので暗記する必要はないですが、どんなものがあるかだけ知っておくと後で役立つと思います。

基本関数機能
colnamesデータフレームや行列の列名を確認
rownamesデータフレームや行列の列名を確認
setwd作業フォルダを変更 例:setwd(“C:/user”)
getwd現在の作業フォルダを確認
ls作業フォルダのオブジェクトを確認
file.showファイルの中身を確認 例:file.show(“C:/user/data.csv”)
headデータの先頭6行を表示
tailデータの最後6行を表示
lengthベクトルの要素を表示
namesベクトルの名前を表示
nrowデータフレームや行列の行数を表示
ncolデータフレームや行列の列数を表示
libraryパッケージを読み込む
helpヘルプを表示 例:help(sum)又は ?sum
統計関数機能
sum合計
mean算術平均
max最大値
min最小値
range範囲(最大値-最小値)
median中央値
var普遍分散
sd標準偏差
quantile四分位点
IQR四分位範囲
summary統計要約量(最小値、第 1 四分位点、中央値、平均、第 3 四分位点、最大値が表示される)
数学関数機能
sqrt平方根
abs絶対値
round値の丸め
floor値の切り捨て
ceiling値の切り上げ
log底をeとする対数(自然対数)
log10底を10とする対数
log2底を2とする対数
log1p1を加算した結果の自然対数
exp指数関数
sin, cos, tan三角関数
asin, acos, atan三角関数の逆関数

 

次回はオブジェクトのタイプについて理解しましょう。

-データ分析

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

【Rその4】ベクトルの作成と計算

ベクトルを一言で言うと、複数の値を要素として持つオブジェクトです。プログラミング言語を学んだ方であれば、配列と同じと考えてもらえば分かりやすいかもしれません。   Contents1 ベクト …

【BigQuery】CSVで出力すると時間区切り「T」がスペースになる問題

Contents1 時間区切りのTとは何か?2 CSVで出力すると時間区切りのTがスペースになる??3 スプレッドシートで出力して解決? 時間区切りのTとは何か? 例えば、下記の時間を見ると、 202 …

【BigQuery】連続する数字を日付にする

Contents1 連続する数字を日付にしたい2 日付の表記規則に整えて日付に変換する3 結果 連続する数字を日付にしたい 例えば、下記のような数字が入ったdというフィールドがあるとします。 2020 …

【Rその3】オブジェクトのタイプを理解する

前回、Rのはじめの一歩として、オブジェクトについて理解しました。今回は、オブジェクトのタイプについて説明します。   Contents1 オブジェクトのタイプとは?2 主なデータ型3 例 オ …

R 列名を変更する

【目的】 列名を変更する 【方法】 rename(df, after = before) 【補足】 library(dplyr)が必要   #テスト用データフレーム作成   v.x1 <- c( …

ブログ運営者:Arakazu(あらかず)

アニメ・マンガ、最新の芸能・スポーツネタが好きな、福岡県出身の30代男性です。

普段はスマホやiPadで、通勤途中やお風呂の中など、いろんなところで動画や電子書籍サービスを使い倒して遊んでます♪

イチオシは、バスケ漫画の異色作品「あひるの空」ですね!(アニメが2019年10月から放送されているので、再びハマっているんです)

最近盛り上がってきてる「Hulu(フールー)」などの動画配信サービスは、1か月間くらい無料で見放題、タダで楽しめるので、もうYouTubeいらないかもと思っています。

おもしろいアニメやマンガのネタバレや感想、

タダで使えて面白い動画配信サービスも紹介しているので、ぜひ楽しんでいってくださいね(^^♪