ํ๊ต์์ ๋ฐ์ดํฐ ๋ง์ด๋์ ๋ฐฐ์ฐ๋ฉด์, R ์ธ์ด์๋ ๋ฐฐ์ฐ๊ณ ์๋ค. ์๋กญ๊ฒ ์ธ์ด๋ฅผ ๋ฐฐ์ฐ๋ค ๋ณด๋ ์ด๋ ค์์ ๋๋ผ๊ณ ์์ด์ ๋ธ๋ก๊ทธ์ ์์ฑํ๋ฉด์ ๋ณต์ตํ๋ ์๊ฐ์ ๊ฐ์ ธ๋ณด๊ณ ์ ํ๋ค.
โจ R ์ด๋
R์ ํต๊ณ ๊ณ์ฐ๊ณผ ๊ทธ๋ํฝ์ ์ํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ด์ ์ํํธ์จ์ด ํ๊ฒฝ
์คํ์์ค๋ก ๋ฌด๋ฃ
๋ฐ์ดํฐ ๋ถ์๊ธฐ์ฉ์ผ๋ก, ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ํต๊ณ ๋ถ์์์ ์ฌ์ฉ
๋์๋ฌธ์ ๊ตฌ๋ถ
R์ ๊ทธํจํฝ ๊ธฐ๋ฅ์ผ๋ก ์ํ ๊ธฐํธ๋ฅผ ํฌํจํ ์ ์๋ ์ถํ๋ฌผ ์์ค์ ๊ทธ๋ํ๋ฅผ ์ ๊ณตํ์ฌ ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋๋ฐ ์ ์ฉํ๋ค.
โจ ๋ณ์
- ์ฐ์ ๋ณ์ (Continuous variable)
์ฐ์์ ์ด๋ฉฐ, ํฌ๊ธฐ๋ฅผ ๋ํ๋ธ๋ค.
= Numberic variable, quantitative variable (์์ ๋ณ์)
- ๋ฒ์ฃผ ๋ณ์ (Categorical variable)
๋์ ๋ถ๋ฅ (์ฌ์ฑ/๋จ์ฑ)
์ซ์ ํํ์ฌ๋, ์ฐ์ ํํ๋ก ๊ณ์ฐ ์๋ฏธ๊ฐ ์์
R์์ factor๋ก ๋ํ๋
= Nomical variable
โจ R ๋ช ๋ น์ด
1. ๋ณ์ ์ ์ธ
# ๋ณ์ ์ ์ธ
# a values์ number 2 ์ฝ์
a <- 2
b <- 2
a + b # 2 + 2 = 4
2. ๋ฒกํฐ ๋ณ์
a <- c(1, 2, 3)
b <- c(1, 3, 5)
a + b # ๊ฐ๋ฅ
b <- 2
a + b # ๊ฐ๋ฅ
# 1์์ ๋ถํฐ ๊ฐ์ ์ฐจ์ด๋ก 6๊น์ง ๋ค์ด๊ฐ๋ค. (1, 2, 3, 4, 5, 6)
d <- c(1:6)
a <- seq(1,6)
b <- seql(1, 6, by =2) # ๋ ์นธ ์ฉ ๋์์ง. 1, 3, 5
# numeric variable
a <- c(1, 2, 3)
# factor variable (categorical variable)
b <- factor(c(1, 2, 3, 4, 5))
c <- c("hi", "nice", "to", "meet", "you")
paste(c, collapse = " ,") # collapse
- paste(c, collapse = " ,") # collapse
3. ๋ณ์ ํ์ /factor ๊ตฌ์ฑ ๋ฒ์ฃผ ํ์ธ
# ๋ณ์ ํ์
ํ์ธ
a <- factor(c(1, 2, 3, 4, 5))
class(a) # factor
a <- 1
class(a) # numeric
# factor ๋ณ์ ๊ตฌ์ฑ ๋ฒ์ฃผ ํ์ธ
levels(a) # [1] "1" "2" "3" "4" "5"
4. ๋ณ์ ํ์ ๋ณํ
- as.numeric(x) : numeric ์ผ๋ก
- as.factor(x) : factor๋ก
- as.character(x) : charactor๋ก
- as.Date(x) : date๋ก
- as.data.frame(x) : data frame์ผ๋ก
- as.array(x) : ๋ฐฐ์ด๋ก
- as.matrix: ํ๋ ฌ๋ก
a <- factor(c(1, 2, 3, 4, 5))
class(a) # factor
a <- as.numeric(a) # factor -> numeric
class(a) # numeric
ํน์ ๋ฐ์ดํฐ ํ์ ํ์ธ ํจ์๋ฅผ ํตํด ํ์ธํ ์๋ ์๋ค.
- is.numeric(x)
- is.integer(x)
- is.double(x)
- is.character(x)
- is.logical(x)
- is.complex(x)
- is.null(x)
- is.na(x)
- is.infinite(x)
- is.finite(x)
'Programming Language > R' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(Data Preprocessing data) (0) | 2022.04.25 |
---|---|
R studio] ํ๊ฒฝ, ํ์ผ ์ฐฝ์ด ์ฌ๋ผ์ก์ ๋ (0) | 2022.04.25 |
R ๊ธฐ์ด ๋ช ๋ น์ด(qplot graph, ๋น๋ ํ, dplyr rename, ํ์ ๋ณ์, ifelse) (0) | 2022.04.08 |
R ๊ธฐ์ด ๋ช ๋ น์ด(excel, ggplot2, rm) (0) | 2022.04.08 |